이 연구는 기존 로그 파싱 기술을 보다 엄격하고 실용적인 환경에서 재평가하기 위해 수행되었다. 주요 내용은 다음과 같다:
Loghub-2.0이라는 새로운 대규모 로그 데이터셋을 구축하였다. Loghub-2.0은 기존 Loghub-2k 대비 로그 메시지 수가 약 1,900배, 로그 템플릿 수가 약 3배 증가하여 실제 운영 환경의 특성을 더 잘 반영한다.
로그 템플릿 빈도와 파라미터 수 분포 분석을 통해 Loghub-2.0이 Loghub-2k에 비해 더 불균형한 특성을 가지고 있음을 확인하였다.
15개의 최신 로그 파싱 기술을 Loghub-2.0에 적용하여 재평가하였다. 그 결과, 기존 Loghub-2k 대비 성능이 크게 저하되었으며, 특히 템플릿 수준 지표(FGA, FTA)에서 큰 감소를 보였다. 이는 기존 연구 결과가 실제 운영 환경에 적용하기 어려울 수 있음을 시사한다.
로그 템플릿의 빈도와 파라미터 수에 따른 세부 성능 분석을 수행하였다. 이를 통해 기존 로그 파싱 기술이 드물게 발생하는 로그 템플릿이나 파라미터가 많은 로그 템플릿을 처리하는 데 어려움을 겪는다는 것을 확인하였다.
이 연구 결과는 실제 운영 환경에서 로그 파싱 기술의 평가와 설계를 위한 중요한 통찰을 제공한다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Zhihan Jiang... kl. arxiv.org 03-26-2024
https://arxiv.org/pdf/2308.10828.pdfDybere Forespørgsler