이 연구는 기존 로그 파싱 기술을 보다 엄격하고 실용적인 환경에서 재평가하기 위해 수행되었다. 주요 내용은 다음과 같다:
Loghub-2.0이라는 새로운 대규모 로그 데이터셋을 구축하였다. Loghub-2.0은 기존 Loghub-2k 대비 로그 메시지 수가 약 1,900배, 로그 템플릿 수가 약 3배 증가하여 실제 운영 환경의 특성을 더 잘 반영한다.
로그 템플릿 빈도와 파라미터 수 분포 분석을 통해 Loghub-2.0이 Loghub-2k에 비해 더 불균형한 특성을 가지고 있음을 확인하였다.
15개의 최신 로그 파싱 기술을 Loghub-2.0에 적용하여 재평가하였다. 그 결과, 기존 Loghub-2k 대비 성능이 크게 저하되었으며, 특히 템플릿 수준 지표(FGA, FTA)에서 큰 감소를 보였다. 이는 기존 연구 결과가 실제 운영 환경에 적용하기 어려울 수 있음을 시사한다.
로그 템플릿의 빈도와 파라미터 수에 따른 세부 성능 분석을 수행하였다. 이를 통해 기존 로그 파싱 기술이 드물게 발생하는 로그 템플릿이나 파라미터가 많은 로그 템플릿을 처리하는 데 어려움을 겪는다는 것을 확인하였다.
이 연구 결과는 실제 운영 환경에서 로그 파싱 기술의 평가와 설계를 위한 중요한 통찰을 제공한다.
Naar een andere taal
vanuit de broninhoud
arxiv.org
Belangrijkste Inzichten Gedestilleerd Uit
by Zhihan Jiang... om arxiv.org 03-26-2024
https://arxiv.org/pdf/2308.10828.pdfDiepere vragen