핵심 개념
로그 데이터의 온라인 의미 기반 클러스터링을 통해 소프트웨어 결함의 생애 주기를 모니터링할 수 있는 새로운 방법을 제안한다.
초록
이 논문은 소프트웨어 유지 보수와 결함 식별에 필수적인 로그 분석 및 모니터링에 대해 다룬다. 특히 로그 데이터의 시간적 특성과 방대한 규모로 인해 발생하는 중요한 연구 과제인 "로그를 어떻게 요약하고 시간에 따라 모니터링할 수 있는가?"에 초점을 맞추고 있다.
이를 위해 다음과 같은 내용을 제안한다:
온라인 의미 기반 클러스터링 접근법: 로그 클러스터를 동적으로 업데이트하여 코드 오류 생애 주기 모니터링을 가능하게 한다.
시간 종속적 로그 클러스터 성능 평가 지표: 오류 식별, 대표 메시지 제공, 클러스터 변화 최소화 등 실제 운영 환경의 요구사항을 반영한다.
산업 데이터셋 실험 결과: 제안한 알고리즘이 기존 기법들보다 우수한 성능을 보인다. 또한 더 복잡한 의미 표현을 사용하면 성능이 더 향상된다.
이 연구는 시간 종속적 결함 데이터셋에 대한 탐색을 장려하고, 로그 기반 결함 탐지 시스템에 시간 정보를 통합하는 데 기여할 것으로 기대된다.
통계
모니터링되는 애플리케이션에서 하루에 약 100,000개의 로그가 생성되며, 이 중 약 1.5%가 오류 및 결함 관련 로그이다.
2개월 동안 수집된 오류 로그는 총 57,000개이다.
인용구
"로그 분석 및 모니터링은 소프트웨어 유지 보수와 결함 식별에 필수적인 부분이다."
"로그 데이터의 시간적 특성과 방대한 규모로 인해 '로그를 어떻게 요약하고 시간에 따라 모니터링할 수 있는가?'가 중요한 연구 과제이다."