Core Concepts
마이크로서비스 기반 애플리케이션에서 예기치 않거나 바람직하지 않은 동작의 근본 원인을 식별하는 것이 중요한 과제이며, 이를 위해 표준화된 데이터셋이 필요하다.
Abstract
이 논문은 마이크로서비스 기반 애플리케이션의 성능 문제 근본 원인 분석을 위한 데이터셋을 소개한다. 이 데이터셋은 41개의 마이크로서비스 구성요소로 이루어진 분산 애플리케이션에서 수집된 지연 시간, 요청 수, 가용성 지표를 포함한다. 정상 운영 지표 외에도 68개의 주입된 성능 문제가 포함되어 있으며, 이는 시스템 전반에 걸쳐 지연 시간 증가와 가용성 감소를 유발한다. 이 데이터셋은 다양한 인과적/비인과적 근본 원인 분석 방법의 정확도를 평가하는 데 사용될 수 있다. 실험 결과, 기존 방법들이 이 데이터셋에서 좋은 성능을 보이지 않아, 이 데이터셋이 강건하고 데이터 효율적인 근본 원인 분석 방법 개발을 위한 중요한 자원이 될 것으로 기대된다.
Stats
"요청 수가 464에서 503 사이로 변동됩니다."
"지연 시간 평균이 200ms를 초과합니다."
"가용성이 95%에서 75%로 감소했습니다."
Quotes
"마이크로서비스 아키텍처에서 문제가 발생하면 수백 개의 지표를 살펴보고, 테라바이트 단위의 로그를 뒤지며, 다른 팀의 담당자들을 연락해야 하는 등 문제의 근본 원인을 찾기가 매우 어렵습니다."
"이 데이터셋은 근본 원인 분석 방법 개발을 가속화하고 편향된 보고를 방지하기 위해 마련되었습니다."