Core Concepts
Azure 코어 워크로드 인사이트의 시계열 데이터에서 고유하고 중요한 장애를 자동으로 식별하는 방법을 제안합니다.
Abstract
이 논문은 Azure 코어 워크로드 인사이트의 시계열 데이터에서 고유하고 중요한 장애를 자동으로 식별하는 방법을 제안합니다.
주요 내용은 다음과 같습니다:
Azure 코어 워크로드 인사이트 데이터의 구조와 특성을 설명합니다. 이 데이터에는 다양한 Azure 리소스의 메트릭, 차원, 차원 값 등이 포함되어 있습니다.
단계 1에서는 Microsoft의 Anomaly Detection as a Service (ADaaS)를 기반으로 한 향상된 모델을 제안합니다. 이 모델은 시계열 데이터의 특성을 고려하여 개선된 성능을 보입니다.
단계 2에서는 향상된 ADaaS 모델에 극단값 이론(Extreme Value Theory, EVT)을 추가로 적용하여 고유하고 중요한 장애를 식별합니다. EVT는 희귀 이벤트의 확률을 추정하는 데 사용됩니다.
제안된 방법론을 전기 소비 및 주가 변동성 데이터 세트에 적용하여 성능을 검증합니다. 이를 통해 제안 방법이 일반화될 수 있음을 보여줍니다.
제안 방법은 기존 최신 방법인 TFT와 DeepAR보다 고유하고 중요한 장애를 더 잘 식별합니다.
사용자 연구를 통해 제안 방법의 유효성을 검증하였으며, 실제 Azure 코어 워크로드 인사이트 데이터에 적용하여 우수한 성능을 보였습니다.
Stats
Azure 코어 워크로드 인사이트 데이터에는 152개의 고유한 리소스 유형, 62개의 고유한 메트릭, 33,647개의 고유한 차원 값이 포함되어 있습니다.
총 139,483,854개의 데이터 레코드가 수집되었습니다.
Quotes
"Azure 코어 워크로드 인사이트의 시계열 데이터에는 메트릭 이름, 리소스 지역, 차원 및 해당 차원 값과 관련된 장애 또는 이상치가 관찰됩니다."
"사용자가 쉽게 인식할 수 있는 5-20개의 이상치만 보고되어야 합니다."