Concetti Chiave
MCCATCH는 차원 및 비차원 데이터에서 단일 및 비단일 마이크로클러스터를 효과적으로 탐지하고 점수화하는 새로운 알고리즘이다.
Sintesi
MCCATCH는 다음과 같은 특징을 가진다:
차원 및 비차원 데이터에서 작동할 수 있다.
단일 및 비단일 마이크로클러스터를 함께 점수화하여 순위를 매긴다.
마이크로클러스터 점수 산정을 위한 원칙적인 기준을 제시한다.
선형 시간 복잡도로 확장성이 뛰어나다.
사용자 개입 없이 자동으로 작동한다.
MCCATCH의 핵심 아이디어는 '오라클' 플롯을 활용하는 것이다. 이 플롯은 각 데이터 포인트의 1NN 거리와 그룹 1NN 거리를 나타낸다. 1NN 거리는 포인트와 가장 가까운 이웃 사이의 거리를, 그룹 1NN 거리는 포인트가 속한 잠재적 마이크로클러스터와 가장 가까운 이웃 사이의 거리를 나타낸다.
MCCATCH는 이 플롯을 활용하여 다음과 같은 과정을 거친다:
데이터 포인트의 1NN 거리와 그룹 1NN 거리를 계산하여 '오라클' 플롯을 구성한다.
플롯의 특성을 이용해 자동으로 이상치 탐지 임계값을 설정한다.
이상치 포인트들을 마이크로클러스터로 그룹화한다.
각 마이크로클러스터의 이상도 점수를 계산한다.
이를 통해 MCCATCH는 차원 및 비차원 데이터에서 단일 및 비단일 마이크로클러스터를 효과적으로 탐지하고 점수화할 수 있다.
Statistiche
마이크로클러스터의 크기가 데이터 전체의 10% 미만이다.
마이크로클러스터와 가장 가까운 정상 데이터 포인트 사이의 거리가 평균 1NN 거리의 2배 이상이다.
Citazioni
"MCCATCH는 차원 및 비차원 데이터에서 단일 및 비단일 마이크로클러스터를 효과적으로 탐지하고 점수화할 수 있다."
"MCCATCH의 핵심 아이디어는 '오라클' 플롯을 활용하는 것이다."