Основные понятия
본 연구는 시계열 데이터의 이상치 탐지를 위해 오염된 학습 데이터와 이상치에 대한 정보 부족 문제를 해결하는 보정된 원-클래스 분류 모델을 제안한다.
Аннотация
본 연구는 시계열 데이터의 이상치 탐지를 위해 두 가지 핵심 문제를 해결하는 보정된 원-클래스 분류 모델 COUTA를 제안한다.
오염된 학습 데이터 문제:
학습 데이터에 이상치가 포함되어 있어 정상 데이터 모델링에 방해가 되는 문제
불확실성 기반 보정(UMC)을 통해 불확실한 예측에 대한 페널티를 적용하여 이상치의 영향을 줄임
이상치에 대한 정보 부족 문제:
이상치에 대한 정보가 없어 정상 데이터 모델링이 정확하지 않은 문제
원본 데이터 기반 가상 이상치 생성(NAC)을 통해 이상치 정보를 학습에 활용
이 두 가지 보정 방법을 통해 COUTA는 오염된 데이터에 강건하고 이상치 정보를 활용하여 더 정확한 정상 데이터 경계를 학습할 수 있다. 실험 결과 COUTA가 16개의 최신 경쟁 모델들을 크게 능가하는 성능을 보였다.
Статистика
시계열 데이터에서 이상치의 정도를 나타내는 지표는 정상 데이터 중심으로부터의 거리 ds와 ˜
ds의 합이다.
이 두 거리 값은 가우시안 분포의 평균과 분산을 나타내며, 불확실성을 반영한다.
Цитаты
"본 연구는 시계열 데이터의 이상치 탐지를 위해 두 가지 핵심 문제를 해결하는 보정된 원-클래스 분류 모델 COUTA를 제안한다."
"COUTA는 오염된 데이터에 강건하고 이상치 정보를 활용하여 더 정확한 정상 데이터 경계를 학습할 수 있다."