핵심 개념
비디오 특징 벡터를 정규 데이터의 확률 밀도 함수로 모델링하여 이상 탐지를 수행하는 방법을 제안한다. 다중 스케일의 노이즈 수준에서 로그 밀도 함수를 근사하고, 이를 가우시안 혼합 모델로 결합하여 최종 이상 점수를 산출한다.
초록
이 논문은 비디오 이상 탐지를 위한 새로운 접근법을 제안한다. 비디오에서 추출한 특징 벡터를 정규 데이터의 확률 분포를 따르는 랜덤 변수로 간주하고, 이 분포를 신경망으로 모델링한다. 이를 통해 테스트 비디오의 우도를 추정하고, 임계값을 적용하여 이상을 탐지할 수 있다.
논문의 핵심 내용은 다음과 같다:
- 노이즈가 주입된 데이터의 분포를 모델링하는 변형된 디노이징 스코어 매칭 방법을 제안한다. 이를 통해 노이즈가 주입된 데이터의 로그 밀도 함수를 근사한다.
- 다양한 노이즈 수준에서 로그 밀도 함수를 근사하고, 이를 가우시안 혼합 모델로 결합하여 최종 이상 점수를 산출한다. 이를 통해 특정 노이즈 수준을 선택할 필요가 없다.
- 로그 밀도 함수의 근사치에 대한 정규화 항을 도입하여, 노이즈 수준 간 모델의 정렬을 유도한다.
- 객체 중심 및 프레임 중심 접근법 모두에서 다양한 특징 벡터를 활용할 수 있다.
- 실험 결과, 제안 방법인 MULDE가 다양한 벤치마크 데이터셋에서 최신 기술 수준을 능가하는 성능을 보인다.
통계
비디오 특징 벡터 x와 노이즈가 주입된 특징 벡터 ̃x 사이의 관계: ̃x = x + σz, z ∼ N(0, I)
노이즈가 주입된 데이터의 분포 q(̃x)는 정규 데이터 분포 p(x)와 노이즈 분포 ρ(̃x|x)의 합성으로 표현됨: q(̃x) = ∫ ρ(̃x|x)p(x)dx
인용구
"우리는 비디오 특징 벡터를 정규 데이터의 확률 분포를 따르는 랜덤 변수로 간주하고, 이 분포를 신경망으로 모델링한다."
"우리는 노이즈가 주입된 데이터의 로그 밀도 함수를 근사하는 신경망을 학습하고, 이를 이용하여 이상을 탐지한다."
"우리는 다양한 노이즈 수준에서 로그 밀도 함수를 근사하고, 이를 가우시안 혼합 모델로 결합하여 최종 이상 점수를 산출한다."