이 논문은 비디오 이상 탐지를 위한 새로운 접근법을 제안한다. 비디오에서 추출한 특징 벡터를 고정 분포를 가진 무작위 변수로 간주하고, 신경망을 사용하여 이 분포의 확률 밀도 함수를 모델링한다. 이를 통해 테스트 비디오의 가능도를 추정하고 임계값을 사용하여 이상을 탐지할 수 있다.
제안 방법은 변형된 denoising score matching 기법을 사용하여 신경망을 학습시킨다. 다양한 노이즈 수준에 걸쳐 로그 밀도 함수를 모델링하고, 이 모델들 간의 정렬을 유도하는 정규화 기법을 도입한다. 테스트 시에는 다중 노이즈 수준에서의 이상 지표를 가우시안 혼합 모델로 결합한다.
실험 결과, 제안 방법은 객체 중심 및 프레임 중심 비디오 이상 탐지 벤치마크에서 최신 기술 수준을 달성했다. 또한 추론 시 특징 추출과 신경망 및 가우시안 혼합 모델의 순전파만 필요하여 최소한의 지연이 발생한다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Jakub Micore... alle arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14497.pdfDomande più approfondite