본 논문에서는 다양한 시나리오를 포괄하는 포괄적인 데이터셋의 부재를 포함하여 비디오 이상 탐지(VAD) 분야의 과제를 해결하기 위해 새로운 데이터셋인 다중 시나리오 이상 탐지(MSAD)를 소개하고, 다양한 시나리오에서 이상 탐지 문제를 해결하기 위한 벤치마크 및 모델 적응성 향상에 기여하고자 한다.
제안된 프레임워크는 이미지-텍스트 정렬을 통해 새로운 비정상적인 이벤트에 일반화될 수 있는 국소 패턴을 찾아내고, 이러한 국소 패턴의 공간적 배열과 동적 특성을 모델링하여 정상과 비정상을 구분한다.
비디오 이상 탐지는 비디오 내에서 정상적이지 않은 행동이나 이벤트를 발견하는 것을 목표로 한다. 딥러닝 기술의 발전으로 다양한 딥러닝 기반 방법들이 지속적으로 등장하고 있으며, 이를 통해 탐지 알고리즘의 일반화 능력이 크게 향상되고 적용 범위가 확대되고 있다.
비디오 특징 벡터를 정상 데이터의 고정 분포를 가진 무작위 변수로 간주하고, 신경망으로 이 분포의 확률 밀도 함수를 근사하여 이상 탐지를 수행한다.