JOSENet은 감시 비디오에서 폭력 탐지를 위한 새로운 자기 지도 학습 프레임워크로, 두 개의 공간-시간 비디오 스트림(RGB 프레임과 광학 흐름)을 사용하며, 새로운 정규화된 자기 지도 학습 접근법을 포함합니다. JOSENet은 자기 지도 학습 최신 기술보다 향상된 성능을 제공하면서도 비디오 세그먼트당 프레임 수와 프레임 속도를 줄입니다.