본 논문에서는 레이블이 지정되지 않은 비디오 데이터를 효과적으로 활용할 수 있는 자가 지도 트랜스포머 네트워크를 사용하는 새로운 사회적 집단 활동 인식(SoGAR) 접근 방식을 제안합니다.