핵심 개념
비 대상 클래스로부터 유의미한 정보를 학습하여 반 지도 학습 시간 동작 탐지 성능을 향상시킨다.
초록
이 논문은 기존 반 지도 학습 시간 동작 탐지 방법들이 주로 가장 높은 신뢰도의 대상 클래스에만 집중하는 것에 주목한다. 대신 저자들은 대상 클래스 외의 비 대상 클래스로부터 유의미한 정보를 학습하는 새로운 접근법을 제안한다.
구체적으로 다음과 같은 과정을 거친다:
- 예측된 클래스 확률 분포를 대상 클래스, 긍정 클래스, 부정 클래스, 모호 클래스로 구분한다.
- 대상 클래스의 신뢰도와 순위를 기반으로 긍정 클래스와 부정 클래스를 적응적으로 선별한다.
- 새로운 긍정 학습 손실과 부정 학습 손실을 도입하여 비 대상 클래스로부터 유의미한 정보를 학습한다.
- 긍정 학습과 부정 학습을 통합한 하이브리드 프레임워크를 구축한다.
이를 통해 기존 방법들보다 THUMOS14와 ActivityNet v1.3 데이터셋에서 우수한 성능을 달성한다.
통계
대상 클래스의 신뢰도가 높을수록 더 많은 부정 클래스를 선별할 수 있다.
대상 클래스의 신뢰도와 긍정 클래스의 신뢰도 차이가 클수록 긍정 클래스에 더 많은 정보가 포함되어 있다.
인용구
"기존 접근법은 단순히 가장 높은 신뢰도의 대상 클래스를 사용하지만, 이는 두 가지 주요 단점을 가진다. 첫째, 대상 클래스는 제한된 레이블 데이터로 인해 매우 노이즈가 있다. 둘째, 비 대상 클래스는 완전히 무시되는데, 이들은 종종 동작에 대한 유용한 단서를 포함하고 있다."