본 연구는 비디오 액션 카운팅(VAC) 문제에 대한 새로운 접근법을 제안한다. 기존 연구들은 주로 반복 행동의 규칙성에 초점을 맞추었지만, 실제 상황에서는 다양한 불규칙성이 존재한다. 이에 본 연구는 반복 행동의 불규칙성을 모델링하는 IVAC-P2L 프레임워크를 제안한다.
IVAC-P2L의 핵심 원리는 다음과 같다:
이를 위해 IVAC-P2L은 일관성 모듈과 불일치성 모듈을 도입하고, pull-push 손실 함수를 활용한다. pull 손실은 주기 세그먼트 간 유사성을 높이고, push 손실은 주기 세그먼트와 간격 세그먼트 간 차이를 벌린다. 이를 통해 반복 행동과 비반복 행동을 효과적으로 구분하고 정확한 액션 카운팅을 달성한다.
실험 결과, IVAC-P2L은 RepCount, UCFRep, Countix 데이터셋에서 기존 최신 방법들을 뛰어넘는 성능을 보였다. 이는 본 연구의 접근법이 비디오 내 불규칙적 반복 패턴을 효과적으로 모델링할 수 있음을 입증한다. 향후 이 연구 결과는 비디오 이해 및 분석 분야에 새로운 방향을 제시할 것으로 기대된다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문