Core Concepts
STMixer는 동작 검출을 위한 새로운 단일 단계 희소 검출기 프레임워크를 제안한다. 이는 적응형 특징 샘플링과 혼합 메커니즘을 통해 동작 검출 성능을 향상시킨다.
Abstract
이 논문은 동작 검출을 위한 새로운 단일 단계 희소 검출기 프레임워크인 STMixer를 제안한다. STMixer는 다음과 같은 핵심 설계를 포함한다:
쿼리 기반 적응형 특징 샘플링 모듈: 이는 전체 시공간 영역에서 판별적인 특징을 추출할 수 있는 유연성을 제공한다.
공간-시간 분리 특징 혼합 모듈: 이는 외양 및 동작 정보를 각각 집중적으로 모델링할 수 있다.
이러한 설계를 통해 STMixer는 키프레임 동작 검출과 동작 튜브 검출 두 가지 형태의 동작 검출 작업에서 우수한 성능을 달성한다. 구체적으로:
STMixer-K: 키프레임 동작 검출을 위한 STMixer 파이프라인. 이는 AVA와 AVA-Kinetics 벤치마크에서 최신 성과를 달성한다.
STMixer-T: 동작 튜브 검출을 위한 STMixer 파이프라인. 이는 UCF101-24, JHMDB51-21, MultiSports 벤치마크에서 새로운 최신 성과를 달성한다.
STMixer는 기존 방법들의 한계를 극복하고 동작 검출 성능을 크게 향상시켰다.
Stats
동작 검출 작업에서 STMixer-K는 AVA v2.2 데이터셋에서 23.1% Frame mAP@0.5를 달성했다.
동작 튜브 검출 작업에서 STMixer-T는 UCF101-24 데이터셋에서 32.8% Video mAP@0.75를 달성했다.
Quotes
"STMixer는 동작 검출을 위한 새로운 단일 단계 희소 검출기 프레임워크를 제안한다."
"STMixer는 적응형 특징 샘플링과 혼합 메커니즘을 통해 동작 검출 성능을 향상시킨다."