이 논문은 제로샷 시간 동작 인식(ZS-TAL) 문제에 대한 새로운 접근법을 제안한다. 기존 ZS-TAL 방법은 학습 데이터를 필요로 하지만, 이는 실제 응용 분야에서 제한적일 수 있다. 이에 저자들은 학습 데이터 없이도 동작을 인식할 수 있는 방법인 T3AL(Test Time Adaptation for Temporal Action Localization)을 제안한다.
T3AL은 다음 3단계로 구성된다:
실험 결과, T3AL은 기존 제로샷 방법 대비 THUMOS14에서 6.3%, ActivityNet-v1.3에서 13.5% 향상된 성능을 보였다. 또한 오라클 실험을 통해 T3AL이 학습 데이터 없이도 기존 최신 모델 수준의 성능을 달성할 수 있음을 확인했다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Benedetta Li... lúc arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05426.pdfYêu cầu sâu hơn