Core Concepts
텍스트 정보를 활용한 시각-텍스트 대비 학습을 통해 마이크로 제스처 인식 성능을 향상시킬 수 있다.
Abstract
이 논문은 마이크로 제스처 인식(MGR)을 위한 새로운 접근법을 제안한다. 기존의 MGR 방법들은 단일 모달리티(RGB 또는 스켈레톤)만을 사용하여 중요한 텍스트 정보를 간과했다. 이 논문에서는 텍스트 정보를 활용하는 시각-텍스트 대비 학습 솔루션을 제안한다. 또한 기존의 수동으로 설계된 프롬프트 대신 상황 인식 프롬프트를 생성하는 새로운 모듈인 Adaptive prompting을 제안한다. 실험 결과, 제안 방법이 두 공개 데이터셋에서 최신 기술 수준의 성능을 달성했다. 또한 MGR 결과를 활용한 감정 이해 실험에서, 텍스트 예측 결과를 사용하는 것이 다른 모달리티보다 약 6% 이상 성능이 향상되었음을 보여주었다.
Stats
제안 방법은 기존 방법 대비 iMiGUE 데이터셋에서 5% 이상, SMG 데이터셋에서 6% 이상 MGR 성능이 향상되었다.
감정 이해 실험에서 텍스트 예측 결과를 사용하는 것이 다른 모달리티 대비 약 2% 이상 성능이 향상되었다.
Quotes
"텍스트 정보는 마이크로 제스처 인식에 있어 매우 중요하다."
"상황 인식 프롬프트를 생성하는 Adaptive prompting 모듈이 성능 향상에 기여했다."
"마이크로 제스처 인식 결과의 텍스트 예측이 감정 이해에 가장 효과적이었다."