Core Concepts
단일 모달 모델을 다중 모달 동적 표정 인식에 효과적으로 적응시키는 방법을 제안한다.
Abstract
이 논문은 단일 모달 모델을 다중 모달 동적 표정 인식에 적응시키는 방법을 제안한다.
단일 모달 모델 간의 도메인 차이, 모달리티 간 정렬, 시간적 적응 등의 문제를 해결하기 위한 솔루션을 제안한다.
단일 모달 모델의 점진적 프롬프트 학습, 모달리티 융합 병목 구조, 다중 모달 시간 변환기 등의 기법을 통해 성능을 향상시킨다.
제안 방법은 두 가지 인기 있는 동적 표정 인식 벤치마크 데이터셋에서 현재 최고 성능을 달성한다.
Stats
단일 모달 모델만 사용했을 때의 성능은 UAR 56.59%, WAR 68.43%에 불과하다.
제안 방법을 적용하면 UAR 66.52%, WAR 77.92%로 크게 향상된다.
제안 방법은 기존 최고 성능 대비 UAR 1.5%, WAR 1.5% 향상을 보인다.
Quotes
"단일 모달 모델을 다중 모달 동적 표정 인식에 효과적으로 적응시키는 방법을 제안한다."
"단일 모달 모델 간의 도메인 차이, 모달리티 간 정렬, 시간적 적응 등의 문제를 해결하기 위한 솔루션을 제안한다."
"제안 방법은 두 가지 인기 있는 동적 표정 인식 벤치마크 데이터셋에서 현재 최고 성능을 달성한다."