이 연구는 감정 상태 인식을 위한 상황 인지적 다중 모달 접근법을 제안한다. 얼굴 열 데이터, 얼굴 동작 단위, 텍스트 문맥 정보를 활용하여 감정 상태를 인식하는 변환기 기반의 다중 모달 융합 모델을 개발하였다.
모달리티 별 인코더를 통해 각 모달리티의 특성을 반영한 표현을 학습하고, 이를 가산 융합하여 변환기 인코더로 처리함으로써 시간적 의존성과 모달리티 간 상호작용을 포착하였다.
이 모델을 게임 환경에서 수집된 데이터셋에 적용한 결과, 문맥 정보를 포함할 때 감정 상태 인식 성능이 향상되었다. 특히 즐거움과 좌절 상태의 구분이 개선되었다. 이는 문맥 정보가 감정 표현의 해석에 중요한 역할을 함을 보여준다.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Youssef Moha... في arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.11906.pdfاستفسارات أعمق