이 연구는 감정 상태 인식을 위한 상황 인지적 다중 모달 접근법을 제안한다. 얼굴 열 데이터, 얼굴 동작 단위, 텍스트 문맥 정보를 활용하여 감정 상태를 인식하는 변환기 기반의 다중 모달 융합 모델을 개발하였다.
모달리티 별 인코더를 통해 각 모달리티의 특성을 반영한 표현을 학습하고, 이를 가산 융합하여 변환기 인코더로 처리함으로써 시간적 의존성과 모달리티 간 상호작용을 포착하였다.
이 모델을 게임 환경에서 수집된 데이터셋에 적용한 결과, 문맥 정보를 포함할 때 감정 상태 인식 성능이 향상되었다. 특히 즐거움과 좌절 상태의 구분이 개선되었다. 이는 문맥 정보가 감정 표현의 해석에 중요한 역할을 함을 보여준다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Youssef Moha... klo arxiv.org 09-19-2024
https://arxiv.org/pdf/2409.11906.pdfSyvällisempiä Kysymyksiä