핵심 개념
본 논문은 기본 감정 인식 모델을 활용하여 복합 감정 표현을 인식하는 새로운 오디오-비주얼 방법을 제안한다. 이 방법은 모달리티 간 확률 융합과 규칙 기반 의사결정을 통해 복합 감정 표현을 예측한다.
초록
본 논문은 복합 감정 표현 인식을 위한 새로운 오디오-비주얼 방법을 제안한다. 이 방법은 다음과 같은 특징을 가진다:
- 기본 감정 인식 모델을 활용하여 복합 감정 표현을 인식한다. 이를 위해 정적 및 동적 비주얼 모델과 오디오 모델을 사용한다.
- 모달리티 간 확률 융합 방법을 제안하며, 이는 계층적 가중치 기반 융합 방식을 사용한다.
- 규칙 기반 의사결정 방법을 제안하여 특정 복합 감정 표현을 예측한다. 이 방법은 기본 감정 확률 분포와 복합 감정 표현의 구성 가중치를 활용한다.
- 다중 코퍼스 학습과 크로스 코퍼스 검증을 통해 모델의 일반화 성능을 높였다.
- AffWild2와 AFEW 코퍼스의 기본 감정 인식 성능 기준을 제시했다.
전체적으로 제안된 방법은 기본 및 복합 감정 표현 데이터 주석을 위한 지능형 소프트웨어 도구로 활용될 수 있다.
통계
복합 감정 표현 중 공포스럽게 놀란 표정의 확률은 공포 감정 확률과 놀람 감정 확률의 합이다.
행복하게 놀란 표정의 확률은 행복 감정 확률이 6/8, 놀람 감정 확률이 2/8이다.
슬프게 놀란 표정의 확률은 슬픔 감정 확률이 4/6, 놀람 감정 확률이 2/6이다.