Core Concepts
다양한 환경과 부정확한 레이블로 인해 현재 감정 인식 시스템은 실용적 요구를 충족하지 못하고 있다. 따라서 이 챌린지는 반지도 학습, 노이즈 강건성, 개방형 어휘 감정 인식 등 세 가지 주제를 다루어 이 분야의 발전을 도모한다.
Abstract
이 논문은 MER2024 챌린지를 소개한다. MER2024는 MER2023의 확장 버전으로, 레이블된 데이터와 레이블되지 않은 데이터를 모두 포함한다. 이 챌린지는 세 가지 트랙으로 구성된다:
MER-SEMI: 레이블되지 않은 데이터를 활용하여 성능 향상을 도모한다.
MER-NOISE: 오디오 잡음과 이미지 블러 노이즈에 대한 강건성을 평가한다.
MER-OV: 캐릭터의 감정 상태를 가능한 정확하게 설명하기 위해 개방형 어휘 감정 인식을 수행한다.
이 논문에서는 각 트랙의 데이터셋, 베이스라인, 평가 지표를 소개하고 실험 결과를 보고한다. 결과에 따르면 음향 정보가 감정 인식에 가장 중요하며, 멀티모달 융합이 성능 향상에 효과적이다. 또한 대규모 언어 모델이 개방형 어휘 감정 인식 문제를 어느 정도 해결할 수 있지만, 여전히 완벽하지는 않다.
Stats
음향 정보가 감정 인식에 가장 중요하다.
멀티모달 융합이 성능 향상에 효과적이다.
Quotes
"다양한 환경과 부정확한 레이블로 인해 현재 감정 인식 시스템은 실용적 요구를 충족하지 못하고 있다."
"이 챌린지는 반지도 학습, 노이즈 강건성, 개방형 어휘 감정 인식 등 세 가지 주제를 다루어 이 분야의 발전을 도모한다."