이 논문은 다중 모달 감정 인식 문제를 다룬다. 주요 내용은 다음과 같다:
특징 분리 단계에서 장기 문맥 정보를 효과적으로 추출하기 위해 Broad Mamba 모델을 제안한다. Broad Mamba는 상태 공간 모델(SSM)과 광범위 학습 시스템(BLS)을 결합하여 감정 표현을 압축하고 잠재적인 데이터 분포를 탐색한다. 기존 SSM과 달리 양방향 SSM 컨볼루션을 사용하여 전역 문맥 정보를 추출한다.
특징 융합 단계에서 각 모달리티의 예측 확률을 가중치로 사용하는 확률 기반 융합 모델(PFM)을 제안한다. PFM은 모달리티 간 의미 정보의 일관성을 최대화하여 감정 예측 성능을 향상시킨다.
IEMOCAP과 MELD 데이터셋에서 실험을 수행한 결과, 제안 모델이 기존 방법들에 비해 우수한 성능을 보였다. 또한 계산 복잡도가 낮아 효율적이다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Yuntao Shou,... о arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.17858.pdfГлибші Запити