이 논문은 다중 모달 대화 감정 인식 문제를 그래프 스펙트럼 관점에서 재검토한다. 구체적으로 제안하는 GS-MCC 프레임워크는 다음과 같다:
슬라이딩 윈도우를 사용하여 다중 모달 상호작용 그래프를 구축하여 대화 관계를 모델링하고, 효율적인 푸리에 그래프 연산자를 사용하여 장거리 고주파 및 저주파 정보를 각각 추출한다.
고주파 및 저주파 정보 간의 협업 능력을 높이기 위해 대조 학습을 사용하여 고주파 및 저주파 신호의 보완성과 일관성 있는 의미 협업을 반영하는 자기 지도 신호를 구축한다.
협업된 고주파 및 저주파 정보를 MLP 네트워크와 softmax 함수에 입력하여 감정 예측을 수행한다.
실험 결과는 제안된 GS-MCC 모델이 장거리 의존성 정보를 효율적으로 포착하고 고주파 및 저주파 정보의 협업을 향상시켜 IEMOCAP 및 MELD 벤치마크 데이터셋에서 우수한 감정 인식 성능을 달성했음을 보여준다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Tao Meng,Fuc... lúc arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.17862.pdfYêu cầu sâu hơn