이 논문은 다중 모달 대화 감정 인식 문제를 그래프 스펙트럼 관점에서 재검토한다. 구체적으로 제안하는 GS-MCC 프레임워크는 다음과 같다:
슬라이딩 윈도우를 사용하여 다중 모달 상호작용 그래프를 구축하여 대화 관계를 모델링하고, 효율적인 푸리에 그래프 연산자를 사용하여 장거리 고주파 및 저주파 정보를 각각 추출한다.
고주파 및 저주파 정보 간의 협업 능력을 높이기 위해 대조 학습을 사용하여 고주파 및 저주파 신호의 보완성과 일관성 있는 의미 협업을 반영하는 자기 지도 신호를 구축한다.
협업된 고주파 및 저주파 정보를 MLP 네트워크와 softmax 함수에 입력하여 감정 예측을 수행한다.
실험 결과는 제안된 GS-MCC 모델이 장거리 의존성 정보를 효율적으로 포착하고 고주파 및 저주파 정보의 협업을 향상시켜 IEMOCAP 및 MELD 벤치마크 데이터셋에서 우수한 감정 인식 성능을 달성했음을 보여준다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Tao Meng,Fuc... alle arxiv.org 04-30-2024
https://arxiv.org/pdf/2404.17862.pdfDomande più approfondite