The author proposes ITEACNet, a framework for incomplete multimodal learning in Conversation Emotion Recognition (CER), addressing context changes and incomplete data. The approach involves an Inverted Teacher-Student training framework and Neural Architecture Search to enhance student model performance.
提案されたITEACNetフレームワークは、不完全なマルチモーダル学習において感情コンテキストの変化を捉え、教師生徒トレーニングフレームワークを導入し、優れたロバスト性を実証しています。