論文は、マルチモーダル感情認識において、有向非巡回グラフを活用し、カリキュラム学習を組み合わせた新しいアプローチであるMultiDAG+CLを提案しています。
マルチモーダル感情認識は重要な研究分野であり、データ不足や環境ノイズなどの課題に取り組むため、半教師あり学習、ノイズ耐性、オープンボキャブラリーの3つのトラックを設定した。
ビジョン-言語プロンプト学習とモダリティドロップアウトを用いることで、感情認識の精度と一般化性能を向上させることができる。