核心概念
提出一種新的抗噪多模態情感識別模型(NMER),能夠有效地從不完整的數據中重建健壯的多模態聯合表示。
摘要
本文提出了一種新的抗噪多模態情感識別模型(NMER)。主要包括以下內容:
-
設計了一個噪聲調度器,通過在不同模態的嵌入層上添加各種類型和強度的噪聲,模擬現實場景中各種不完整情況。這種方法不僅能夠更好地模擬現實情況,而且還能探索一種全新的三個模態都不完整的情況,這在之前的方法中是無法實現的。
-
提出了一種基於變分自編碼器(VAE)的多模態聯合表示學習網絡,能夠從噪聲數據中重建健壯的多模態聯合表示。這種方法可以充分利用現有噪聲數據的有價值信息,並利用VAE的強大生成能力從噪聲數據中重建健壯的多模態聯合表示,從而實現多模態情感識別。
-
在基準數據集IEMOCAP和CMU-MOSEI上進行了實驗驗證,結果表明,與現有方法相比,NMER在各種噪聲類型和強度條件下都表現出更優秀的性能和更強的健壯性。
统计
在IEMOCAP數據集上,當高斯噪聲強度為-10dB時,NMER的加權準確率(WA)為0.7598,而MEN為0.7120,MCTN為0.7215,MMIN為0.7551,IF-MMIN為0.7543。
在CMU-MOSEI數據集上,當高斯噪聲強度為-10dB時,NMER的WA為0.7596,而MEN為0.7285,MCTN為0.7330,MMIN為0.7438,IF-MMIN為0.7566。
引用
"提出一種新的抗噪多模態情感識別模型(NMER),能夠有效地從不完整的數據中重建健壯的多模態聯合表示。"
"設計了一個噪聲調度器,通過在不同模態的嵌入層上添加各種類型和強度的噪聲,模擬現實場景中各種不完整情況。"
"提出了一種基於變分自編碼器(VAE)的多模態聯合表示學習網絡,能夠從噪聲數據中重建健壯的多模態聯合表示。"