Główne pojęcia
本文提出了一種基於四元組交叉相似度(QCS)的人臉表情識別特徵優化網路,透過挖掘同類別圖像間的相似特徵並分離不同類別圖像間的冗餘特徵,提升人臉表情識別模型的效能。
論文資訊
Wang, C., Chen, L., Wang, L., Li, Z., & Lv, X. (2024). QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition. arXiv preprint arXiv:2411.01988v1.
研究目標
本研究旨在解決人臉表情識別(FER)中,由於標註特徵在複雜數據集中顯著性難以預測,導致類間相似性和類內差異性所帶來的挑戰。
方法
交叉相似度注意力機制(CSA): 提出了一種輸入輸出位置敏感的注意力機制,用於挖掘不同圖像之間的細粒度特徵相似度,並計算相應的全局空間注意力。
四元組交叉相似度網路(QCS): 基於CSA,設計了一個四分支循環框架,用於同步提取同類別圖像中的判別性特徵並消除不同類別圖像中的冗餘特徵。
對比殘差蒸餾: 利用對比殘差蒸餾將交叉模組中學習到的信息傳遞回基礎網路。
主要發現
CSA 能夠有效地捕捉不同圖像之間的細粒度特徵相似度。
QCS 網路能夠有效地優化特徵表示,提高模型的判別能力。
對比殘差蒸餾有助於將交叉模組的知識遷移到基礎網路。
主要結論
本文提出的 QCS 模型在多個常用的人臉表情識別數據集上均取得了優於現有方法的性能,且無需額外的標註信息或其他訓練數據。
CSA 和 QCS 為人臉表情識別提供了一種新的特徵優化思路。
意義
本研究提出了一種有效的人臉表情識別特徵優化方法,有助於提高人臉表情識別的準確性和魯棒性,並具有廣泛的應用前景。
局限與未來研究方向
QCS 網路的訓練過程相對複雜,需要進一步優化。
未來可以探索將 QCS 應用於其他計算機視覺任務。
Statystyki
在RAF-DB數據集上,QCS模型的準確率達到了92.83%。
在FERPlus數據集上,QCS模型的準確率達到了91.50%。
在AffectNet-7數據集上,QCS模型的準確率達到了66.91%。