核心概念
複数の主体からなる情報を活用し、単一の目標主体に適応することで、顔表情認識の精度と頑健性を向上させる。
摘要
本論文は、顔表情認識(FER)のための主体別ドメイン適応手法を提案している。従来のFERでは、データセット全体をドメインとして扱っていたが、本手法では各主体を個別のドメインとして扱う。
まず、複数の主体(ソースドメイン)からなるデータを用いて、主体間の特徴の差異を最小化するように特徴抽出器を学習する。次に、目標主体(ターゲットドメイン)に対して、信頼性の高い擬似ラベルを生成する手法(ACPL)を提案する。この擬似ラベルを用いて、ソースドメインとターゲットドメインの特徴を整合させるように適応モデルを学習する。
実験では、BioVid heat and pain dataset及びUNBC-McMaster shoulder pain datasetを用いて評価を行った。提案手法は、ソースのみの手法や既存のMSDA手法と比較して優れた性能を示し、主体数が増加しても良好な適応性を維持することが確認された。また、ターゲット主体に関連性の高いソースを選択することで、さらなる性能向上が得られることが示された。
統計資料
顔表情認識の精度は、ソースのみの手法では0.71、提案手法では0.83であった。
提案手法は、既存のMSDA手法と比較して0.1~0.6の精度向上を示した。
引述
"複数の主体からなる情報を活用し、単一の目標主体に適応することで、顔表情認識の精度と頑健性を向上させる。"
"ターゲット主体に関連性の高いソースを選択することで、さらなる性能向上が得られる。"