Core Concepts
本論文では、目標オブジェクトとその共起オブジェクトから生成される相関特徴を仲介変数として捉え、その正の影響を活かしつつ負の影響を軽減するための因果推論フレームワークを提案する。具体的には、目標オブジェクトのみに起因する直接効果を強化することで、共起情報に過剰に依存することを防ぐ。さらに、目標オブジェクトの位置が不明であるため、パッチベースの推論と学習を導入し、この目的を達成する。
Abstract
本論文では、多ラベル画像分類(MLC)の課題に取り組む。MLCでは、ラベル間の相関関係を活用することが重要だが、過度に相関関係に依存すると、モデルのオーバーフィッティングを引き起こし、全体的な性能の低下につながることが知られている。
本論文では、まず、ラベルの共起関係が正負の両方の影響を及ぼすことを因果推論の観点から明らかにする。具体的には、目標オブジェクトとその共起オブジェクトから生成される相関特徴を仲介変数として捉え、その正の影響(共起関係の捕捉)と負の影響(共起情報への過剰な依存)を分析する。
次に、この負の影響を軽減するため、目標オブジェクトのみに起因する直接効果を強化する因果推論手法を提案する。しかし、目標オブジェクトの位置が不明であるため、パッチベースの推論手法を導入し、どのパッチに目標オブジェクトが含まれているかを特定する。さらに、学習時にもパッチを利用することで、学習と推論の間の特徴分布のシフトを軽減する。
実験結果から、提案手法が複数のベンチマークデータセットにおいて、最先端の性能を達成することが示された。特に、共起情報への過剰な依存を防ぐことで、従来手法に比べて大幅な性能向上が確認された。
Stats
目標オブジェクトのみに起因する直接効果を強化することで、共起情報への過剰な依存を防ぐことができる。