Core Concepts
正規化された対抗的訓練を用いることで、深層学習モデルの勾配ベースの解釈マップの疎性や連結性といった望ましい構造を促進できる。
Abstract
本論文では、深層学習モデルの決定プロセスを解釈するための勾配ベースの解釈マップの構造を改善する手法を提案している。
まず、勾配ベースの解釈マップは通常ノイズが多く密集しているという問題がある。従来の手法では後処理によってスパース性を高めているが、元の解釈マップとの忠実性が失われる。
そこで本論文では、対抗的訓練(Adversarial Training)を用いて、解釈マップの構造を直接的に制御する手法を提示する。具体的には、対抗的訓練の正則化項を適切に設計することで、解釈マップのスパース性や連結性といった望ましい特性を促進できることを示す。
提案手法の特徴は以下の通り:
勾配ベースの解釈マップと対抗的攻撃の正則化ノルムの間に双対性があることを示し、これに基づいて新しい正則化手法を導出
L1ノルム、グループノルム、エラスティックネットなどの正則化項を提案し、それぞれ異なる構造特性を持つ解釈マップを得られることを示す
人間の注意マップとの整合性を高める解釈調和手法も提案
各種ベンチマークデータセットでの実験結果から、提案手法が解釈マップの疎性、ロバスト性、安定性を向上させることを実証
Stats
勾配ベースの解釈マップは通常ノイズが多く密集しているが、対抗的訓練によって疎性が高まる。
対抗的訓練によって得られた解釈マップは、標準的な訓練と比べて、ロバスト性と安定性が向上する。
Quotes
勾配ベースの解釈マップは、実世界のコンピュータビジョンモデルに適用した際、望ましい構造(疎性、連結性)を欠くことが多い。
従来の後処理手法では、元の勾配ベースの解釈マップとの忠実性が大幅に失われる問題がある。