核心概念
概念活性化ベクトル(CAV)は、層間で一貫性がなく、他の概念と絡み合っており、空間依存性を持つ可能性がある。これらの特性は、CAVに基づく説明手法の解釈に影響を与える。
要約
本研究では、概念活性化ベクトル(CAV)の3つの特性について調査しました。
一貫性: CAVは層間で一貫性がない可能性がある。つまり、異なる層のCAVが同じ効果を持たない可能性がある。これは、CAVに基づく説明手法(TCAV)の結果が層間で矛盾する原因となる。
概念の絡み合い: CAVは単一の概念を表しているとは限らず、複数の概念が絡み合っている可能性がある。この場合、ある概念のTCAV得点に他の関連概念の影響が含まれてしまう。
空間依存性: CAVは、概念の位置に依存して変化する可能性がある。つまり、同じ概念でも位置によって異なる表現を持つ。これにより、モデルの概念に対する感度が位置によって変化する。
これらの特性を検出・分析するためのツールを提案し、合成データセットElementsとImageNetデータセットを用いて検証しました。その結果、これらの特性が実際に存在し、CAVに基づく説明手法に影響を与えることが示されました。
本研究の知見を踏まえ、実践的な推奨事項を提案しました。CAVを使用する際は、層間の一貫性、概念の絡み合い、空間依存性に留意し、適切な分析を行うことが重要です。
統計
CAVは層間で一貫性がなく、最適化しても一貫性は得られない。
関連概念間のCAVの類似度が高く、概念の絡み合いが存在する。
CAVは概念の位置に依存して変化し、空間依存性を持つ。