Core Concepts
人工知能モデルの予測を説明するために、拡散距離と方向性一貫性という2つの新しい指標を提案し、その有効性を示した。拡散距離は、データ間の接続性と実行可能性を重視し、方向性一貫性は、個別の特徴変更と全体的な変更方向の整合性を評価する。これらの指標を組み込むことで、より人間中心的な説明を生成できる。
Abstract
本研究では、人工知能モデルの予測を説明するための新しい手法を提案している。
拡散距離: データ間の接続性と実行可能性を重視する距離指標。従来の距離指標とは異なり、データ間の多数の短距離パスの存在を考慮する。これにより、現実的な遷移経路を見出すことができる。
方向性一貫性: 個別の特徴変更と全体的な変更方向の整合性を評価する指標。モデルの出力が個別の特徴変更に対してどのように変化するかという期待に沿った変更を促進する。
提案手法CoDiCEでは、これら2つの指標を目的関数に組み込むことで、より人間中心的な説明を生成できる。
合成データおよび実データを用いた実験では、CoDiCEが既存手法に比べて高い有効性、低い拡散距離、高い方向性一貫性を示した。
感度分析の結果、拡散距離と方向性一貫性の間にはトレードオフが存在することが明らかになった。適切なバランスを取ることが重要である。
全体として、人間の認知プロセスからの洞察を人工知能の説明フレームワークに組み込むことで、より人間中心的で直感的な説明の生成が可能になる。
Stats
拡散距離が小さいほど、入力点と反事実点の間の接続性が高く、実行可能な遷移経路が存在する。
方向性一貫性が高いほど、個別の特徴変更と全体的な変更方向が整合的である。
Quotes
"拡散距離は、データ間の接続性と実行可能性を重視する距離指標である。従来の距離指標とは異なり、データ間の多数の短距離パスの存在を考慮する。"
"方向性一貫性は、個別の特徴変更と全体的な変更方向の整合性を評価する指標である。モデルの出力が個別の特徴変更に対してどのように変化するかという期待に沿った変更を促進する。"