Core Concepts
各データ点の予測プロセスにおける重要性を示す指標としての観測固有の説明を定義し、散在データ近似を用いて推定する。
Abstract
本研究では、従来の説明可能な人工知能(XAI)手法とは異なる観点から、各データ点の予測プロセスにおける重要性を示す指標である「観測固有の説明」を定義した。
具体的には、ブラックボックスモデルの予測プロセスにおいて、各データ点がどの程度の影響を及ぼしているかを示す指標を提案している。
この指標を推定するために、散在データ近似を用いて、ブラックボックスモデルを高精度に近似する代理モデルを構築する。直交マッチング追跡アルゴリズムを用いて、代理モデルの構築に最適な観測データのサブセットを選択し、その係数を観測固有の説明として定義する。
提案手法は、シミュレーションデータおよび実データを用いて検証され、ブラックボックスモデルの予測プロセスにおける重要な観測データを特定できることが示された。
Stats
予測モデルの再現誤差は10^-4のオーダーであり、全体の3.6%のデータ点のみを用いて高精度な近似が可能である。
境界領域のデータ点の再現誤差が相対的に高く、代理モデルの精度が低い。
代理モデルの構築に選択されたデータ点は、データ分布の境界や疎な領域に位置しており、予測プロセスにおいて重要な役割を果たしている。
Quotes
「観測固有の説明」は、ブラックボックスモデルの予測プロセスにおける各データ点の重要性を示す指標を定義するものである。
散在データ近似を用いて構築した代理モデルは、ブラックボックスモデルの振る舞いを高精度に再現できる。
代理モデルの構築に選択されたデータ点は、データ分布の境界や疎な領域に位置しており、予測プロセスにおいて重要な役割を果たしている。