Core Concepts
木モデルの予測に対する特徴の影響を正確かつ効率的に評価する手法を提案する。
Abstract
本論文では、木モデルの予測に対する特徴の影響を定量的に評価する手法を提案する。
具体的には以下の通り:
特徴の重要度を表す指標として、予測値の変化量の二乗平均(PGI2)を定義する。これは従来のPGI指標の変形で、計算が効率的に行える。
PGI2を用いて特徴の重要度をグリーディに順位付ける手法を提案する。実験の結果、この手法はSHAP法よりも特徴重要度の評価精度が高いことが示された。
PGI2の正確な計算アルゴリズムを提案し、その計算量がO(n^2)であることを示した。ここでnは木モデルの総ノード数。一方、従来のモンテカルロ法は精度が低い。
以上より、本手法は木モデルの特徴重要度を効率的かつ正確に評価できることが確認された。
Stats
木モデルの総ノード数をnとすると、PGI2の正確な計算時間はO(n^2)である。
モンテカルロ法では、同等の計算時間で得られる結果の正規化平均絶対誤差(NMAE)は0.02から0.3の範囲にある。
Quotes
"PGIは予測値の変化量の絶対値の期待値であるが、これは数学的に扱いづらい。そこで我々はPGIの二乗平均(PGI2)を提案する。"
"PGI2を用いた特徴重要度のグリーディな順位付けは、SHAP法よりも高精度な結果を得られることが実験的に示された。"