Core Concepts
TreeSHAPアルゴリズムは実装不変性を持たず、異なるランキングを生成する。
Abstract
木ベースの機械学習モデルは、ランダムフォレストや勾配ブースティングされた木アンサンブルなどが非常に人気となっています。これらの方法は、局所的な特徴帰属を解釈するために使用されます。Shapley値やOwen値、Banzhaf値などのマージナル(介入)Shapleyに基づく局所的な特徴帰属法が真であり、実装不変であることが強調されています。しかし、TreeSHAPアルゴリズムはこの考え方と異なり、同じ関数を計算する2つの決定木が異なるランキングを生成し、実装不変性を欠いていることが示されています。また、木ベースモデルの内部構造を活用してマージナル特徴帰属を計算する方法やCatBoostモデルにおける対称性を利用した明示的な式も提案されています。
Stats
TreeSHAPアルゴリズムはO(|T|・L・D^2)の時間複雑度を持ちます。
Interventioal TreeSHAPアルゴリズムはO(|T|・L・|D*|)の時間複雑度です。
Quotes
TreeSHAPアルゴリズムは実装不変性を持たず、「path-dependent」TreeSHAPが異なる特徴のランキングを生成します。
CatBoostモデルでは対称であるため、マージナルShapley値について改善された複雑さと内部モデルパラメータだけで明示的な式が導かれます。