Core Concepts
트리 기반 회귀 모델에 대해 특성 중요도 충실도를 정확하고 효율적으로 계산할 수 있는 PGI2 지표를 제안하였다. 또한 PGI2 지표를 기반으로 한 특성 중요도 순위화 방법을 제안하였으며, 이 방법이 기존의 SHAP 설명자보다 우수한 성능을 보임을 실험적으로 확인하였다.
Abstract
이 논문에서는 트리 기반 회귀 모델에 대한 특성 중요도 충실도 측정 방법을 제안한다.
기존의 PGI(Prediction Gap on Important feature perturbation) 지표의 한계를 지적하고, 이를 개선한 PGI2 지표를 제안하였다.
PGI2 지표는 트리 모델의 구조를 활용하여 정확하고 효율적으로 계산할 수 있다.
실험 결과, PGI2 지표를 이용한 특성 중요도 순위화 방법이 기존의 SHAP 설명자보다 우수한 성능을 보였다.
특히 PGI2 지표는 중요 특성 집합에 대한 예측 격차의 제곱을 측정하므로, 중요 특성에 대한 큰 예측 변화를 강조하고 작은 변화는 상대적으로 약화시키는 효과가 있다.
Stats
트리 모델의 총 노드 수를 n이라 할 때, PG2(x, S)를 O(n^2) 시간 내에 정확하게 계산할 수 있다.
PGI2(x, π)는 O(n^2d) 시간 내에 정확하게 계산할 수 있다.
Quotes
"PGI와 같은 무작위 섭동 기반 충실도 지표를 보다 정확하게 계산할 수 있는지 궁금해졌다."
"PGI2는 예측 격차의 제곱을 사용함으로써 큰 예측 변화를 강조하고 작은 변화를 상대적으로 약화시키는 효과가 있다."