핵심 개념
SHAP 점수는 특징 중요도 평가에 있어 한계가 있으며, 이는 기존에 사용된 특성 함수의 문제점에 기인한다. 이 논문은 특성 함수가 만족해야 할 속성을 제안하고, 이를 만족하는 새로운 특성 함수를 제안한다.
초록
이 논문은 SHAP 점수의 한계를 분석하고 이를 개선하기 위한 방안을 제시한다.
-
최근 연구에서 SHAP 점수가 특징의 상대적 중요도를 잘못 평가하는 사례가 발견되었다. 이는 SHAP 점수의 이론적 기반인 특성 함수의 문제점에 기인한다.
-
논문은 특성 함수가 만족해야 할 다음과 같은 속성을 제안한다:
- 약한 클래스 독립성: 클래스 레이블이 변경되어도 SHAP 점수가 변경되지 않아야 한다.
- 강한 클래스 독립성: 클래스 레이블 매핑이 변경되어도 SHAP 점수가 변경되지 않아야 한다.
- 특징 (비)관련성 준수: 관련 없는 특징의 SHAP 점수가 0이어야 한다.
- 수치 중립성: 범주형 및 수치형 분류기에 모두 적용 가능해야 한다.
-
논문은 이러한 속성을 만족하는 새로운 특성 함수를 제안한다. 이를 통해 SHAP 점수의 한계를 극복할 수 있다.
-
새로운 특성 함수의 계산 복잡도를 분석하였으며, 일부 경우 다항식 시간 내에 계산 가능함을 보였다.
-
마지막으로 SHAP 도구에 새로운 특성 함수를 적용하는 방법을 제안하였다.
통계
관련 없는 특징이 실제 중요한 특징보다 더 큰 SHAP 점수를 받는 사례가 있다.
새로운 특성 함수를 사용하면 이러한 문제가 해결된다.
인용구
"SHAP 점수는 이론적 기반인 특성 함수의 문제점으로 인해 한계를 가진다."
"특성 함수가 만족해야 할 속성을 제안하고, 이를 만족하는 새로운 특성 함수를 제안한다."
"새로운 특성 함수를 사용하면 SHAP 점수의 한계를 극복할 수 있다."