Core Concepts
T-Explainer는 Taylor 급수 기반의 안정적이고 신뢰할 수 있는 지역 설명 방법이다.
Abstract
이 논문에서는 T-Explainer라는 새로운 모델 독립적 지역 설명 방법을 소개한다. T-Explainer는 Taylor 급수 기반의 접근법으로, 지역 정확성, 누락, 일관성 등의 바람직한 특성을 가지고 있다. 또한 결정적인 최적화 절차를 통해 안정적인 설명을 제공한다.
실험 결과, T-Explainer는 기존의 SHAP, LIME, 그래디언트 기반 방법들에 비해 입력 및 출력 변화에 대한 안정성이 뛰어난 것으로 나타났다. 특히 고차원 데이터셋에서 T-Explainer의 성능이 두드러졌다. 또한 T-Explainer는 신경망 모델뿐만 아니라 비미분 가능한 모델에서도 좋은 성과를 보였다.
T-Explainer는 설명의 시각화와 정량적 평가를 위한 다양한 메트릭을 포함하는 종합적인 XAI 프레임워크로 개발되었다.
Stats
모델 예측값 f(x)는 Taylor 급수 근사 f(x) + ∇f(x) · h로 표현할 수 있다.
특성 중요도 ϕi는 ∇f(x)의 i번째 성분으로 계산된다.
중심 유한 차분법을 사용하여 ∇f(x)를 근사한다.
Quotes
"The complex non-linear structures and vast number of parameters inherent in such models pose a challenge to transparent interpretation and comprehension of the rationale behind their decisions."
"Explainable Artificial Intelligence (XAI) has emerged to address the challenges outlined above, seeking to provide human-understandable insights into the complexities of models that are inherently challenging to interpret."