Core Concepts
인공지능 모델의 예측에 대한 특징의 기여도를 인과 관계를 고려하여 설명하는 방법을 제안한다.
Abstract
이 논문에서는 인과 관계를 고려한 글로벌 설명 방법인 CAGE(Causally-Aware Shapley Values for Global Explanations)를 제안한다. 기존의 Shapley 값 기반 글로벌 설명 방법들은 특징들 간의 독립성을 가정하지만, CAGE는 특징들 간의 인과 관계를 고려하여 특징의 기여도를 계산한다.
구체적으로 CAGE는 다음과 같은 특징을 가진다:
인과 관계 그래프를 활용하여 특징들 간의 인과 관계를 반영한 샘플링 절차를 제안한다.
인과 관계 기반 특징 기여도 계산 방법이 인과 관계의 중요한 특성들을 만족함을 이론적으로 보인다.
합성 데이터와 실제 데이터에 대한 실험을 통해 CAGE가 기존 방법보다 더 직관적이고 충실한 설명을 제공함을 보인다.
Stats
인과 관계 그래프에서 변수 간 완전히 설명될 수 있는 변수는 중요도가 0이 된다.
독립적인 직접 원인 변수들은 두 방법 모두에서 동일한 중요도를 가진다.
원인이자 결과인 변수들은 중요도가 감소하지만 완전히 삭제되지는 않는다.
Quotes
"인공지능 기술이 우리의 일상생활에 더 많은 영향을 미치게 됨에 따라, 인공지능 기반 의사결정이 투명하고 설명 가능해야 한다는 것이 중요해졌다."
"인과 관계는 진정한 설명의 근본적인 기둥이 된다."