Core Concepts
다양한 설명자 방법들이 생성한 반사실적 설명들 중 최적의 설명을 선택하기 위한 다기준 분석 접근법을 제안한다.
Abstract
이 논문은 기계학습 모델의 예측을 설명하기 위해 사용되는 반사실적 설명에 대한 연구이다. 반사실적 설명은 모델의 예측을 변경할 수 있는 대안적인 시나리오를 제공한다. 다양한 방법들이 서로 다른 품질 지표를 최적화하여 상이한 해결책을 생성하지만, 적절한 설명 방법과 생성된 반사실적 설명을 선택하는 것은 쉽지 않다. 이 논문에서는 다양한 기저 설명자들의 앙상블을 활용하여 여러 품질 지표에 대한 절충안을 제공하는 단일 반사실적 설명을 선택하는 다단계 접근법을 제안한다. 먼저 다양한 설명자 방법들을 활용하여 반사실적 설명들을 생성한다. 그 다음 유효성과 실행가능성을 검사하여 부적절한 설명들을 제거한다. 그 후 지배 관계를 이용하여 비지배 해를 구성하는 Pareto 프론트를 생성한다. 마지막으로 이상점 방법을 사용하여 Pareto 프론트에서 최적의 절충 해를 선택한다. 실험 결과, 제안된 접근법은 다양한 품질 지표에 대한 우수한 절충 해를 제공한다.
Stats
반사실적 설명을 생성하는 과정에서 유효성과 실행가능성 검사를 거치면 원래 설명 후보군의 약 83%가 제거된다.
지배 관계를 이용하여 Pareto 프론트를 생성하면 원래 설명 후보군의 약 80%가 제거된다.
제안된 접근법의 Manhattan 거리 기반 변형이 가장 우수한 평균 순위를 보인다.
Quotes
"다양한 설명자 방법들이 서로 다른 품질 지표를 최적화하여 상이한 해결책을 생성하지만, 적절한 설명 방법과 생성된 반사실적 설명을 선택하는 것은 쉽지 않다."
"이 논문에서는 다양한 기저 설명자들의 앙상블을 활용하여 여러 품질 지표에 대한 절충안을 제공하는 단일 반사실적 설명을 선택하는 다단계 접근법을 제안한다."