Core Concepts
본 연구는 확산 거리와 방향성 일관성을 활용하여 AI 모델의 설명력을 향상시키는 방법을 제안한다. 확산 거리는 데이터 간 연결성과 실행 가능성을 강조하여 실현 가능한 반사실적 설명을 찾는 데 도움이 되며, 방향성 일관성은 개별 특성 변화와 전체 변화 방향의 정렬을 통해 직관적인 설명을 생성한다.
Abstract
본 연구는 AI 모델의 예측에 대한 더 인간 중심적인 설명을 제공하기 위해 두 가지 새로운 편향을 제안하고 테스트한다.
첫째, 확산 거리를 활용하여 실현 가능한 반사실적 설명을 찾는다. 확산 거리는 데이터 간 연결성과 실행 가능성을 강조하여 실현 가능한 경로를 식별한다. 이는 데이터 밀도 변화와 노이즈에 강건하다.
둘째, 방향성 일관성 항을 도입하여 개별 특성 변화와 전체 변화 방향의 정렬을 유도한다. 이를 통해 모델 예측이 개별 특성 변화에 따라 어떻게 변화하는지에 대한 사용자의 기대와 일치하는 반사실적 설명을 생성할 수 있다.
제안된 방법인 CoDiCE는 기존 방법들과 비교하여 더 실현 가능하고 직관적인 반사실적 설명을 생성한다. 합성 데이터와 실제 데이터셋에 대한 일련의 실험을 통해 이 방법의 효과를 입증한다.
Stats
확산 거리가 낮을수록 원본 인스턴스와 반사실적 인스턴스 간 연결성이 높다.
방향성 일관성 점수가 높을수록 개별 특성 변화와 전체 변화 방향이 더 잘 정렬된다.
Quotes
"확산 거리는 데이터 간 연결성과 실행 가능성을 강조하여 실현 가능한 경로를 식별한다."
"방향성 일관성 항을 도입하여 개별 특성 변화와 전체 변화 방향의 정렬을 유도한다."