核心概念
사용자의 다양한 목표와 요구사항에 따라 반사실적 설명의 특성이 달라져야 한다. 일괄적인 접근법으로는 모든 사용자의 요구를 충족할 수 없으므로, 맞춤형 반사실적 설명이 필요하다.
要約
이 논문은 반사실적 설명(Counterfactual Explanations, CFEs)에 대한 보다 세부적인 이해의 필요성을 강조한다. 기존 연구들은 편향 탐지, 행동 변화 제안, 신뢰성 향상 등 다양한 목표를 아우르는 일괄적인 접근법을 취해왔다. 그러나 이는 사용자의 다양한 요구사항을 충족하지 못한다.
저자들은 세 가지 주요 사용자 목표를 제시한다:
- 결과 달성: 사용자가 원하는 결과를 얻기 위한 실행 가능하고 현실적인 조언 제공
- 시스템 조사: AI 시스템의 편향이나 비일관성 등 행동 특성 파악
- 취약점 탐지: 시스템의 강건성 및 공격에 대한 취약성 확인
각 목표에 따라 CFEs에 요구되는 특성이 다르다. 예를 들어 결과 달성의 경우 실행 가능성과 현실성이 중요하지만, 시스템 조사에서는 이러한 제약이 필요하지 않다. 취약점 탐지에서는 오히려 이러한 제약이 방해가 될 수 있다.
따라서 사용자 목표에 맞춰 CFEs의 특성을 조정하는 맞춤형 접근법이 필요하다. 이를 통해 사용자의 요구사항을 보다 효과적으로 충족할 수 있으며, AI 시스템과의 협업을 증진시킬 수 있다.
統計
반사실적 설명은 입력 x를 변경하여 출력 y를 달리하는 새로운 입력 x'를 제공한다.
실행 가능한(actionable) 변경은 사용자가 실제로 변경할 수 있는 입력 특성을 의미한다.
현실적인(plausible) 변경은 실제 데이터 분포에 부합하는 입력 특성 변경을 의미한다.
引用
"사용자의 다양한 요구사항을 충족하기 위해서는 반사실적 설명의 특성을 사용자 목표에 맞게 조정하는 맞춤형 접근법이 필요하다."
"일괄적인 접근법으로는 모든 사용자의 요구를 충족할 수 없으므로, 사용자 목표에 따른 반사실적 설명의 특성 조정이 중요하다."