核心概念
提出了一种名为T-COL的新方法,能够生成适应于通用用户偏好和可变机器学习系统的反事实解释。T-COL通过选择合适的原型样本和特征值选择规则,生成满足用户偏好和具有鲁棒性的反事实解释。
要約
本文提出了一种名为T-COL的反事实解释生成方法,旨在解决两个主要挑战:通用用户偏好和可变机器学习系统。
首先,作者预定义了一些通用用户偏好,并通过用户调研验证了这些偏好的合理性和完整性。这些通用用户偏好包括:
a. 我更喜欢关注几件事情
b. 我希望它更容易做到
c. 我认为更安全的选择更好
d. 我希望有类似的成功案例
e. 我希望处于大多数人的情况
然后,作者提出了T-COL方法,它包括两个可选的结构来捕捉这些通用用户偏好。第一个结构控制原型样本的选择,第二个结构控制局部特征值组合的选择。通过选择不同的原型样本和特征值选择规则,T-COL可以生成满足不同用户偏好的反事实解释。
此外,作者还提出了数据保真度这个新指标,用于评估反事实解释在可变机器学习系统下的适应性。作者将T-COL与其他方法进行了广泛的实验比较,结果表明T-COL在满足通用用户偏好和适应可变机器学习系统方面都有较好的表现。
統計
在成人收入数据集上,T-COL生成的反事实解释在不同机器学习模型上的平均F1-score为0.89。
在德国信用数据集上,T-COL生成的反事实解释在不同机器学习模型上的平均F1-score为0.85。
在泰坦尼克号数据集上,T-COL生成的反事实解释在不同机器学习模型上的平均F1-score为0.92。
在水质数据集上,T-COL生成的反事实解释在不同机器学习模型上的平均F1-score为0.88。
在语音数据集上,T-COL生成的反事实解释在不同机器学习模型上的平均F1-score为0.87。