Core Concepts
Durch die Verwendung von Kardinalitätsbeschränkungen bei der Generierung von Gegenbeispielen können interpretierbarere und leichter verständliche Erklärungen für Vorhersagen von Maschinenlernmodellen bereitgestellt werden.
Abstract
In diesem Artikel wird eine Erweiterung des CERTIFAI-Frameworks vorgestellt, um Gegenbeispiele mit einer begrenzten Anzahl an veränderten Merkmalen im Vergleich zum Originalbeispiel zu generieren. Gegenbeispiele sind ein intuitiver Typ von Erklärungen für Vorhersagen von Maschinenlernmodellen, da sie aufzeigen, welche Merkmale verändert werden müssen, um eine andere Vorhersage zu erhalten.
Die Autoren argumentieren, dass Gegenbeispiele mit vielen veränderten Merkmalen schwerer zu interpretieren sind. Daher schlagen sie vor, eine Kardinalitätsbeschränkung einzuführen, die begrenzt, wie viele Merkmale sich im Gegenbeispiel vom Originalbeispiel unterscheiden dürfen.
Die Ergebnisse zeigen, dass die kardinalitätsbeschränkten Gegenbeispiele tatsächlich leichter interpretierbar sind als die unbeschränkten Gegenbeispiele. Die Autoren planen, ihre Methode in Zukunft weiter zu verbessern und auf größere Datensätze anzuwenden.
Stats
Die durchschnittliche Kardinalität der unbeschränkten Gegenbeispiele betrug ̂k = 3,1.
Bei einer Beschränkung auf maximal k = 2 oder k = 3 veränderte Merkmale konnten interpretierbarere Gegenbeispiele generiert werden.
Quotes
"Selbst wenn ein Gegenbeispiel im Merkmalsraum nahe am Originalbeispiel liegt (z.B. in Bezug auf den euklidischen Abstand zwischen x und x̂), können leichte Änderungen in einer hohen Anzahl von Merkmalen die Interpretierbarkeit negativ beeinflussen."
"In dieser Arbeit beschränken wir uns auf tabellarische Daten und verwenden als Distanzfunktion die Summe aus der L1-Distanz (für kontinuierliche Merkmale) und einer Matching-Distanz für kategoriale Werte, wie in Sharma et al. (2020) vorgeschlagen."