Core Concepts
Die Arbeit charakterisiert den Bayes-optimalen Klassifikator unter Gruppenfairness-Beschränkungen und entwickelt darauf aufbauend ein effizientes Post-Prozessing-Verfahren, um einen gegebenen Klassifikator an Fairness-Kriterien anzupassen.
Abstract
Die Arbeit befasst sich mit dem Problem der fairen Klassifizierung unter Gruppenfairness-Beschränkungen wie Demographic Parity (DP), Equalized Opportunity (EOp) und Equalized Odds (EO).
Zunächst wird der Bayes-optimale Klassifikator unter diesen Fairness-Beschränkungen charakterisiert. Dafür wird ein neuartiges Maß für die Verzerrung auf Instanzebene, der sogenannte "Bias-Score", eingeführt. Es zeigt sich, dass der optimale Klassifikator eine einfache Modifikation des uneingeschränkten Bayes-Klassifikators ist, basierend auf den Bias-Scores.
Darauf aufbauend wird ein Post-Prozessing-Verfahren entwickelt, das einen gegebenen Klassifikator an die Fairness-Beschränkungen anpassen kann, ohne Zugriff auf die Sensitivattribute während der Inferenz zu benötigen. Im Gegensatz zu vielen anderen Post-Prozessing-Methoden erfordert der Ansatz also keine Kenntnis der Sensitivattribute zum Zeitpunkt der Vorhersage.
Die Methode wird auf drei Benchmark-Datensätzen (Adult Census, COMPAS, CelebA) evaluiert und erzielt dabei bessere oder vergleichbare Ergebnisse als state-of-the-art In-Prozessing- und Post-Prozessing-Verfahren.
Stats
Die Demographic Parity (DP) ist definiert als die Differenz der Wahrscheinlichkeit einer positiven Vorhersage zwischen den Sensitivgruppen.
Die Equalized Opportunity (EOp) misst die Differenz der True-Positive-Raten zwischen den Sensitivgruppen.
Die Equalized Odds (EO) misst die maximale Differenz der False-Positive- und True-Positive-Raten zwischen den Sensitivgruppen.
Quotes
"Wir interpretieren unsere Lösung als eine Modifikation des (uneingeschränkten) Bayes-optimalen Klassifikators basierend auf wenigen Werten, die wir "Bias-Scores" nennen, die wiederum als Maß für die Verzerrung auf Instanzebene aufgefasst werden können."
"Im Gegensatz zu den meisten Post-Prozessing-Methoden erfordert unser Ansatz keinen Zugriff auf die Sensitivattribute während der Inferenz."