Die Arbeit befasst sich mit dem Problem der fairen Klassifizierung unter Gruppenfairness-Beschränkungen wie Demographic Parity (DP), Equalized Opportunity (EOp) und Equalized Odds (EO).
Zunächst wird der Bayes-optimale Klassifikator unter diesen Fairness-Beschränkungen charakterisiert. Dafür wird ein neuartiges Maß für die Verzerrung auf Instanzebene, der sogenannte "Bias-Score", eingeführt. Es zeigt sich, dass der optimale Klassifikator eine einfache Modifikation des uneingeschränkten Bayes-Klassifikators ist, basierend auf den Bias-Scores.
Darauf aufbauend wird ein Post-Prozessing-Verfahren entwickelt, das einen gegebenen Klassifikator an die Fairness-Beschränkungen anpassen kann, ohne Zugriff auf die Sensitivattribute während der Inferenz zu benötigen. Im Gegensatz zu vielen anderen Post-Prozessing-Methoden erfordert der Ansatz also keine Kenntnis der Sensitivattribute zum Zeitpunkt der Vorhersage.
Die Methode wird auf drei Benchmark-Datensätzen (Adult Census, COMPAS, CelebA) evaluiert und erzielt dabei bessere oder vergleichbare Ergebnisse als state-of-the-art In-Prozessing- und Post-Prozessing-Verfahren.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies