Core Concepts
Durch Sicherstellen der Unkorreliertheit zwischen nicht-sensitiven und sensitiven Variablen kann Counterfactual Fairness in Vorhersagemodellen erreicht werden.
Abstract
Der Artikel stellt einen neuartigen Datenvorverarbeitungsalgorithmus namens "Orthogonal to Bias" (OB) vor, der darauf abzielt, den Einfluss einer Gruppe kontinuierlicher sensitiver Variablen auf die Daten zu entfernen und so Counterfactual Fairness in Anwendungen des maschinellen Lernens zu ermöglichen.
Der Kern der Methode besteht darin, dass Counterfactual Fairness erreicht werden kann, indem sichergestellt wird, dass die Daten unkorrelliert mit den sensitiven Variablen sind. Basierend auf der Annahme einer gemeinsam normalverteilten Verteilung innerhalb eines strukturellen kausalen Modells (SCM) wird gezeigt, dass dies möglich ist.
Der OB-Algorithmus ist modellunabhängig und kann daher für eine Vielzahl von Modellen und Aufgaben des maschinellen Lernens eingesetzt werden. Es wird auch eine spärliche Variante (SOB) vorgestellt, um die numerische Stabilität durch Regularisierung zu verbessern.
Die empirische Evaluation auf simulierten und realen Datensätzen, einschließlich des Adult Income und des COMPAS Rückfallkriminalitätsdatensatzes, zeigt, dass der Ansatz faire Ergebnisse ohne Genauigkeitseinbußen ermöglicht.
Stats
Die Korrelation zwischen den nicht-sensitiven Variablen A und den sensitiven Variablen B ist Null.
Die Vorhersagegenauigkeit (AUC) des OB-Algorithmus ist vergleichbar oder besser als die der anderen Methoden.
Der OB-Algorithmus erreicht eine hohe Counterfactual Fairness, gemessen an den Metriken CF-Metric und CF Bound.
Der OB-Algorithmus erzielt auch eine hohe Beobachtungsfairness, gemessen an den Metriken EO Fairness und AA Fairness.
Quotes
"Counterfactual Fairness sucht sicherzustellen, dass eine Entscheidung, die von einem Modell des maschinellen Lernens getroffen wird, unverändert bliebe, wenn sich eine sensitive (oder geschützte) Variable einer Person anders wäre, alles andere gleich."
"Traditionelle Methoden der fairen Lernens stehen vor Herausforderungen bei der Bewältigung von Situationen mit multivariaten und kontinuierlichen sensitiven Variablen mit komplexer Wechselbeziehung."