Belangrijkste concepten
Antigone, ein Rahmenwerk, ermöglicht das effiziente Hyperparameter-Tuning für faire Klassifikatoren, ohne Zugriff auf sensible Attribute in Trainings- oder Validierungsdaten zu haben.
Samenvatting
Der Artikel beschreibt Antigone, ein Rahmenwerk zur Erstellung fairer Klassifikatoren ohne Zugriff auf sensible Attribute in Trainings- oder Validierungsdaten.
Antigone arbeitet in drei Schritten:
- Generierung von Pseudo-Sensitivattributen (PSA) auf Validierungsdaten, indem ein ERM-Modell verwendet wird, um korrekt und inkorrekt klassifizierte Beispiele als Proxy für benachteiligte und bevorzugte Gruppen zu verwenden.
- Auswahl des ERM-Modells mit den genauesten PSA-Etiketten durch Maximierung des euklidischen Abstands zwischen den Mittelwerten der korrekten und inkorrekten Klassen (EDM).
- Verwendung der PSA-markierten Validierungsdaten zum Feinabstimmen der Hyperparameter von Fairness-Methoden wie JTT, AFR, GEORGE und ARL.
Die Autoren zeigen theoretisch und empirisch, dass die PSA-Etiketten unter dem Modell des "gegenseitig kontaminierten" Rauschens proportional zu den tatsächlichen Fairness-Metriken sind. Antigone übertrifft bestehende Methoden auf den CelebA-, Waterbirds- und UCI-Datensätzen.
Statistieken
"Blond men werden diskriminiert."
"Der Mittelwert der inkorrekten Klasse (Zeile 4) hat mehr männliche Merkmale als der der korrekten Klasse (Zeile 1), was diese Verzerrung widerspiegelt."
"Eine Verzerrung gegen nicht-blonde Frauen wird ebenfalls reflektiert."
Citaten
"PSA = 0 entspricht benachteiligten Gruppen und PSA = 1 entspricht bevorzugten Gruppen."