Kernkonzepte
기계 학습 알고리즘의 편향된 예측을 완화하고 정확도를 유지하기 위해, 관심 공정성 정의의 대리 함수를 도입하고 제약 최적화 문제를 해결하는 것이 유망한 접근법이다. 그러나 이러한 공정성 대리 함수는 불공정한 결과와 높은 불안정성을 초래할 수 있다.
Zusammenfassung
이 논문은 공정성 대리 함수에 대한 깊이 있는 이해를 제공한다. 인구통계학적 균등성(demographic parity, DP)을 예로 들어, 대리 함수와 실제 공정성 정의 사이에 "대리-공정성 격차"가 존재함을 보여준다. 또한 이 격차와 분산이 대리 함수의 안정성에 악영향을 미치는 것을 강조한다.
이를 해결하기 위해, 일반 시그모이드 대리 함수를 제안하여 격차와 분산을 동시에 줄이고 공정성과 안정성 보장을 제공한다. 흥미롭게도, 이론은 대규모 마진 포인트 문제와 더 균형 잡힌 데이터셋 확보가 공정성과 안정성에 모두 유익하다는 통찰을 제공한다.
또한 균형 대리 함수라는 새로운 일반적인 알고리즘을 제안하여 "격차"를 반복적으로 줄임으로써 공정성을 향상시킨다. 실험에서는 세 가지 실제 데이터셋에서 제안 방법이 정확도를 유지하면서도 공정성과 안정성을 일관적으로 개선함을 보여준다.
Statistiken
대부분의 데이터 포인트는 결정 경계 근처에 있다.
Adult와 COMPAS 데이터셋에서 5% 이상의 데이터 포인트가 대규모 마진 포인트이다.
대규모 마진 포인트의 대부분은 양성 클래스로 예측된다.
Zitate
"기계 학습 알고리즘의 편향된 예측을 완화하고 정확도를 유지하기 위해, 관심 공정성 정의의 대리 함수를 도입하고 제약 최적화 문제를 해결하는 것이 유망한 접근법이다."
"그러나 이러한 공정성 대리 함수는 불공정한 결과와 높은 불안정성을 초래할 수 있다."
"대규모 마진 포인트 문제와 더 균형 잡힌 데이터셋 확보가 공정성과 안정성에 모두 유익하다."