핵심 개념
무작위 응답 기법을 활용하여 데이터 사전 처리 과정에서 다양한 그룹 공정성 지표를 달성할 수 있는 방법을 제안한다.
초록
이 논문은 기계 학습 모델의 공정성 문제를 해결하기 위한 사전 처리 방법을 제안한다. 기존의 사전 처리, 모델 내부 처리, 사후 처리 방법들과 달리, 이 논문에서는 무작위 응답 기법을 활용하여 데이터의 레이블을 조정함으로써 그룹 공정성을 달성하는 방법을 제안한다.
구체적으로 다음과 같은 내용을 다룬다:
무작위 응답 기법을 활용하여 레이블을 조정함으로써 인구통계학적 공정성, 기회의 균등, 예측의 균등 등 다양한 그룹 공정성 지표를 달성할 수 있음을 보인다.
이를 위해 최근 연구에서 제안된 공정 베이즈 최적 분류기의 이론적 결과를 활용한다.
제안한 방법인 FairRR을 통해 기존 방법들과 비교했을 때 우수한 성능과 공정성을 달성할 수 있음을 실험적으로 보인다.
FairRR은 공정성 수준을 직접 제어할 수 있는 장점이 있어, 실제 응용 분야에서 유용하게 활용될 수 있다.
통계
인구통계학적 공정성 달성을 위해 (p11 + p10 + t⋆
δ)θ11 + (t⋆
δ - p11 - p10)θ10 = t⋆
δ, (t⋆
δ - p01 - p00)θ01 + (t⋆
δ + p01 + p00)θ00 = t⋆
δ 조건이 필요하다.
기회의 균등 달성을 위해 2p11θ11 + 2(t⋆
δ - p11)θ10 = t⋆
δ, -2p01θ01 + 2(t⋆
δ + p01)θ00 = t⋆
δ 조건이 필요하다.
예측의 균등 달성을 위해 2(t⋆
δ + p10)θ11 - 2p10θ10 = t⋆
δ, 2(t⋆
δ - p00)θ01 + 2p00θ00 = t⋆
δ 조건이 필요하다.