핵심 개념
민감 속성을 알 수 없는 상황에서도 공정한 분류기를 학습할 수 있는 Antigone 프레임워크를 제안한다. Antigone는 검증 데이터에서 생성한 가짜 민감 속성 레이블을 활용하여 공정성 지표를 최적화하는 하이퍼파라미터를 튜닝한다.
초록
이 논문은 민감 속성(예: 성별, 인종)을 알 수 없는 상황에서도 공정한 분류기를 학습하는 방법을 제안한다. 기존 연구는 민감 속성이 학습 및 검증 데이터에 모두 존재한다고 가정했지만, 실제로는 이러한 정보를 얻기 어려운 경우가 많다.
Antigone는 다음과 같은 3단계로 구성된다:
기준 ERM 모델을 학습하고, 이를 통해 검증 데이터에 가짜 민감 속성 레이블을 생성한다.
가짜 민감 속성 레이블의 정확도를 최대화하는 ERM 모델을 선택한다. 이를 위해 정확하게 분류된 예와 잘못 분류된 예의 평균 이미지 간 유클리드 거리(EDM)를 최대화한다.
선택된 ERM 모델의 가짜 민감 속성 레이블을 활용하여 공정성 최적화 방법(JTT, GEORGE, ARL, AFR)의 하이퍼파라미터를 튜닝한다.
실험 결과, Antigone를 활용하면 민감 속성을 알 수 없는 상황에서도 기존 방법들과 유사한 수준의 공정성을 달성할 수 있다. 또한 Antigone는 GEORGE의 클러스터링 기반 접근법보다 더 정확한 가짜 민감 속성 레이블을 생성한다.
통계
정확하게 분류된 예와 잘못 분류된 예의 평균 이미지 간 유클리드 거리(EDM)는 가짜 민감 속성 레이블의 정확도를 최대화한다.
가짜 민감 속성 레이블의 F1 점수는 GEORGE 방법보다 높다.
인용구
"최근 연구에서는 민감 속성이 없는 학습 데이터에서 공정한 모델을 학습하고자 하였지만, 이러한 방법들은 검증 데이터에서 민감 속성이 필요하다고 가정한다."
"Antigone는 검증 데이터에서도 민감 속성 없이 공정한 분류기를 학습할 수 있다."