핵심 개념
데이터 변환 제약(push-forward constraint)은 대부분의 경우 비볼록하며, 이는 생성 모델링과 공정성 있는 학습 문제에 중요한 영향을 미친다.
초록
이 논문은 데이터 변환 제약의 볼록성과 비볼록성에 대해 분석합니다.
첫째, 두 가지 유형의 데이터 변환 제약, 즉 확률 분포 간 전송 맵(transport map)과 출력 분포 동등화 맵(equalizing map)의 볼록성을 조사합니다. 대부분의 경우 이러한 제약은 비볼록하다는 것을 보여줍니다.
둘째, 이러한 비볼록 제약이 생성 모델링과 공정성 있는 학습 문제 설계에 미치는 중요한 영향을 설명합니다. 볼록 손실 함수로는 비볼록 집합으로부터의 편차를 정량화할 수 없기 때문에, 이러한 문제들을 볼록 최적화 문제로 설계하기 어렵다는 것을 보여줍니다.
마지막으로, 볼록성을 회복하기 위한 두 가지 접근법을 제안합니다: 제약을 약화 또는 강화하거나, 결정론적 변환 대신 확률적 결합을 사용하는 것입니다.
통계
확률 분포 P와 Q 사이의 전송 맵 집합 T(P, Q)는 대부분의 경우 비볼록하다.
확률 분포 P와 Q 사이의 출력 분포 동등화 맵 집합 E(P, Q)는 대부분의 경우 비볼록하다.
인용구
"대부분의 학습 문제(특히 최적 수송, 생성 모델링, 알고리즘 공정성 분야)에는 데이터 변환 제약 또는 페널티가 포함되어 있지만, 이러한 제약의 (비)볼록성과 그에 따른 학습 문제에 대한 일반적인 이론적 통찰은 부족하다."
"볼록 손실 함수로는 비볼록 집합으로부터의 편차를 정량화할 수 없다."