核心概念
人口統計学的属性に関する公平性と予測タスクの効用は相反する目的であり、両者を最適化するためにはトレードオフが存在する。本論文では、このトレードオフを特定し、データから数値的に定量化する方法を提案する。
摘要
本論文では、人口統計学的公平性と予測タスクの効用の間に存在するトレードオフについて検討している。
まず、データ空間トレードオフ(DST)とラベル空間トレードオフ(LST)という2つのタイプのトレードオフを定義している。DSTは学習アルゴリズムが入力データから表現を学習する際のトレードオフを表し、LSTは目標ラベルと人口統計学的属性の間の本質的な依存関係から生じるトレードオフを表す。
次に、U-FaTEと呼ばれる手法を提案し、これらのトレードオフを実データから数値的に推定する方法を示している。U-FaTEは特徴抽出器と公平なエンコーダから構成され、閉形式の最適化手法を用いて公平性と効用のトレードオフを推定する。
最後に、CelebAやFairFaceなどのデータセットを用いて、ゼロショットモデルや教師あり学習モデルの公平性と効用を評価し、提案手法で推定したトレードオフと比較している。その結果、多くの既存モデルがトレードオフ曲線から大きく乖離していることが示された。
統計資料
人口統計学的属性Sと目標ラベルYの間に強い相関がある場合、公平性を考慮すると目標ラベルYの予測精度が大幅に低下する可能性がある。
人口統計学的属性Sと目標ラベルYの間の相関が弱い場合、公平性と効用の両立が可能になる。
引述
"When building classification systems with demographic fairness considerations, there are two objectives to satisfy: 1) maximizing utility for the specific task and 2) ensuring fairness w.r.t. a known demographic attribute. These objectives often compete, so optimizing both can lead to a trade-off between utility and fairness."
"We introduce two utility-fairness trade-offs: the Data-Space and Label-Space Trade-off. The trade-offs reveal three regions within the utility-fairness plane, delineating what is fully and partially possible and impossible."