Khái niệm cốt lõi
AIアクトやその他の規制により、訓練データの不公平性を修復するアルゴリズムが急務となっています。この論文では、最適輸送(OT)を使用して、アーカイブデータを修復する方法に焦点を当てています。
Tóm tắt
AIアクトやその他の規制により、訓練データの不公平性を修復する必要性が高まっている。
著者らは、保護された属性(S)と特徴(X)の間の条件付き独立性を基準として公正性を定義し、小さな割合の研究データ(S|Uラベル付き)だけを使用してアーカイブデータを修復する重要な設定に取り組んでいる。
OTベースの修復計画は、オフサンプル、ラベル付きのアーカイブデータが安定仮定下で修復されることを可能にし、OT計画のサポートサイズが大幅に削減されることで設計コストおよびシーケンシャル適用コストも大幅に削減される。
AI fairness:
AI Actやその他規制によりAIシステムへの透明性が求められている。
研究努力がAI公正性向上に向けられており、多くの作業がデータまたはモデルの修復に焦点を当てている。
Optimal transport:
最適輸送(OT)はアーカイブデータの効果的な修復手法として使用されている。
OT計画は安定仮定下でオフサンプルラベル付き(アーカイブ)データを修復し、設計およびシークエンシャル適用コストが大幅に削減される。
Data repair:
データ修復方法は有限かつ静的な場合に依存しがちである。
提案された方法はドメイン適応手法から着想を得たものであり、歴史的動的データを修復することが可能。
Thống kê
アダルト収入[11]やCOMPAS [12]など標準的なベンチマークデータセットが評価に使用されている。
nR ≪nAであり、F(x, s, u)から独立したiidサンプルから成っている。
Trích dẫn
"Fairness definitions in the literature emphasize unconditional independence between outputs, ˆ Y , and protected attributes, S."
"Disparate impact (DI) is often adopted as the proxy for quantifying the extent to which Definition 2.2 is met."