書誌情報: Hyeonggeun Han, Sehwan Kim, Hyungjun Joo, Sangwoo Hong, Jungwoo Lee. (2024). Mitigating Spurious Correlations via Disagreement Probability. Thirty-eighth Conference on Neural Information Processing Systems.
研究目的: 経験的リスク最小化(ERM)を用いて訓練された機械学習モデルは、目標ラベルとバイアス属性間の擬似相関に影響されやすく、擬似相関のないデータ群では性能が低下する。本研究は、バイアスラベルを用いずに、擬似相関の影響を軽減する新しい手法を提案することを目的とする。
手法: 本研究では、不一致確率に基づくリサンプリング手法であるDPR (Disagreement Probability based Resampling for debiasing) を提案する。DPRは、二段階の手順で構成される。まず、汎化クロスエントロピー損失を用いて意図的にバイアスを持つモデルを訓練する。次に、このバイアスモデルの予測と正解ラベルとの不一致確率を計算し、これをサンプリング確率として用いて訓練データをリサンプリングする。そして、リサンプリングされたデータを用いて、標準的なクロスエントロピー損失でデバイアスモデルを訓練する。
主要な結果: 提案手法であるDPRを、擬似相関を持つ6つのベンチマークデータセット(Colored MNIST、Multi-bias MNIST、BAR、BFFHQ、CelebA、CivilComments-WILDS)を用いて評価した結果、DPRは、バイアスラベルを使用しない既存手法と比較して、全てのデータセットにおいて同等以上の性能を達成した。特に、訓練データにおけるバイアスと矛盾するサンプルの割合がわずか0.5%であるBiased FFHQ (BFFHQ)のバイアスと矛盾するテストセットにおいて、DPRは、ERMと比較して精度が20.87%、最良のベースラインと比較して6.2%も向上した。
主要な結論: DPRは、バイアスラベルを用いずに、擬似相関の影響を効果的に軽減できることが示された。DPRは、バイアスと矛盾するサンプルを効果的に識別し、アップサンプリングすることで、モデルがバイアス属性ではなく、真の予測因子に焦点を当てるように促す。
意義: 本研究は、バイアスラベルを用いずに擬似相関を軽減する新しい方向性を示し、様々な実世界アプリケーションにおいて、よりロバストで公平な機械学習モデルの開発に貢献するものである。
限界と今後の研究: DPRは、バイアスモデルが擬似相関構造をどれだけ正確に捉えているかに依存する。また、DPRは二段階の手順を採用しており、訓練プロセスが複雑になり、追加のハイパーパラメータの調整が必要となる。今後の研究では、これらの限界を克服し、より効率的かつ効果的な擬似相関軽減手法の開発が期待される。
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы