本論文では、地理的バイアスを軽減するための手法を分析しています。
まず、ImageNetデータセットとDollar Streetデータセットを用いて、主要な画像認識モデルにおける地理的バイアスを定量的に示しました。
次に、以下の手法を提案し、その有効性を検証しました:
損失関数の重み付け: 低所得地域の画像に高い重みを付けることで、モデルがそれらの画像を better 分類するよう学習させる。
サンプリング: 所得レベル別にデータをサンプリングし、所得分布を均一化することで、地理的バイアスを軽減する。
Focal Loss: 易しい例(高所得地域の画像)の損失を抑えることで、難しい例(低所得地域の画像)に注目させる。
ADDA: ドメイン適応手法を用いて、高所得地域と低所得地域の特徴表現の差異を縮小する。
これらの手法を適用した結果、特にVGG16モデルにFocal Lossを適用した場合に、所得レベル間の精度格差を最も小さくできることが分かりました。一方、ImageNetデータセットでは、所得レベル間の精度差を完全に解消するまでには至りませんでした。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問