本論文では、スプリアス相関の問題に取り組むための新しい手法「GIC」を提案している。GICは、訓練データとは異なるグループ分布を持つ比較データを利用して、スプリアス属性と真のラベルの相関を正確に推定する。
具体的には、以下の2つの特性に基づいてスプリアス属性分類器を学習する:
これにより、GICは訓練データ上でスプリアス属性とラベルの強い相関を学習しつつ、比較データとの相関の違いも捉えることができる。
GICで推定したグループ情報を、様々な頑健学習手法(GroupDRO、Mixup、Subsample、Upsample)と組み合わせることで、スプリアス相関を効果的に緩和できることを示している。特に、Mixupとの組み合わせでは、既存手法を上回る性能を達成している。
さらに、GICの誤分類事例の分析から、「意味的整合性」と呼ばれる興味深い現象を発見した。GICは、視覚的に似た事例を同じグループに割り当てる傾向があり、これがMixupなどの手法の性能向上に寄与していることが分かった。
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Yujin Han,Di... klo arxiv.org 04-23-2024
https://arxiv.org/pdf/2404.13815.pdfSyvällisempiä Kysymyksiä