核心概念
文章埋め込みに含まれる線形および非線形の偏りを、対照的な単語ペアを使って効果的に除去することができる。
要約
本論文では、文章埋め込みに含まれる偏りを効果的に除去する新しい手法を提案している。
まず、対照的な単語ペア(例えば、男性-女性、男の子-女の子)を定義する。次に、これらの単語が含まれる文章のペア(元の文章と単語を置き換えた文章)を大量に収集する。そして、文章埋め込みの差を最小化するように、ニューラルネットワークを追加の目的関数で訓練する。
この手法は、事前学習時やファインチューニング時に適用できる。実験の結果、提案手法は既存の偏り除去手法よりも優れた性能を示し、特に非線形の偏りを効果的に除去できることが分かった。一方で、主要なNLP課題の精度はほとんど低下しないことも確認された。
全体として、提案手法は文章埋め込みの偏りを効果的に除去しつつ、下流タスクの性能を維持できる有効な手法であると言える。
統計
提案手法を適用すると、文章埋め込みの線形および非線形の偏りが大幅に低減される。
一方で、主要なNLP課題の精度はほとんど低下しない。