核心概念
BERTの次文予測タスクにおける性別バイアスを軽減するための射影法を提案し、その有効性を検証する。また、性別バイアスの新しい評価指標を導入し、BERTの性別バイアスの実態を明らかにする。
要約
本研究では、BERTの次文予測タスクにおける性別バイアスを軽減するための手法として、射影法を提案している。具体的には、BERTの内部表現に対して性別部分空間への射影を行うことで、性別バイアスを低減する。
まず、StereoSetデータセットを拡張し、性別バイアスの新しい評価指標を導入した。これにより、BERTの次文予測タスクにおける性別バイアスの実態を明らかにした。
次に、提案手法を適用した結果、以下のことが分かった。
射影法を適用することで、BERTの次文予測タスクにおける性別バイアスを大幅に軽減できる。
性別部分空間の次元数と情報重み付けの使用が、バイアス軽減の程度に影響する。
次文予測タスクにおけるバイアス軽減と、下流タスクにおけるバイアス軽減は必ずしも相関しない。
つまり、BERTの性別バイアスを軽減するには、下流タスク特有のバイアス評価指標に基づいて最適化する必要があることが示された。提案手法は、このような最適化に適しており、効率的なモデル開発を可能にすると考えられる。
統計
BERTの次文予測タスクにおける性別バイアス指標Strengthは0.3069であった。
BERTの次文予測タスクにおける性別能力格差指標Distanceは0.7052であった。
提案手法を適用することで、Strengthは0.1938まで、Distanceは0.3681まで低減できた。