Core Concepts
大規模言語モデルにおけるジェンダーバイアスの特定と軽減方法を統合的なフレームワークで提案し、LSDMが他の手法よりも効果的であることを示した。
Abstract
大規模言語モデル(LLM)は事実や人間の認知を学ぶ際にバイアスやステレオタイプを取り込む可能性がある。
現在の研究はバイアスの特定、位置付け、軽減に焦点を当てている。
LSDMは職業代名詞におけるジェンダーバイアスを効果的に軽減する方法であり、他の手法よりも優れた結果を示している。
Stats
著者らは3つの大きなデータセットでLSDMがジェンダーバイアスを効果的に軽減することを示した。
Quotes
"Large language models are pre-trained on extensive corpora to learn facts and human cognition which contain human preferences."
"LSDM mitigates gender bias in the model more effectively than the other baselines, while fully preserving the model’s capabilities in all other aspects."