Core Concepts
大規模言語モデルにおける暗黙のジェンダーバイアスを明らかにし、バイアスを特定する新たな手法を提案。
Abstract
大規模言語モデルにおけるジェンダーバイアスの問題とその影響に焦点を当てた研究。
バックトランスレーション手法を使用して、56個のソフトウェアエンジニアリングタスク文を繰り返し翻訳し、代名詞選択の偏りを調査。
5つの中間言語で結果を比較し、主要動詞が翻訳文の暗黙のジェンダーに与える影響を分析。
結果は3つの時間差データセットで再現性が確立され、バックトランスレーション手法がバイアス分析に有用であることが示された。
Stats
各文は「she」から始まり、「he」や「he/she」といった代名詞が使用されている。
「As a software engineer, she performs support tasks.」はフィンランド語では「hän」として翻訳され、「he」として逆翻訳された。
インドネシア語ではほぼ全て「he」であり、他言語でも異なる代名詞選択が見られる。
Quotes
"大規模言語モデルにおける暗黙のジェンダーバイアスを明らかにし、バイアスを特定する新たな手法を提案。"
"主要動詞が翻訳文の暗黙のジェンダーに与える影響や再現性も確立。"
"各文は「she」から始まり、「he」や「he/she」といった代名詞が使用されている。"