Khái niệm cốt lõi
大規模言語モデルは、保護されたグループに対する偏見を反映し、増幅する可能性がある。
Thống kê
「全体的に33%」、「50%は1つ以上のバイアス」、「12%は2種類以上」、「5%は3種類以上」含む11,964件中84%が内容豊かだった。
「Race: Asian 53.6%, Black 63.2%, Latino 65.8%, White 49.4%」等
Trích dẫn
"Language models perpetuate and occasionally amplify biases and stereotypes concerning minoritized groups."
"The model not only reflects societal biases, but appears to amplify them."