本研究對 OpenAI 的 o1-mini 模型進行了早期評估,分析其在性別包容性和偏見方面的表現。研究團隊使用 700 個虛擬角色(350 個來自 GPT-4o mini,350 個來自 o1-mini)進行分析。
結果顯示,儘管 o1-mini 在個性特徵和喜好方面有所改善,但仍存在顯著的性別偏見。例如,o1-mini 將男性角色的能力評分(8.06)高於女性(7.88)和非二元性別(7.80)。此外,o1-mini 將 28% 的男性角色分配到博士學位,但只有 22.4% 的女性和 0% 的非二元性別角色獲得此殊榮。
在成功創業者和CEO的預測概率方面,男性角色也明顯高於女性和非二元性別角色。這些結果反映了 o1-mini 在工程、數據和技術等領域仍存在傳統的性別刻板印象,而設計、藝術和營銷等領域則更傾向於女性和非二元性別群體。
這些發現突顯了在緩解性別偏見方面的持續挑戰,需要採取更強有力的干預措施,確保AI模型在各性別群體之間實現公平和平等的代表。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询