핵심 개념
大型語言模型在模擬招聘決策時,會基於姓名展現出種族和性別偏見,偏好聘用白人女性,並在薪資建議上存在顯著差異。
本研究旨在探討大型語言模型 (LLM) 在進行就業推薦時,是否會基於姓名展現出種族和性別偏見。
研究人員使用 GPT-3.5-Turbo 和 Llama 3-70B-Instruct 兩種大型語言模型,模擬招聘決策和薪資建議。他們使用 320 個強烈暗示種族和性別的美國常見名字,以及超過 750,000 個提示,涵蓋 40 多種職業,要求模型從候選人名單中選擇最佳人選,並提供薪資建議。