核心概念
賦予大型語言模型國籍人格會影響其對不同國家的觀感,暴露出對西方國家,尤其是美國的偏見,儘管如此,這些模型在一定程度上反映了人類對國家觀感的真實情況。
摘要
探討將國籍人格賦予大型語言模型如何改變其對國家觀感的認知
本研究探討將國籍人格賦予大型語言模型 (LLM) 如何影響其對其他國家的觀感。研究發現,無論賦予何種國籍人格,LLM 都存在顯著的西方國家偏見,傾向於正面評價西方國家,而負面評價東歐、拉丁美洲和非洲國家。儘管如此,將國籍人格賦予 LLM 確實會使其更加關注與該國籍相同地區的國家,並在一定程度上反映出人類對國家觀感的真實情況,尤其是在模擬美國觀點方面表現更佳。
研究人員將 193 個國籍人格(例如美國人)賦予四種 LLM(GPT-4o、Llama-3.1-70B、Mistral-7B 和 Gemma2-27B),並使用包含正面和負面形容詞的數據集測試 LLM 對不同國家的評價。他們分析了 LLM 輸出結果中的回應百分比 (RP) 和正面提及率 (PMR),以評估 LLM 對不同國家和地區的態度。