Khái niệm cốt lõi
言語モデルが人間の多文化的価値観を反映した安全で個人化された応答を生成するためには、多文化的価値観の認識が不可欠である。
Tóm tắt
本研究では、世界価値観調査(World Values Survey)のデータを基に、言語モデルの多文化的価値観認識を評価するための大規模ベンチマークデータセット「WORLDVALUESBENCH」を提案した。このデータセットには、94,728人の参加者から収集された200以上の価値観に関する質問とその回答が含まれている。
具体的には、参加者の属性(大陸、居住地域、教育レベルなど)と価値観に関する質問のペアから成る2,000万以上の事例が構築されている。本研究では、この「WORLDVALUESBENCH」を用いて、最新の大規模言語モデルの多文化的価値観認識能力を評価した。その結果、Alpaca-7B、Vicuna-7B-v1.5、Mixtral-8x7B-Instruct-v0.1、GPT-3.5 Turboなどの言語モデルは、人間の回答分布との距離が十分小さい(0.2以下のWasserstein 1-distance)質問の割合が11.1%、25.0%、72.2%、75.0%と、まだ課題が残されていることが明らかになった。
今後、「WORLDVALUESBENCH」を活用して、言語モデルの多文化的価値観認識能力の向上に向けた研究が期待される。
Thống kê
人間の回答分布と言語モデルの回答分布の距離が0.2以下の質問の割合は、Alpaca-7Bが11.1%、Vicuna-7B-v1.5が25.0%、Mixtral-8x7B-Instruct-v0.1が72.2%、GPT-3.5 Turboが75.0%
人間の回答分布と言語モデルの回答分布の距離が0.1以下の質問の割合は、Alpaca-7Bが0%、Vicuna-7B-v1.5が5.6%、Mixtral-8x7B-Instruct-v0.1が16.7%、GPT-3.5 Turboが33.3%
Trích dẫn
"言語モデルが安全で個人化された応答を生成するためには、多文化的価値観の認識が不可欠である。"
"WORLDVALUESBENCH」を活用して、言語モデルの多文化的価値観認識能力の向上に向けた研究が期待される。"