核心概念
地理的要因が言語モデルの推論能力に大きな影響を与えることを示す。特に、インドネシアの11州にわたる多様な文化を対象とした評価により、最先端の言語モデルでも文化的常識推論に課題があることが明らかになった。
要約
本研究は、地理的要因が言語モデルの推論能力に及ぼす影響を理解することを目的としている。特に、インドネシアの11州にわたる多様な文化を対象とした「IndoCulture」データセットを構築した。
データ構築では、各州の地元住民が参加し、12の細分化されたトピックに基づいて文化的な文脈と選択肢を手作業で開発した。これにより、テンプレートや自動スクレイピングを用いた従来の手法に比べ、ノイズの少ない高品質なデータセットを作成できた。
評価の結果、最先端の言語モデルでも文化的常識推論に課題があることが明らかになった。最高精度は53.2%にとどまり、特定の州(バリ州、西ジャワ州)では高い精度を示すものの、他の州では低い精度にとどまった。また、位置情報を追加することで、特に大規模モデルの性能が向上し、地理的コンテキストの重要性が示された。
統計
最高精度は53.2%にとどまり、人間の100%精度と大きな差がある。
特定の州(バリ州、西ジャワ州)では高い精度を示すが、他の州では低い精度にとどまる。
位置情報を追加することで、特に大規模モデルの性能が向上する。