本調査は、言語モデル(LLM)における文化的表現と包摂性を評価する39の最近の研究論文をレビューしたものである。
まず、文化の定義が曖昧であることが明らかになった。多くの研究では文化を明確に定義せず、特定の側面を表すプロキシを用いて評価している。これらのプロキシは、人口統計学的プロキシ(地域、言語、性別、人種、宗教など)と意味論的プロキシ(感情、価値観、食文化、社会的関係性など)に分類できる。
評価手法は主に黒箱アプローチで、文化的文脈を付加した入力に対するモデルの出力を分析する。識別的プローブと生成的プローブの2つのアプローチが用いられている。
分析の結果、モデルは主に価値観や目的といった一部の文化的側面しか捉えておらず、意味論的領域やアバウトネスなど重要な側面が十分に検討されていないことが明らかになった。また、手法の頑健性や状況依存性にも課題があることが指摘された。
今後の研究に向けては、文化の多面性を包括的に捉える定義の検討、未探索の文化的側面の分析、解釈可能で頑健な評価手法の開発、そして実応用に即した状況依存的な研究の必要性が示唆された。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor