Keskeiset käsitteet
オンラインコミュニティから収集した自己語りデータを活用し、文化に配慮した言語技術の実現を目指す。
Tiivistelmä
本研究では、オンラインコミュニティから収集した自己語りデータを活用し、文化知識ベース「CultureBank」を構築しました。CultureBankには、TikTokから12,000件、Redditから11,000件の文化記述が含まれています。従来の文化知識リソースとは異なり、CultureBankには文化記述に対する多様な意見が含まれ、文化知識の柔軟な解釈を可能にしています。また、具体的な文化シナリオも提供されており、文化に配慮した言語技術の評価に役立ちます。
CultureBankを用いて、大規模言語モデルの文化に対する認識を評価した結果、改善の余地があることが明らかになりました。さらに、CultureBankでファインチューニングを行うことで、文化関連のタスクにおいて性能が向上することを示しました。
最後に、文化に配慮した言語技術の実現に向けた提言を行っています。文化知識データの収集源の多様化、文化の多面的な側面の考慮、文化適応プロセスの分析、文化認識の適切な評価方法の検討などが重要であると指摘しています。
Tilastot
海外旅行中、フランスでは電気代の支払いや運転習慣に文化ショックを感じる。
アメリカ人は「ひよこ豆」と「ガルバンゾ豆」を同じものと考えている。
イタリアンアメリカ人は、イタリアとの絆の強さが個人によって異なる。
中国人は携帯決済に強く依存している。
南アフリカでは、一部の人は価格と税金を別々に計算することに不便を感じるが、他の人は気にしていない。
Lainaukset
「グローバルに、人々は文化の多様性に誇りと尊重を示しつつ、文化的偏見の解消に向けて取り組んでいる」
「文化は時間とともに変化する流動的なものであり、文化適応プロセスの理解が重要である」