Core Concepts
大規模言語モデルを活用して、多様な文化に関する共通感知知識を大規模に抽出し、質の高い知識ベースを構築する。
Abstract
本研究は、大規模言語モデルを活用して、多文化共通感知知識(CCSK)を効率的に抽出するMANGOという手法を提案している。
MANGOは2つのフェーズから構成される:
知識抽出フェーズ
概念ベースのアプローチと文化ベースのアプローチの2つのアプローチを組み合わせて、GPT-3.5を用いて大量のCCSK主張を生成する。
概念ベースのアプローチでは、既存の共通感知知識ベースから概念を取り出し、それに関する文化固有の主張を生成する。
文化ベースのアプローチでは、多様な文化グループを入力として、それらに関する共通感知主張を生成する。
主張の統合フェーズ
生成された主張を概念クラスタと文化クラスタに分類し、各クラスタ内の主張を統合する。
クラスタ代表文を生成することで、冗長性を抑えつつ、主張の質を高める。
最終的に、MANGOは167,396の高品質なCCSK主張を生成し、既存リソースを大きく上回る規模と質を実現した。
また、生成されたCCSK主張をインターカルチャーダイアログシステムに適用したところ、応答の具体性と文化的配慮が向上することが示された。
Stats
日本では、チップは一般的な慣行ではなく、失礼と見なされる可能性がある。
米国では、サービス業界でチップを支払うことが一般的で期待されている慣行である。
東洋諸国では、握手は一般的な挨拶の仕方ではなく、代わりに合掌(ワイ)をする。
西洋諸国では、握手が一般的な挨拶の仕方である。
Quotes
「日本では、チップを払うことは一般的な慣行ではなく、むしろ失礼と見なされる可能性がある。」
「米国では、サービス業界でチップを支払うことが一般的で期待されている慣行である。」
「東洋諸国では、握手ではなく、合掌(ワイ)が一般的な挨拶の仕方である。」
「西洋諸国では、握手が一般的な挨拶の仕方である。」