Core Concepts
多言語プロンプト翻訳器を導入し、ソース言語のプロンプトを適切に処理することで、言語知識を変換しつつタスク知識を維持し、言語間転移を促進する。
Abstract
本研究では、多言語プロンプト翻訳器(MPT)と呼ばれる新しい手法を提案している。MPTでは、ソース言語(例:英語)で学習したプロンプトを適切に翻訳し、ターゲット言語(例:ドイツ語)のプロンプトを生成する。
具体的には、以下の2つのタスクを同時に最適化する:
ソース言語のデータを使ってオリジナルのタスク(自然言語推論)を実行し、プロンプトにタスク知識を学習させる。
外部の平行コーパスを使って、ソース言語のプロンプトとターゲット言語のプロンプトの確率分布の整合性を高める翻訳タスクを実行し、プロンプトに多言語知識を注入する。
この2つのタスクを同時に学習することで、最終的に得られるターゲット言語のプロンプトは、オリジナルタスクの知識と多言語知識の両方を備えている。これにより、ターゲット言語のデータに対してより正確な推論が可能となる。
実験の結果、提案手法のMPTは、既存手法と比べて少量データ(4ショット)の設定で7.5%、多量データ(64ショット)の設定で3.1%の精度向上を達成した。特に、ソース言語と大きく異なる言語への転移では、従来手法に比べて18.4%の大幅な改善を示した。
Stats
少量データ(4ショット)設定でのMPTの精度は43.4%で、既存手法より7.5%高い。
多量データ(64ショット)設定でのMPTの精度は51.7%で、既存手法より3.1%高い。
ソース言語(英語)と大きく異なる言語(中国語)への転移では、MPTが従来手法より18.4%高い精度を示した。
Quotes
"MPTは、ソース言語のプロンプトを適切に翻訳し、ターゲット言語のプロンプトを生成することで、言語知識を変換しつつタスク知識を維持し、言語間転移を促進する。"
"実験の結果、MPTは少量データ設定で7.5%、多量データ設定で3.1%の精度向上を達成した。特に、ソース言語と大きく異なる言語への転移では、従来手法に比べて18.4%の大幅な改善を示した。"