核心概念
言語モデルの適応アダプター統合を通じたクロスリンガル転送の効果的な手法を提案する。
要約
この論文では、新しいクロスリンガル転送手法であるAdaMergeXが提案されています。この手法は、ターゲット言語でのターゲットタスクの能力を「タスク能力」と「言語能力」に分割し、適応アダプター統合によってこれらをマージします。実験結果は、AdaMergeXがすべての設定で優れたパフォーマンスを発揮していることを示しています。
統計
AdaMergeXは他のすべての設定で優れたパフォーマンスを発揮しています。
LoRAと(IA)3においても一貫した良好な結果が得られました。
AdaMergeXは従来のアダプター統合方法よりも優れた性能を示しています。
引用
"Based on this assumption, we propose a new cross-lingual transfer method called AdaMergeX that utilizes adaptive adapter merging."
"Furthermore, we propose a structure-adaptive adapter merging method."
"Our evaluation demonstrates that AdaMergeX consistently outperforms other state-of-the-art methods including model merging, prompting, and general adapter merging methods."