本論文は、近年の研究動向を包括的に調査し、多言語モデルにおける交差言語アライメントの定義、測定方法、および向上手法について整理している。
まず、交差言語アライメントには「表現の類似性」と「タスク性能の転移」の2つの定義があることを示す。前者は単語や文の意味的類似性を言語間で保持することを目指し、後者はタスク特有の特徴を言語間で共有することを目指す。
次に、これらの定義に基づいて提案されている様々な手法を分類している。主なものは以下の通り:
これらの手法は主にエンコーダモデルを対象としているが、生成モデルにおける交差言語アライメントの課題も議論している。生成モデルでは言語非依存な特徴と言語依存な特徴のバランスを取ることが重要となる。
最後に、現状の知見と今後の研究課題を整理している。特に、多言語性の評価が主にEnglish-centricであること、生成モデルにおける交差言語アライメントの新たな課題などを指摘している。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Kath... klokken arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06228.pdfDypere Spørsmål