この研究は、英語で主に訓練されたLLMの機能を他の言語に拡張するためにローマ字化を使用する方法を提案しています。ローマ字化は、英語と非ラテン文字で書かれた他の言語との間に橋渡しとなります。実験では、少数ショットプロンプティング、継続的事前トレーニング、およびさまざまなタスクでの指示チューニングが含まれています。また、ローマ字化データの使用は推論速度を向上させ、最大処理可能なシーケンス長を増やし、メモリ要件を2倍から4倍削減します。結果として、ローマ字化表現は効率的であり、ネイティブスクリプト表現と競合力があるかそれ以上のパフォーマンスを提供します。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Jaavid Aktar... في arxiv.org 03-11-2024
https://arxiv.org/pdf/2401.14280.pdfاستفسارات أعمق