Der Artikel befasst sich mit den Herausforderungen bei der Erstellung mehrsprachiger Sprachmodelle. Er stellt zunächst das Multilingual Instruction-Tuning Dataset (MITDS) vor, das aus übersetzten Versionen der Alpaca-52K- und Dolly-15K-Datensätze in 132 Sprachen besteht.
Anschließend wird die neue TaCo-Methode (Translation-Assisted Cross-Linguality) vorgestellt, die Übersetzungen in einem Kette-von-Gedanken-Prozess nutzt, um Sprachmodelle durch ein Curriculum-Lernverfahren auf neue Sprachen abzustimmen. Dies soll die Erstellung mehrsprachiger Sprachmodelle, auch für Sprachen mit geringen Ressourcen, zu einem angemessenen Preis ermöglichen.
Die Autoren evaluieren vier TaCo-Modelle auf dem Vicuna-Benchmark in drei Sprachen mit geringen Ressourcen (Nepali, Sanskrit, Maithili) sowie einer Hochsprache (Persisch). Die Ergebnisse zeigen, dass die TaCo-Methode beeindruckende Leistungen erzielt, insbesondere für Sprachen mit geringen Ressourcen. So erreicht das TaCo-Modell für Nepali eine Genauigkeit von 82% auf dem Vicuna-Benchmark, was eine Verdopplung der Leistung im Vergleich zur alleinigen Feinabstimmung darstellt.
Abschließend diskutieren die Autoren die Vor- und Nachteile des TaCo-Ansatzes und geben einen Ausblick auf zukünftige Arbeiten.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Bibek Upadha... lúc arxiv.org 04-08-2024
https://arxiv.org/pdf/2311.10797.pdfYêu cầu sâu hơn