Der Artikel befasst sich mit den Herausforderungen bei der Erstellung mehrsprachiger Sprachmodelle. Er stellt zunächst das Multilingual Instruction-Tuning Dataset (MITDS) vor, das aus übersetzten Versionen der Alpaca-52K- und Dolly-15K-Datensätze in 132 Sprachen besteht.
Anschließend wird die neue TaCo-Methode (Translation-Assisted Cross-Linguality) vorgestellt, die Übersetzungen in einem Kette-von-Gedanken-Prozess nutzt, um Sprachmodelle durch ein Curriculum-Lernverfahren auf neue Sprachen abzustimmen. Dies soll die Erstellung mehrsprachiger Sprachmodelle, auch für Sprachen mit geringen Ressourcen, zu einem angemessenen Preis ermöglichen.
Die Autoren evaluieren vier TaCo-Modelle auf dem Vicuna-Benchmark in drei Sprachen mit geringen Ressourcen (Nepali, Sanskrit, Maithili) sowie einer Hochsprache (Persisch). Die Ergebnisse zeigen, dass die TaCo-Methode beeindruckende Leistungen erzielt, insbesondere für Sprachen mit geringen Ressourcen. So erreicht das TaCo-Modell für Nepali eine Genauigkeit von 82% auf dem Vicuna-Benchmark, was eine Verdopplung der Leistung im Vergleich zur alleinigen Feinabstimmung darstellt.
Abschließend diskutieren die Autoren die Vor- und Nachteile des TaCo-Ansatzes und geben einen Ausblick auf zukünftige Arbeiten.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문