核心概念
Die Anzahl der Sprachen, der Sprachexposition und der Ähnlichkeit sind wichtige Aspekte, die bei der Auswahl der Sprachen für das Feintuning berücksichtigt werden müssen. Das Feintuning großer mehrsprachiger Modelle auf 1 bis 52 Sprachen zeigt, dass es keine konsistente Antwort auf die optimale Anzahl von Sprachen für mehrsprachiges Feintuning gibt. Die optimale Anzahl hängt von der Sprachähnlichkeit und der Zielaufgabe ab.
摘要
Die Studie untersucht, wie viele Sprachen für das Feintuning großer Sprachmodelle wie BLOOM-7B1 auf mehrsprachige Aufgaben benötigt werden. Die Autoren verwenden den Bactrian-X Datensatz mit 52 Sprachen und führen schrittweise Feintuning durch, indem sie eine Sprache nach der anderen hinzufügen.
Die Ergebnisse zeigen, dass die Leistung auf mehrsprachigen Benchmarks nicht linear mit der Anzahl der Sprachen im Feintuning-Datensatz zunimmt. In einigen Fällen kann das Hinzufügen weiterer Sprachen die Leistung verbessern, in anderen Fällen aber auch verschlechtern. Es gibt keine konsistente Antwort auf die optimale Anzahl von Sprachen. Die Auswirkungen des mehrsprachigen Feintunings hängen stark von der Aufgabe, den Sprachen und den Evaluationsmetriken ab.
Die Studie betont die Notwendigkeit systematischerer Untersuchungen zu Faktoren wie Basismodelle, Feintuning-Daten, Aufgaben und Evaluationsprotokolle, um die Effektivität und Verallgemeinerbarkeit des mehrsprachigen Feintunings besser zu verstehen.
統計資料
Das Feintuning auf Chinesisch verbessert die Leistung auf dem XCOPA-Datensatz, mit einem Spitzenwert, wenn Bengalisch hinzugefügt wird.
Für Englisch und Chinesisch auf dem XStoryCloze-Datensatz führt das Hinzufügen von Lettisch und Malaiisch zu Leistungsverbesserungen.
Auf dem XWinograd-Datensatz ist mehrsprachiges Feintuning schädlich für die Leistung im Vergleich zum Basismodell.
引述
"Entgegen früherer Forschung kann das Hinzufügen von mehr Sprachen über eine Handvoll hinaus die Genauigkeit weiter verbessern, wenn auch mit einigen Ausreißerfällen und abnehmenden Erträgen."
"Angesichts der 52 untersuchten Sprachen gibt es keine konsistente Antwort auf die optimale Anzahl von Sprachen für mehrsprachiges Feintuning. Die optimale Anzahl der Instruktionssprachen hängt von der Sprachähnlichkeit und der Zielaufgabe ab."