Die Studie untersucht, wie viele Sprachen für das Feintuning großer Sprachmodelle wie BLOOM-7B1 auf mehrsprachige Aufgaben benötigt werden. Die Autoren verwenden den Bactrian-X Datensatz mit 52 Sprachen und führen schrittweise Feintuning durch, indem sie eine Sprache nach der anderen hinzufügen.
Die Ergebnisse zeigen, dass die Leistung auf mehrsprachigen Benchmarks nicht linear mit der Anzahl der Sprachen im Feintuning-Datensatz zunimmt. In einigen Fällen kann das Hinzufügen weiterer Sprachen die Leistung verbessern, in anderen Fällen aber auch verschlechtern. Es gibt keine konsistente Antwort auf die optimale Anzahl von Sprachen. Die Auswirkungen des mehrsprachigen Feintunings hängen stark von der Aufgabe, den Sprachen und den Evaluationsmetriken ab.
Die Studie betont die Notwendigkeit systematischerer Untersuchungen zu Faktoren wie Basismodelle, Feintuning-Daten, Aufgaben und Evaluationsprotokolle, um die Effektivität und Verallgemeinerbarkeit des mehrsprachigen Feintunings besser zu verstehen.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Shaoxiong Ji... kl. arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04850.pdfDybere Forespørgsler