Vorhersage der Sprachmodellleistung durch Optimierung der Datenmischung
Die Mischungsverhältnisse der Trainingsdaten für große Sprachmodelle haben einen entscheidenden Einfluss auf deren Leistungsfähigkeit. Durch die Entdeckung quantitativer Gesetzmäßigkeiten zwischen Datenmischung und Modellleistung können diese Mischungsverhältnisse effizient optimiert werden.