Wie die Aufgabenanforderungen die Fähigkeiten kleinerer Sprachmodelle verschleiern können
Die Leistung von Sprachmodellen hängt nicht nur von ihrer zugrunde liegenden Kompetenz ab, sondern auch von den Anforderungen der Evaluierungsmethode. Modelle mit weniger Parametern und Trainingsdaten sind anfälliger für diese "Aufgabenanforderungen" und zeigen daher schlechtere Leistung in anspruchsvolleren Evaluierungen.