Emergente Fähigkeiten von Sprachmodellen: Eine Analyse aus der Perspektive des Verlustfunktionswerts
Sprachmodelle zeigen emergente Fähigkeiten, wenn ihr Verlustfunktionswert während des Trainings unter einen bestimmten Schwellenwert fällt, unabhängig von Modellgröße oder Trainingsdatenmenge.