Eine empirische Studie zum katastrophalen Vergessen in großen Sprachmodellen während des kontinuierlichen Feinabstimmens
Große Sprachmodelle zeigen ein allgemeines Phänomen des katastrophalen Vergessens während des kontinuierlichen Feinabstimmens auf Instruktionsaufgaben. Die Schwere des Vergessens nimmt mit der Modellgröße zu, ist aber bei dekodierspezifischen Modellen wie BLOOMZ geringer als bei Encoder-Decoder-Modellen wie mT0. Allgemeine Instruktionsabstimmung kann das Vergessen in nachfolgenden Feinabstimmungsprozessen abmildern.