Verbesserung der Generalisierung und Kalibrierung von vortrainierten Sprachmodellen durch Förderung der Darstellungsglättung
Durch die Minimierung der Normen der Jacobi- und Hessischen Matrizen in den Zwischenrepräsentationen von vortrainierten Sprachmodellen kann deren Robustheit, Generalisierung und Kalibrierung deutlich verbessert werden.