Boosting Gradient-Based Optimizers durch Gewichtsvorhersage
Die Arbeit stellt einen allgemeinen Trainingsrahmen namens XGrad vor, der Gewichtsvorhersage in gängige gradientenbasierte Optimierer integriert, um deren Konvergenz und Generalisierung beim Training von Tiefenlernmodellen zu verbessern.