Regularized Adaptive Momentum Dual Averaging mit einem effizienten inexakten Teilproblem-Löser zum Training strukturierter neuronaler Netzwerke
Ein Regularisierter Adaptiver Momentum Dual Averaging (RAMDA) Algorithmus, der eine lokal optimale Struktur in den trainierten Modellen garantiert und gleichzeitig eine hervorragende Vorhersageleistung erzielt.