Der Beitrag präsentiert einen neuartigen Algorithmus, der automatisch eine explizite Approximation nichtlinearer modellprädiktiver Regelungsverfahren berechnet, während die Garantien für den geschlossenen Regelkreis erhalten bleiben.
Eine tiefe Verstärkungslernen-Steuerung wird entwickelt, um multiple unabhängige und zeitlich korrelierte stochastische Störungen in einem nichtlinearen flexiblen invertierten Pendelsystem mit unsicheren Modellparametern aktiv zu unterdrücken.
Unter der Bedingung der nichtlinearen Steuerbarkeit des Systems in eine Zielregion, die den Ursprung enthält, und der Vorwärtsinvarianz dieser Zielregion, wird ein regularisierter Lösungsansatz entwickelt, der aus einem "freien Endzeitpunkt"-Optimaltransfer-Problem in die Zielregion besteht und diese global asymptotisch stabil macht. Die Approximationen konvergieren zum optimalen unendlichen Horizont-Kostenfunktional, wenn die Größe der Zielregion gegen Null geht.
Durch die Verwendung der Zubov-Gleichung zur Charakterisierung des wahren Stabilitätsbereichs kann ein neuronales Regelungsverfahren entwickelt werden, das den Stabilitätsbereich deutlich vergrößert im Vergleich zu bestehenden Methoden.