Kernkonzepte
Die Policy-Optimierung verbessert die Leistung des modellbasierten Controllers für PDE-Steuerung durch Feinabstimmung.
Statistiken
"Mit einer 32-fachen Dimensionalitätsreduktion im Modellieren reduziert die modellfreie PO die Kosten des modellbasierten LQ-Tracking-Controllers um 28,0%, 15,8% bzw. 36,4% nach nur wenigen Iterationen."
Zitate
"Unsere Methode bietet eine kostengünstige Alternative zur PDE-Steuerung unter Verwendung von End-to-End-Verstärkungslernen."
"PO mit einem Warmstart erreicht die beste Zielerfassung unter den drei Steuerungsstrategien."