Die Policy-Optimierung verbessert die Leistung des modellbasierten Controllers für PDE-Steuerung durch Feinabstimmung.