Verwendung von Verstärkendem Lernen zur direkten Maximierung der Aufgabenerfüllung von vereinfachten Modellen in Kombination mit dem MPC-Planer.