Concetti Chiave
Eine neue Reformulierung des stochastischen optimalen Kontrollproblems, die den Koopman-Operator nutzt, führt zu einem Standard-LQR-Problem als Lösung.
Sintesi
Die Arbeit präsentiert eine neue Reformulierung des stochastischen optimalen Kontrollproblems, die den Koopman-Operator verwendet, um das Problem in ein Standard-LQR-Problem zu überführen.
Gliederung:
- Einleitung
- Deterministische Kontrolltheorie setzt vollständigen Zustandszugriff voraus, was in vielen Anwendungen nicht erfüllt ist
- Stochastische optimale Kontrolle (SOK) berücksichtigt die Unsicherheiten, ist aber in der Praxis aufgrund hoher Rechenkosten eingeschränkt
- Ziel ist es, das duale Kontrollproblem für allgemeine differenzierbare nichtlineare Systeme mit quadratischen Kosten zu lösen
- Problemformulierung
- Beschreibung des dynamischen Systems mit Zustand, Eingabe und Messung
- Formulierung des quadratischen Kostenfunktionals für die stochastische optimale Kontrolle
- Methodik
- Äquivalente Darstellung des Kostenfunktionals in Abhängigkeit der ersten beiden Momente des Zustands
- Propagation der Momente mittels erweitertem Kalman-Filter
- Einführung eines deterministischen Informationszustands zur Vermeidung der Erwartungsbildung über zukünftige Beobachtungen
- Umformulierung des Problems in eine bilineare Form, die die Anwendung des Koopman-Operators ermöglicht
- Überführung in ein Standard-LQR-Problem
- Numerisches Beispiel
- Anwendung des Ansatzes auf ein System mit variierender Beobachtbarkeit des Zustands
- Vergleich der Leistung des Koopman-basierten Reglers mit einem konventionellen LQR-Regler
- Schlussfolgerung
- Der Ansatz erfordert eine genaue Schätzung des Zustands durch den erweiterten Kalman-Filter
- Weitere Untersuchungen zur Ausnutzung der algebraischen Struktur des erweiterten Kalman-Filters und zur Einbeziehung von Deep Learning sind vielversprechend
Statistiche
Die Systemdynamik ist durch die folgenden Gleichungen gegeben:
xk+1 = f(xk, uk) + wk
yk = h(xk, uk) + vk
Dabei sind xk der Zustand, uk die Eingabe und yk die Messung. Die Störungen wk und vk sind unabhängig und normalverteilt mit Mittelwert 0 und Kovarianzen Σw bzw. Σv.
Citazioni
"Deterministische Kontrolltheorie trägt die implizite Annahme des vollständigen Zustandszugriffs, eine Bedingung, die in vielen interessierenden Anwendungen nicht erfüllt ist."
"Leider wird die SOK in der Praxis durch ihre hohe Rechenintensität behindert, was ihre Vorteile auf die konzeptionelle Ebene (Exploration vs. Ausbeutung, stochastische Röhren, Persistenz der Anregung) bei der Steuerungs-/Beobachterentwicklung, Experimentdesign und Systemidentifikation beschränkt."