Optimierung der Richtlinienpolitik über Untermannigfaltigkeiten für linear eingeschränkte Online-LQG-Probleme: Regretanalyse
In dieser Arbeit wird ein Algorithmus namens "Optimistic Online Newton on Manifold" (OONM) vorgeschlagen, der eine adaptive Steuerung für linear eingeschränkte Online-LQG-Probleme liefert. Der Algorithmus nutzt Vorhersagen der ersten und zweiten Ordnung der Kostenfunktionen, um eine sublineare Regretschranke in Bezug auf eine Sequenz lokal minimierender Regler zu erreichen.