In dieser Arbeit wird ein Verfahren vorgestellt, um Lyapunov-Steuerfunktionen für hochdimensionale dynamische Systeme zu berechnen. Dazu wird das System in niedrigdimensionale Teilsysteme zerlegt, für die einzeln Lyapunov-Steuerfunktionen berechnet werden können. Diese zerlegten Lyapunov-Steuerfunktionen werden dann als Belohnungsformung in Reinforcement-Lernalgorithmen verwendet, um deren Lerneffizienz zu verbessern.
Das Verfahren wird anhand mehrerer Beispiele demonstriert, darunter ein Dubins-Car, ein Lunar Lander und ein Drohnenmodell. Die Ergebnisse zeigen, dass die Verwendung der zerlegten Lyapunov-Steuerfunktionen die Lernleistung deutlich verbessert im Vergleich zu Standard-Reinforcement-Lernalgorithmen. So benötigt der Ansatz mit zerlegter Lyapunov-Steuerfunktion weniger als die Hälfte der Trainingsdaten, um eine erfolgreiche Landung der Drohne zu lernen.
To Another Language
from source content
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Antonio Lope... lúc arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12210.pdfYêu cầu sâu hơn