Główne pojęcia
Die gleichzeitige Optimierung von Richtlinien und unbekannten Sicherheitsbeschränkungen in der Verstärkungslernung ist entscheidend für die Sicherheit in dynamischen Umgebungen.
Statystyki
"Wir schlagen einen neuartigen Ansatz vor, der gleichzeitig sichere RL-Richtlinien und STL-Sicherheitsparameter in einer Umgebung lernt."
"Die Ergebnisse zeigen, dass unser Framework sichere RL-Richtlinien erzeugt, die Belohnungen maximieren und Sicherheitsbeschränkungen einhalten."
"Die Leistung unseres Modells spiegelt die eines idealen Szenarios wider, das über vollständiges Vorwissen zu Sicherheitsbeschränkungen verfügt."
Cytaty
"Wir schlagen ein neuartiges Framework vor, das gleichzeitig sichere RL-Richtlinien und STL-Sicherheitsparameter in einer Umgebung lernt."
"Die Ergebnisse zeigen, dass unser Framework sichere RL-Richtlinien erzeugt, die Belohnungen maximieren und Sicherheitsbeschränkungen einhalten."