Sicheres Verstärkungslernen

Bejelentkezés

betekintés - Sicheres Verstärkungslernen

Effizientes Lernen sicherer Verhaltensweisen durch Nachahmung guter und Vermeidung schlechter Trajektorien

Der Kern dieser Arbeit ist ein neuartiger Ansatz für sicheres Verstärkungslernen, der darauf abzielt, die Verhaltensweisen guter Trajektorien nachzuahmen und schlechte Trajektorien zu vermeiden, anstatt sich auf die Schätzung von Kostenfunktionen zu verlassen.

Effizientes sicheres Verstärkungslernen durch hierarchische adaptive Chance-Constraint-Sicherungen

Adaptive Chance-Constraint-Sicherungen (ACS) gewährleisten Sicherheit und Optimierung im Verstärkungslernen.

Lernen von Richtlinien und unbekannten Sicherheitsbeschränkungen in der Verstärkungslernung

Die gleichzeitige Optimierung von Richtlinien und unbekannten Sicherheitsbeschränkungen in der Verstärkungslernung ist entscheidend für die Sicherheit in dynamischen Umgebungen.

Sicheres Verstärkungslernen an einem simulierten Roboterarm

Sicheres Verstärkungslernen ermöglicht optimale Politiken unter Berücksichtigung von Sicherheitsbeschränkungen.

Rólunk

Termékek

Forrásanyagok