Dieser Artikel stellt FUSION vor, ein neuartiges Verfahren für sicherheitsbewusstes Offline-Reinforcement-Learning in autonomen Fahrzeugen. FUSION nutzt eine sicherheitsbewusste kausale Transformator-Architektur, um die Beziehungen zwischen Zustand, Aktion, Belohnung und Kosten zu modellieren. Darüber hinaus wird ein selbstüberwachtes Lernverfahren auf Basis von Bisimulation eingesetzt, um die Darstellung weiter zu verbessern und eine gute Balance zwischen Sicherheit und Effizienz zu erreichen.
Die Autoren führen umfangreiche Experimente in verschiedenen Fahrzeugsimulationsumgebungen durch, die zeigen, dass FUSION deutlich bessere Ergebnisse in Bezug auf Sicherheit und Generalisierbarkeit erzielt als bestehende Methoden aus dem Bereich des sicheren Imitation Learning und Offline-Reinforcement-Learning. Insbesondere in Szenarien mit Verteilungsverschiebungen zwischen Trainings- und Testumgebungen übertrifft FUSION die Vergleichsverfahren deutlich.
Die Ablationsstudien belegen, dass sowohl die kausale Darstellung als auch das sicherheitsbewusste Bisimulations-Lernen wichtige Beiträge zur Leistungsfähigkeit von FUSION leisten. Darüber hinaus liefert die Visualisierung der Aufmerksamkeitsgewichte im Transformator-Modell interessante Einblicke in die Funktionsweise von FUSION.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor