Основні поняття
Durch Hinzufügen einer Regularisierung zum PPO-Algorithmus können effektive und gleichzeitig menschenähnliche Fahrassistenten entwickelt werden, die in Fahrsimulationen besser mit menschlichen Fahrern koordinieren können.
Анотація
Der Artikel beschreibt einen Ansatz zur Entwicklung von Fahrassistenten für Fahrsimulationen, die sowohl effektiv als auch menschenähnlich sind. Dafür wird der PPO-Algorithmus um eine Regularisierung erweitert, die die Fahrassistenten dazu bringt, menschenähnlich zu fahren.
Die Kernpunkte sind:
- Bestehende Fahrassistenten in Simulationen sind entweder nicht menschenähnlich genug oder haben Probleme mit Stabilität und Koordination.
- Der vorgeschlagene Ansatz "Human-Regularized PPO" (HR-PPO) kombiniert Reinforcement Learning mit einer Regularisierung, die die Fahrassistenten dazu bringt, menschenähnlich zu fahren.
- HR-PPO Agenten erreichen eine hohe Zielerfüllungsrate von 93% bei gleichzeitig menschenähnlichem Fahrverhalten.
- HR-PPO Agenten zeigen deutliche Verbesserungen bei der Koordination mit menschlichen Fahrern, insbesondere in interaktiven Szenarien.
- Der Ansatz ermöglicht es, Effektivität und Realismus der Fahrassistenten gleichzeitig zu erreichen, was bisher eine Herausforderung darstellte.
Статистика
Die Zielerfüllungsrate der HR-PPO Agenten beträgt 93,35%.
Die Abweichung von menschlichen Fahrtrajectories (GC-ADE) der HR-PPO Agenten beträgt 0,54.
Die durchschnittlichen Abweichungen der Beschleunigung und Lenkung der HR-PPO Agenten von menschlichen Fahrern betragen 2,09 m/s² bzw. 0,02 rad.
Цитати
"Durch Hinzufügen einer Regularisierung zum PPO-Algorithmus können effektive und gleichzeitig menschenähnliche Fahrassistenten entwickelt werden, die in Fahrsimulationen besser mit menschlichen Fahrern koordinieren können."
"HR-PPO Agenten erreichen eine hohe Zielerfüllungsrate von 93% bei gleichzeitig menschenähnlichem Fahrverhalten."