Effiziente und menschenähnliche Fahrassistenten durch datenreguliertes Selbstspiel-Reinforcement-Learning
Durch Hinzufügen einer Regularisierung zum PPO-Algorithmus können effektive und gleichzeitig menschenähnliche Fahrassistenten entwickelt werden, die in Fahrsimulationen besser mit menschlichen Fahrern koordinieren können.