Die Studie präsentiert einen generativen Ansatz für das End-to-End-autonome Fahren, genannt GenAD. Anstatt die übliche serielle Verarbeitung von Wahrnehmung, Bewegungsvorhersage und Planung zu verwenden, modelliert GenAD autonomes Fahren als ein generatives Problem.
Zunächst wird eine instanzenzentrierte Szenenrepräsentation entwickelt, die Interaktionen zwischen Ego-Fahrzeug und anderen Agenten sowie Karteninformationen berücksichtigt. Dann wird ein variationelles Autoencoder-Modell verwendet, um eine strukturierte Latenzraumdarstellung realistischer Trajektorien zu lernen. Schließlich wird ein zeitliches Modell eingesetzt, um Bewegungen in diesem Latenzraum zu generieren und so gleichzeitig Bewegungsvorhersage und Planung durchzuführen.
Umfangreiche Experimente auf dem nuScenes-Benchmark zeigen, dass GenAD den aktuellen Stand der Technik bei der visionszentrierten Planung mit hoher Effizienz erreicht. Die instanzenzentrierte Szenenrepräsentation und die generative Modellierung der Trajektorien tragen wesentlich zu dieser Leistungsfähigkeit bei.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Wenzhao Zhen... في arxiv.org 04-09-2024
https://arxiv.org/pdf/2402.11502.pdfاستفسارات أعمق