Die Studie präsentiert einen generativen Ansatz für das End-to-End-autonome Fahren, genannt GenAD. Anstatt die übliche serielle Verarbeitung von Wahrnehmung, Bewegungsvorhersage und Planung zu verwenden, modelliert GenAD autonomes Fahren als ein generatives Problem.
Zunächst wird eine instanzenzentrierte Szenenrepräsentation entwickelt, die Interaktionen zwischen Ego-Fahrzeug und anderen Agenten sowie Karteninformationen berücksichtigt. Dann wird ein variationelles Autoencoder-Modell verwendet, um eine strukturierte Latenzraumdarstellung realistischer Trajektorien zu lernen. Schließlich wird ein zeitliches Modell eingesetzt, um Bewegungen in diesem Latenzraum zu generieren und so gleichzeitig Bewegungsvorhersage und Planung durchzuführen.
Umfangreiche Experimente auf dem nuScenes-Benchmark zeigen, dass GenAD den aktuellen Stand der Technik bei der visionszentrierten Planung mit hoher Effizienz erreicht. Die instanzenzentrierte Szenenrepräsentation und die generative Modellierung der Trajektorien tragen wesentlich zu dieser Leistungsfähigkeit bei.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Wenzhao Zhen... alle arxiv.org 04-09-2024
https://arxiv.org/pdf/2402.11502.pdfDomande più approfondite