Die Studie präsentiert einen generativen Ansatz für das End-to-End-autonome Fahren, genannt GenAD. Anstatt die übliche serielle Verarbeitung von Wahrnehmung, Bewegungsvorhersage und Planung zu verwenden, modelliert GenAD autonomes Fahren als ein generatives Problem.
Zunächst wird eine instanzenzentrierte Szenenrepräsentation entwickelt, die Interaktionen zwischen Ego-Fahrzeug und anderen Agenten sowie Karteninformationen berücksichtigt. Dann wird ein variationelles Autoencoder-Modell verwendet, um eine strukturierte Latenzraumdarstellung realistischer Trajektorien zu lernen. Schließlich wird ein zeitliches Modell eingesetzt, um Bewegungen in diesem Latenzraum zu generieren und so gleichzeitig Bewegungsvorhersage und Planung durchzuführen.
Umfangreiche Experimente auf dem nuScenes-Benchmark zeigen, dass GenAD den aktuellen Stand der Technik bei der visionszentrierten Planung mit hoher Effizienz erreicht. Die instanzenzentrierte Szenenrepräsentation und die generative Modellierung der Trajektorien tragen wesentlich zu dieser Leistungsfähigkeit bei.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Wenzhao Zhen... kl. arxiv.org 04-09-2024
https://arxiv.org/pdf/2402.11502.pdfDybere Forespørgsler