Der Artikel stellt ein neues Paradigma für End-to-End-Autonomes Fahren namens SparseAD vor. Im Gegensatz zu früheren dichten BEV-zentrierten Methoden repräsentiert SparseAD die gesamte Fahrszenerie durch sparse Queries, ohne dichte BEV-Darstellungen zu verwenden.
Die Kernelemente sind:
Sparse Perception: SparseAD vereinheitlicht Wahrnehmungsaufgaben wie Objekterkennung, -verfolgung und Online-Kartierung in einer komplett sparsamen Architektur. Mehrere Decoder und Köpfe aggregieren die Sensor-Tokens in verschiedene Arten von Perception-Queries, die den gesamten Fahrzustand darstellen.
Motion Planner: Basierend auf den Perception-Queries modelliert der Motion Planer die Interaktionen zwischen Ego-Fahrzeug und anderen Agenten sowie Fahrbeschränkungen, um eine gerechtfertigtere Bewegungsvorhersage und -planung zu ermöglichen.
Effizienz: Durch die sparse Darstellung ist SparseAD deutlich effizienter als dichte BEV-zentrierte Methoden und kann von leistungsfähigeren Rückgratnetzen und größeren Datensätzen profitieren.
Experimente auf dem herausfordernden nuScenes-Datensatz zeigen, dass SparseAD die beste Gesamtleistung unter End-to-End-Methoden erreicht und den Leistungsunterschied zu Einzelaufgaben-Methoden deutlich verringert.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Diankun Zhan... lúc arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.06892.pdfYêu cầu sâu hơn