핵심 개념
SparseAD ist ein neuartiges Paradigma für End-to-End-Autonomes Fahren, das die gesamte Fahrszenerie durch sparse Queries ohne dichte BEV-Darstellung repräsentiert. Es vereinheitlicht Wahrnehmungsaufgaben wie Erkennung, Verfolgung und Online-Kartierung in einer komplett sparsamen Architektur und ermöglicht eine gerechtfertigtere Bewegungsvorhersage und -planung.
초록
Der Artikel stellt ein neues Paradigma für End-to-End-Autonomes Fahren namens SparseAD vor. Im Gegensatz zu früheren dichten BEV-zentrierten Methoden repräsentiert SparseAD die gesamte Fahrszenerie durch sparse Queries, ohne dichte BEV-Darstellungen zu verwenden.
Die Kernelemente sind:
-
Sparse Perception: SparseAD vereinheitlicht Wahrnehmungsaufgaben wie Objekterkennung, -verfolgung und Online-Kartierung in einer komplett sparsamen Architektur. Mehrere Decoder und Köpfe aggregieren die Sensor-Tokens in verschiedene Arten von Perception-Queries, die den gesamten Fahrzustand darstellen.
-
Motion Planner: Basierend auf den Perception-Queries modelliert der Motion Planer die Interaktionen zwischen Ego-Fahrzeug und anderen Agenten sowie Fahrbeschränkungen, um eine gerechtfertigtere Bewegungsvorhersage und -planung zu ermöglichen.
-
Effizienz: Durch die sparse Darstellung ist SparseAD deutlich effizienter als dichte BEV-zentrierte Methoden und kann von leistungsfähigeren Rückgratnetzen und größeren Datensätzen profitieren.
Experimente auf dem herausfordernden nuScenes-Datensatz zeigen, dass SparseAD die beste Gesamtleistung unter End-to-End-Methoden erreicht und den Leistungsunterschied zu Einzelaufgaben-Methoden deutlich verringert.
통계
Die Methode SparseAD erreicht eine durchschnittliche Präzision (mAP) von 47,5% und einen Normalized Detection Score (NDS) von 57,8% für 3D-Objekterkennung.
Für Multi-Objekt-Verfolgung (AMOTA) erreicht SparseAD 53,0% und eine Recall-Rate von 60,8%.
Bei der Online-Kartierung erzielt SparseAD eine mAP von 34,2%.
Für Bewegungsvorhersage erreicht SparseAD einen minimalen durchschnittlichen Positionsfehler (minADE) von 0,83m und einen minimalen endgültigen Positionsfehler (minFDE) von 1,58m.
In der Bewegungsplanung hat SparseAD einen durchschnittlichen L2-Fehler von 0,35m und eine Kollisionsrate von nur 0,09%.
인용구
"SparseAD ist ein neuartiges Paradigma für End-to-End-Autonomes Fahren, das die gesamte Fahrszenerie durch sparse Queries ohne dichte BEV-Darstellung repräsentiert."
"SparseAD vereinheitlicht Wahrnehmungsaufgaben wie Objekterkennung, -verfolgung und Online-Kartierung in einer komplett sparsamen Architektur."
"Durch die sparse Darstellung ist SparseAD deutlich effizienter als dichte BEV-zentrierte Methoden und kann von leistungsfähigeren Rückgratnetzen und größeren Datensätzen profitieren."