核心概念
Sparse Laneformer ist ein einfaches und effektives transformerbasiertes Verfahren zur Spurerkennung, das auf einem Mechanismus mit spärlichen Ankern basiert. Es erzeugt dynamische Anker durch positionsabhängige Abfragen zu Spuren und Winkeln, anstatt auf herkömmliche explizite Anker zu setzen. Das Verfahren übertrifft den Stand der Technik bei geringerem Rechenaufwand.
摘要
Sparse Laneformer ist ein neuer Ansatz zur Spurerkennung, der auf Transformern basiert und einen Mechanismus mit spärlichen Ankern verwendet. Im Gegensatz zu früheren Methoden, die auf sehr dichten Ankern basieren, generiert Sparse Laneformer dynamische Anker durch die Interaktion von positionsabhängigen Spur- und Winkelabfragen.
Das Verfahren besteht aus einem zweistufigen Transformer-Decoder. In der ersten Stufe werden die Anker durch Horizontal-Perzeptionsaufmerksamkeit (HPA) und Spur-Winkel-Kreuzaufmerksamkeit (LACA) erzeugt. Eine dynamische Spurvorhersage kombiniert dann die Anker mit vorhergesagten Versätzen, um die Spuren zu erhalten.
In der zweiten Stufe werden die Spur-Abfragen und Winkel-Abfragen weiter verfeinert, um genauere Spurvorhersagen zu erhalten. Dazu wird eine Spur-Perzeptionsaufmerksamkeit (LPA) eingeführt, die die Spur-Abfragen mit den Ergebnissen der ersten Stufe in Beziehung setzt.
Umfangreiche Experimente zeigen, dass Sparse Laneformer den Stand der Technik übertrifft, z.B. um 3,0 Prozentpunkte beim F1-Score auf CULane, bei gleichzeitig geringerem Rechenaufwand. Die Methode ist einfach zu implementieren und end-to-end trainierbar.
統計資料
Die Sparse Laneformer-Methode erzielt auf dem CULane-Datensatz einen F1-Score von 77,77 % mit einem ResNet-34-Rückgrat, was eine Verbesserung von 3,07 Prozentpunkten gegenüber der Laneformer-Methode darstellt.
Auf dem TuSimple-Datensatz erreicht Sparse Laneformer mit einem ResNet-34-Rückgrat einen F1-Score von 96,81 % und eine Genauigkeit von 95,69 %, was vergleichbar mit den besten Methoden ist.
Auf dem LLAMAS-Datensatz erzielt Sparse Laneformer mit einem ResNet-34-Rückgrat einen F1-Score von 96,56 %, was eine Verbesserung von 1,6 Prozentpunkten gegenüber der LaneATT-Methode darstellt.
引述
"Unsere Sparse Laneformer-Methode erzielt hohe Genauigkeit bei gleichzeitig geringerem Rechenaufwand, indem sie auf einem Mechanismus mit spärlichen Ankern basiert."
"Im Gegensatz zu früheren Methoden, die auf sehr dichten Ankern basieren, generiert Sparse Laneformer dynamische Anker durch die Interaktion von positionsabhängigen Spur- und Winkelabfragen."
"Umfangreiche Experimente zeigen, dass Sparse Laneformer den Stand der Technik übertrifft und gleichzeitig einfach zu implementieren und end-to-end trainierbar ist."