Concepts de base
LDTR, ein neuartiges Transformator-basiertes Modell, adressiert die Herausforderungen der Spurerkennung, indem es eine neuartige Anker-Ketten-Darstellung verwendet und eine multi-referenzierte deformierbare Aufmerksamkeitsmodule sowie zusätzliche Hilfszweige integriert, um die Leistung in Szenarien mit wenigen oder keinen visuellen Hinweisen sowie bei komplexen Spurgeometrien zu verbessern.
Résumé
Der Artikel stellt LDTR, ein Transformator-basiertes Modell zur Spurerkennung, vor. LDTR verwendet eine neuartige Anker-Ketten-Darstellung, um Spuren als ganzheitliche Entitäten zu modellieren, anstatt sie als isolierte Punkte oder Keypoints darzustellen. Dies ermöglicht es LDTR, komplexe Spurgeometrien wie U-Turns, T-Kreuzungen und Kreisverkehre inherent zu handhaben, ohne aufwendige nachgelagerte Verarbeitungsschritte.
Darüber hinaus integriert LDTR ein multi-referenziertes deformierbares Aufmerksamkeitsmodul, um die Positionsinformationen der Anker-Kette effizient in das Netzwerk einzubinden und die Aufmerksamkeit gleichmäßig um die Ziele herum zu verteilen. Dies verbessert die Wahrnehmungsfähigkeit des Modells in Szenarien mit wenigen oder keinen visuellen Hinweisen.
Zusätzlich führt LDTR zwei neuartige Line-IoU-Algorithmen ein, um die Trainingseffizienz und Inferenzleistung zu verbessern. Eine Gauß'sche Heatmap-Hilfszweig wird ebenfalls integriert, um die Darstellungsfähigkeit des Modells weiter zu verbessern.
Umfangreiche Experimente auf bekannten Datensätzen zeigen, dass LDTR den aktuellen Stand der Technik übertrifft, insbesondere in Szenarien mit wenigen oder keinen visuellen Hinweisen sowie bei komplexen Spurgeometrien.
Stats
Die Spurerkennung ist eine wichtige Komponente für autonomes Fahren, bei der die Wahrnehmung von Fahrspuren, insbesondere bei schlechten Sichtbedingungen oder komplexen Straßenszenarien, eine entscheidende Rolle spielt.
Traditionelle Methoden der Bildverarbeitung zeigen in einfachen Szenarien gute Leistung, sind aber in komplexen Realweltszenarien nicht robust genug.
Neuere Deep-Learning-basierte Ansätze haben deutlich bessere Generalisierung und Robustheit gezeigt, sind aber immer noch mit Herausforderungen konfrontiert, wie z.B. der Trennung benachbarter Spuren oder der Beschreibung komplexer Spurgeometrien.
Citations
"Trotz jüngster Fortschritte bei Spurerkennungsmethoden bleiben Szenarien mit begrenzten oder keinen visuellen Hinweisen auf Spuren aufgrund von Faktoren wie Beleuchtungsbedingungen und Verdeckung weiterhin eine Herausforderung und entscheidend für das automatisierte Fahren."
"Fast alle Methoden [5, 6, 13–17] gehen davon aus, dass sich Spuren vom unteren Bildrand nach oben erstrecken, so dass sie Fälle wie die in der ersten drei Spalten von Abb. 2 nicht erkennen können."