Der Artikel stellt LDTR, ein Transformator-basiertes Modell zur Spurerkennung, vor. LDTR verwendet eine neuartige Anker-Ketten-Darstellung, um Spuren als ganzheitliche Entitäten zu modellieren, anstatt sie als isolierte Punkte oder Keypoints darzustellen. Dies ermöglicht es LDTR, komplexe Spurgeometrien wie U-Turns, T-Kreuzungen und Kreisverkehre inherent zu handhaben, ohne aufwendige nachgelagerte Verarbeitungsschritte.
Darüber hinaus integriert LDTR ein multi-referenziertes deformierbares Aufmerksamkeitsmodul, um die Positionsinformationen der Anker-Kette effizient in das Netzwerk einzubinden und die Aufmerksamkeit gleichmäßig um die Ziele herum zu verteilen. Dies verbessert die Wahrnehmungsfähigkeit des Modells in Szenarien mit wenigen oder keinen visuellen Hinweisen.
Zusätzlich führt LDTR zwei neuartige Line-IoU-Algorithmen ein, um die Trainingseffizienz und Inferenzleistung zu verbessern. Eine Gauß'sche Heatmap-Hilfszweig wird ebenfalls integriert, um die Darstellungsfähigkeit des Modells weiter zu verbessern.
Umfangreiche Experimente auf bekannten Datensätzen zeigen, dass LDTR den aktuellen Stand der Technik übertrifft, insbesondere in Szenarien mit wenigen oder keinen visuellen Hinweisen sowie bei komplexen Spurgeometrien.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Zhongyu Yang... alle arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14354.pdfDomande più approfondite