Die Autoren präsentieren einen neuartigen Ansatz, um monokulare 3D-Objektdetektoren durch die Verwendung von historischen, unmarkierten LiDAR-Daten zu verbessern. Obwohl LiDAR-basierte Detektoren eine beeindruckende Leistung erreichen, sind LiDAR-Sensoren aufgrund ihrer hohen Kosten für den breiten Einsatz in Serienfahrzeugen ungeeignet. Kamerabasierte Detektoren sind zwar günstiger, leiden aber unter einer schlechteren Leistung im Vergleich zu ihren LiDAR-basierten Pendants aufgrund der inhärenten Tiefenambiguität in Bildern.
Der vorgeschlagene Ansatz, AsyncDepth genannt, nutzt historische, unmarkierte LiDAR-Daten, die von anderen, mit LiDAR ausgestatteten Fahrzeugen gesammelt wurden. Durch die Projektion dieser LiDAR-Daten in die Kamerabilder können präzise Tiefenkarten erstellt werden, die dann als zusätzliche Merkmale in den monokularen Detektor integriert werden. Dieser End-to-End-trainierbare Ansatz zeigt konsistente und signifikante Leistungssteigerungen (bis zu 9 AP) über mehrere State-of-the-Art-Modelle und Datensätze hinweg, bei vernachlässigbaren zusätzlichen Latenzzeiten von 9,66 ms und geringen Speicherkosten.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Yurong You,C... um arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05139.pdfTiefere Fragen