Die Autoren präsentieren einen neuartigen Ansatz, um monokulare 3D-Objektdetektoren durch die Verwendung von historischen, unmarkierten LiDAR-Daten zu verbessern. Obwohl LiDAR-basierte Detektoren eine beeindruckende Leistung erreichen, sind LiDAR-Sensoren aufgrund ihrer hohen Kosten für den breiten Einsatz in Serienfahrzeugen ungeeignet. Kamerabasierte Detektoren sind zwar günstiger, leiden aber unter einer schlechteren Leistung im Vergleich zu ihren LiDAR-basierten Pendants aufgrund der inhärenten Tiefenambiguität in Bildern.
Der vorgeschlagene Ansatz, AsyncDepth genannt, nutzt historische, unmarkierte LiDAR-Daten, die von anderen, mit LiDAR ausgestatteten Fahrzeugen gesammelt wurden. Durch die Projektion dieser LiDAR-Daten in die Kamerabilder können präzise Tiefenkarten erstellt werden, die dann als zusätzliche Merkmale in den monokularen Detektor integriert werden. Dieser End-to-End-trainierbare Ansatz zeigt konsistente und signifikante Leistungssteigerungen (bis zu 9 AP) über mehrere State-of-the-Art-Modelle und Datensätze hinweg, bei vernachlässigbaren zusätzlichen Latenzzeiten von 9,66 ms und geringen Speicherkosten.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問