Die Autoren präsentieren ein kostengünstiges Verfahren zur Generierung von Pseudo-LiDAR-Punktwolken für seltene Objektklassen, um die Klassenerkennung in 3D-Objekterkennungsmodellen zu verbessern.
Zunächst wird aus Videoaufnahmen von Miniaturmodellen und öffentlichen Videos eine 3D-Volumendarstellung der Objekte rekonstruiert. Diese wird dann in eine LiDAR-ähnliche Punktwolke überführt, indem die räumliche Verteilung und Intensität der Punkte an reale LiDAR-Daten angepasst wird.
Die generierten Pseudo-LiDAR-Punktwolken werden anschließend in die Trainingsdatensätze integriert, indem sie unter Berücksichtigung von Bodenfläche und Kartendaten an geeigneten Stellen in die Szenen eingefügt werden.
Die Experimente auf gängigen Benchmarks wie nuScenes, KITTI und Lyft zeigen, dass diese Augmentierung die Erkennungsleistung für seltene Objektklassen deutlich verbessert, ohne die Leistung für häufige Klassen zu beeinträchtigen.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Mincheol Cha... في arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11573.pdfاستفسارات أعمق