核心概念
Durch die Generierung von Pseudo-LiDAR-Punktwolken aus Miniaturmodellen und öffentlichen Videos können seltene Objektklassen effektiv in Trainingsdatensätze für 3D-Objekterkennung integriert werden, um die Erkennungsleistung für diese Klassen zu verbessern.
摘要
Die Autoren präsentieren ein kostengünstiges Verfahren zur Generierung von Pseudo-LiDAR-Punktwolken für seltene Objektklassen, um die Klassenerkennung in 3D-Objekterkennungsmodellen zu verbessern.
Zunächst wird aus Videoaufnahmen von Miniaturmodellen und öffentlichen Videos eine 3D-Volumendarstellung der Objekte rekonstruiert. Diese wird dann in eine LiDAR-ähnliche Punktwolke überführt, indem die räumliche Verteilung und Intensität der Punkte an reale LiDAR-Daten angepasst wird.
Die generierten Pseudo-LiDAR-Punktwolken werden anschließend in die Trainingsdatensätze integriert, indem sie unter Berücksichtigung von Bodenfläche und Kartendaten an geeigneten Stellen in die Szenen eingefügt werden.
Die Experimente auf gängigen Benchmarks wie nuScenes, KITTI und Lyft zeigen, dass diese Augmentierung die Erkennungsleistung für seltene Objektklassen deutlich verbessert, ohne die Leistung für häufige Klassen zu beeinträchtigen.
統計資料
"Die Anzahl der Objekte in der nuScenes-Validierungsmenge beträgt für Busse 3009, für Baufahrzeuge 2387, für Anhänger 3765, für Lkw 13950, für Motorräder 2227 und für Fahrräder 2071."
"Die Anzahl der Objekte in der Lyft-Validierungsmenge beträgt für Lkw 2721, für Busse 1653, für andere Fahrzeuge 4920, für Motorräder 187 und für Fahrräder 3347."
"Die Anzahl der Objekte in der KITTI-Validierungsmenge beträgt für Radfahrer 290, für Autos 262 und für Fußgänger 56."
引述
"Typische LiDAR-basierte 3D-Objekterkennungsmodelle werden in überwachter Weise mit Echtweltdaten trainiert, die oft über Klassen hinweg unausgewogen (oder langgeschwänzt) sind."
"Statt große Datensätze zu sammeln, schlagen wir einen neuartigen Ansatz zur kostengünstigen Generierung von hochqualitativen seltenen Objekten vor."