Kernkonzepte
Unser Modell ICP-Flow schätzt den Szenenfluss, indem es die Objekte in aufeinanderfolgenden LiDAR-Scans erkennt und deren lokale starre Transformationen berechnet. Dafür verwenden wir den Iterativen Nächste-Nachbarn-Algorithmus (ICP) mit einer neuartigen histogrammbasierten Initialisierung, um eine gute Startposition für ICP zu finden.
Zusammenfassung
Die Kernidee des ICP-Flow-Modells ist es, den Szenenfluss als Schätzung starrer Transformationen zwischen Objekten in aufeinanderfolgenden LiDAR-Scans zu berechnen, anstatt freie Flussvektoren pro Punkt vorherzusagen. Dafür führen wir folgende Schritte durch:
Kompensation der Ego-Bewegung und Entfernung des Bodens aus den LiDAR-Scans.
Gruppierung der verbleibenden Punkte in Cluster, die einzelne Objekte repräsentieren.
Paarung der Cluster zwischen den Scans basierend auf räumlicher Nähe.
Verwendung des Iterativen Nächste-Nachbarn-Algorithmus (ICP) zur Schätzung der starren Transformationen zwischen den Cluster-Paaren. Dabei nutzen wir eine neuartige histogrammbasierte Initialisierung, um ICP zu unterstützen.
Berechnung des Szenenflows aus den geschätzten starren Transformationen.
Unser Modell übertrifft den Stand der Technik auf gängigen Benchmarks wie Waymo, Argoverse-v2 und nuScenes, insbesondere bei der Schätzung des Flusses dynamischer Objekte. Darüber hinaus trainieren wir ein vorwärtsgerichtetes neuronales Netzwerk, das von den Pseudolabels unseres Modells profitiert und eine Echtzeitinferenz ermöglicht.
Statistiken
Die durchschnittliche Anzahl der Punkte pro LiDAR-Scan beträgt 177.000 auf Waymo, 25.000 auf nuScenes und 83.000 auf Argoverse-v2.
Zitate
Keine relevanten Zitate gefunden.