Die Studie präsentiert einen Plug-and-Play-Rahmen für die MC3D-Det-Aufgabe, der sowohl die monokulare Wahrnehmung als auch die Umgebungsverfeinerungsfähigkeit effektiv verbessert, indem er schwach abgestimmte Experten und eine zusammengesetzte Destillationsstrategie nutzt.
Eine effiziente Methode zur Objekterkennung für Straßenrandeinheiten, die auf unüberwachter Objektentdeckung und Feinabstimmung basiert, um den Aufwand für die manuelle Datenbeschriftung zu reduzieren.
Ein Multi-Modalitäts-Punktwolken-3D-Objektdetektor, der Projektionsmerkmale und Voxel-Merkmale kombiniert, um die Erkennungsgenauigkeit insbesondere für Objekte mit wenigen Reflektionspunkten wie Fahrräder zu verbessern.
Eine Multi-Raum-Ausrichtung Lehrer-Schüler (MATS) Methode, um die Domänenverschiebung in mehreren geometrischen Räumen (2D, 3D Voxel, BEV) für die BEV-Wahrnehmung zu lösen.
Ein automatisches Datensystem (AIDE) nutzt Fortschritte in Vision-Sprache-Modellen und großen Sprachmodellen, um Probleme zu identifizieren, Daten effizient zu kuratieren, Modelle durch automatisches Labeling zu verbessern und die Modelle durch Generierung vielfältiger Szenarien zu verifizieren. Dieses iterative Verfahren ermöglicht eine kontinuierliche Verbesserung des Modells.