Durch die Generierung von Pseudo-LiDAR-Punktwolken aus Miniaturmodellen und öffentlichen Videos können seltene Objektklassen effektiv in Trainingsdatensätze für 3D-Objekterkennung integriert werden, um die Erkennungsleistung für diese Klassen zu verbessern.
Wir stellen einen neuartigen Ansatz zur Verbesserung der 3D-Objekterkennung aus LiDAR-Daten vor, der die Herausforderungen von Spärlichkeit und Verdeckung durch Nutzung von Röntgenaufnahmen und Distillation adressiert.
OV-Uni3DETR ist ein einheitlicher offener Vokabular-3D-Detektor, der verschiedene verfügbare Daten wie 2D-Erkennungsbilder, 3D-Erkennungsbilder und Punktwolken nutzt, um die Vielfalt des Trainings zu erhöhen. Es unterstützt die Erkennung sowohl bekannter als auch unbekannter Klassen und kann Eingaben verschiedener Modalitäten verarbeiten.
Ein strenger semi-überwachter 3D-Objekterkennungsansatz, der eine Strategie zum Beibehalten nur der wahrheitsbestimmenden Pseudoetiketten und zum Trimmen der anderen unscharfen Etiketten mit Punkten verwendet, sowie einen Filterwechselmechanismus einführt, um die Qualität der Pseudoetiketten weiter zu verbessern.
Dieser Artikel stellt BEVNeXt vor, ein modernes dichtes BEV-Framework für die 3D-Objekterkennung, das die Nachteile bestehender dichter BEV-basierter 3D-Objektdetektoren durch verbesserte Komponenten wie eine CRF-modulierte Tiefenschätzung, eine Langzeit-Temporalaggregation und einen zweistufigen Objektdekoder überwindet.
SparseLIF ist ein hochleistungsfähiger vollständig spärlicher Detektor für die LiDAR-Kamera-basierte 3D-Objekterkennung. Der Detektor überbrückt die Leistungslücke zwischen spärlichen Detektoren und ihren dichten Gegenstücken, indem er das Bewusstsein für die reichhaltigen Darstellungen aus den LiDAR- und Kamera-Featureräumen in drei Aspekten schärft: Abfragegenerierung, Featureabtastung und Multimodalitätsfusion.