Wir schlagen eine Methode vor, um einen kategoriespezifischen 3D-Objektposenschätzer ohne Verwendung von Positionsannotationen zu erlernen. Stattdessen nutzen wir diffusionsbasierte Modelle, um Bildmengen mit kontrollierten Positionsunterschieden zu generieren, und lernen unseren Posenschätzer anhand dieser Bilder.
FreeZe nutzt die Fähigkeiten von vortrainierten geometrischen und visuellen Grundlagenmodellen, um diskriminative 3D-Punktbeschreibungen zu erzeugen und die 6D-Pose unbekannter Objekte ohne jegliches Training zu schätzen.
PACE ist ein großer Benchmark-Datensatz, der entwickelt wurde, um die Entwicklung und Bewertung von Methoden zur Posenschätzung in unübersichtlichen Szenarien voranzubringen.
Unser Ansatz TransPose nutzt einen geometriebewussten Transformer-Encoder, um lokale und globale geometrische Merkmale aus Punktwolken effektiv zu extrahieren und für die 6D-Objektposenschätzung zu verwenden.
Eine neuartige Methode zur Objektposenschätzung, die auf einer probabilistischen Modellierung der Stimmenunsicherheit und der Verwendung von N-Punkt-Tupeln aufbaut, um die Robustheit und Genauigkeit gegenüber herkömmlichen Ansätzen zu verbessern.
Das vorgeschlagene Verfahren AG-Pose nutzt eine adaptive Erkennung von Keypoints und eine geometriebasierte Merkmalsaggregation, um robuste Keypoint-Korrespondenzen für die Posenschätzung auf unbekannten Instanzen zu etablieren.
Durch die Aggregation von Merkmalen aus Diffusionsmodellen können diskriminative Merkmale generiert werden, die eine starke Generalisierungsfähigkeit für die Objektposenschätzung aufweisen.
Wir präsentieren SecondPose, einen neuartigen Ansatz, der semantische Merkmale aus DINOv2 mit hierarchischen geometrischen Merkmalen fusioniert, um eine SE(3)-konsistente Objektrepräsentation zu schaffen, die die Leistung der Posenschätzung deutlich verbessert.
Durch die Lokalisierung wichtiger Schlüsselpunkte basierend auf ihrer Sichtbarkeit können zuverlässigere 3D-2D-Korrespondenzen für die 6DoF-Objektposenschätzung etabliert werden.
Durch die Lokalisierung wichtiger Schlüsselpunkte in Bezug auf deren Sichtbarkeit können zuverlässigere 3D-2D-Korrespondenzen für die 6D-Objektposenschätzung etabliert werden.