Core Concepts
Effektive Kategorie-Level-Posenschätzung durch Diffusion und Multi-Modalität.
Stats
Unser Ansatz erzielt mAPs von 35,0, 66,7 und 77,1 auf dem NOCS Real 275 Benchmark.
Die Kombination von Oberflächennormalen und DINO-Features zeigt eine Verbesserung von über 10 Prozent.
Die Verwendung von DINO-Features ist effektiver als die Verwendung von RGB.
Die beste Leistung wird mit 6-dimensionalen PCA-DINO-Features und 6 Rauschproben erzielt.
Quotes
"Unser Ansatz kann symmetrische Objekte ohne aufwändige Datensatzsymmetrie-Kennzeichnung und heuristische Operationen während des Trainings handhaben."
"Die Verwendung mehrerer Posenhypothesen hilft, die Leistung zur Laufzeit zu steigern."
"Durch die Ausgabe dichter Korrespondenzen aus multi-modalen Eingaben können wir Ambiguitäten besser auflösen und partielle Objektgeometrie wiederherstellen."