Centrala begrepp
Unser Ansatz GroupContrast kombiniert Segmentgruppierung und semantisch bewusste kontrastive Repräsentationslernung, um die semantische Kohärenz in 3D-Punktwolken zu verbessern und die Probleme des "semantischen Konflikts" zu lösen.
Sammanfattning
Die Arbeit präsentiert GroupContrast, ein selbstüberwachtes Repräsentationslernframework für das 3D-Szenenverständnis, das eine gemeinsame Segmentgruppierung und semantisch bewusste kontrastive Repräsentationslernung umfasst.
Die Segmentgruppierung entdeckt semantisch sinnvolle Regionen, indem jedem Segment ein Prototyp zugewiesen wird. Basierend auf dem Gruppierungsergebnis wird dann ein kontrastives Lernziel angewendet, um einen semantisch bewussten Repräsentationsraum zu erzeugen.
Der Ansatz kann eine Punktwolke effektiv in mehrere semantisch sinnvolle Regionen ohne Aufsicht unterteilen und zeigt die aufkommende Fähigkeit zur semantischen Erkennung. Darüber hinaus zeigen umfangreiche experimentelle Ergebnisse, dass unser Ansatz vielversprechende Transferlernleistungen bei verschiedenen 3D-Szenenverständnisaufgaben wie 3D-semantische Segmentierung, Objekterkennung und Instanzsegmentierung erzielt.
Statistik
Die Segmentgruppierung verbessert die Transferlernleistung auf der ScanNet-semantischen Segmentierung um 1,1 Punkte im Vergleich zur Baseline des Matched-Points-Ansatzes.
Die Einführung eines asymmetrischen Prädiktors in der kontrastiven Repräsentationslernung führt zu einer Verbesserung der Transferlernleistung.
Die Einbeziehung von Zentrierung und Schärfung in der Segmentgruppierung hilft, das Kollapseproblem zu verhindern und die Transferlernleistung zu verbessern.
Citat
"Unser Ansatz GroupContrast kombiniert Segmentgruppierung und semantisch bewusste kontrastive Repräsentationslernung, um die semantische Kohärenz in 3D-Punktwolken zu verbessern und die Probleme des 'semantischen Konflikts' zu lösen."
"Der Ansatz kann eine Punktwolke effektiv in mehrere semantisch sinnvolle Regionen ohne Aufsicht unterteilen und zeigt die aufkommende Fähigkeit zur semantischen Erkennung."