Die Arbeit präsentiert GroupContrast, ein selbstüberwachtes Repräsentationslernframework für das 3D-Szenenverständnis, das eine gemeinsame Segmentgruppierung und semantisch bewusste kontrastive Repräsentationslernung umfasst.
Die Segmentgruppierung entdeckt semantisch sinnvolle Regionen, indem jedem Segment ein Prototyp zugewiesen wird. Basierend auf dem Gruppierungsergebnis wird dann ein kontrastives Lernziel angewendet, um einen semantisch bewussten Repräsentationsraum zu erzeugen.
Der Ansatz kann eine Punktwolke effektiv in mehrere semantisch sinnvolle Regionen ohne Aufsicht unterteilen und zeigt die aufkommende Fähigkeit zur semantischen Erkennung. Darüber hinaus zeigen umfangreiche experimentelle Ergebnisse, dass unser Ansatz vielversprechende Transferlernleistungen bei verschiedenen 3D-Szenenverständnisaufgaben wie 3D-semantische Segmentierung, Objekterkennung und Instanzsegmentierung erzielt.
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Chengyao Wan... في arxiv.org 03-15-2024
https://arxiv.org/pdf/2403.09639.pdfاستفسارات أعمق