Der Artikel stellt AGILE3D vor, ein neues Modell für die interaktive 3D-Segmentierung mehrerer Objekte. Im Gegensatz zu bisherigen Ansätzen, die Objekte sequenziell segmentieren, kann AGILE3D mehrere Objekte gleichzeitig verarbeiten.
Der Kern der Idee ist es, Nutzerklicks als räumlich-zeitliche Abfragen zu kodieren und explizite Interaktionen zwischen Klicks sowie zwischen Klicks und der 3D-Szene durch ein Klick-Aufmerksamkeitsmodul zu ermöglichen. Jedes Mal, wenn neue Klicks hinzugefügt werden, muss nur ein leichter Decoder ausgeführt werden, um aktualisierte Segmentierungsmasken zu erzeugen.
In Experimenten mit vier verschiedenen 3D-Punktwolkendatensätzen übertrifft AGILE3D den aktuellen Stand der Technik. Darüber hinaus wird die Praxistauglichkeit des Modells in Echtzeit-Setups mit Benutzerstudien verifiziert.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Yuanwen Yue,... lúc arxiv.org 04-11-2024
https://arxiv.org/pdf/2306.00977.pdfYêu cầu sâu hơn