Der Artikel stellt AGILE3D vor, ein neues Modell für die interaktive 3D-Segmentierung mehrerer Objekte. Im Gegensatz zu bisherigen Ansätzen, die Objekte sequenziell segmentieren, kann AGILE3D mehrere Objekte gleichzeitig verarbeiten.
Der Kern der Idee ist es, Nutzerklicks als räumlich-zeitliche Abfragen zu kodieren und explizite Interaktionen zwischen Klicks sowie zwischen Klicks und der 3D-Szene durch ein Klick-Aufmerksamkeitsmodul zu ermöglichen. Jedes Mal, wenn neue Klicks hinzugefügt werden, muss nur ein leichter Decoder ausgeführt werden, um aktualisierte Segmentierungsmasken zu erzeugen.
In Experimenten mit vier verschiedenen 3D-Punktwolkendatensätzen übertrifft AGILE3D den aktuellen Stand der Technik. Darüber hinaus wird die Praxistauglichkeit des Modells in Echtzeit-Setups mit Benutzerstudien verifiziert.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor