Conceitos essenciais
Unser Verfahren GaussCtrl ermöglicht effizientes und konsistentes Editieren einer 3D-Gaussian-Splatting-Szene durch Modifizieren ihrer beschreibenden Eingabeaufforderung.
Resumo
GaussCtrl ist ein textgesteuertes Verfahren zum Editieren einer 3D-Szene, die mit 3D-Gaussian-Splatting (3DGS) rekonstruiert wurde. Zunächst werden Bilder der 3DGS-Szene gerendert und mit Hilfe eines vortrainierten 2D-Diffusionsmodells (ControlNet) basierend auf der Eingabeaufforderung editiert. Diese editierten Bilder werden dann verwendet, um das 3D-Modell zu optimieren.
Der Schlüsselbeitrag von GaussCtrl ist das konsistente Editieren über mehrere Ansichten hinweg. Dies wird durch zwei Komponenten erreicht:
Tiefengesteuerte Bildbearbeitung, die geometrische Konsistenz über mehrere Ansichten hinweg durch Ausnutzen natürlich konsistenter Tiefenkarten erzwingt.
Aufmerksamkeitsbasierte Ausrichtung des Latentcodes, die die Erscheinung der editierten Bilder durch Konditionierung auf mehrere Referenzansichten über Selbst- und Kreuzaufmerksamkeit zwischen den Latentdarstellungen vereinheitlicht.
Die Experimente zeigen, dass unser Verfahren schnelleres Editieren und bessere visuelle Ergebnisse als vorherige State-of-the-Art-Methoden erzielt.
Estatísticas
Die Methode benötigt etwa 9 Minuten, um eine Szene auf einer NVIDIA RTX A5000 mit 24 GB Grafikspeicher zu editieren.
Citações
Keine relevanten Zitate gefunden.