Der Artikel stellt VcEdit, einen neuartigen Ansatz für die textgesteuerte 3D-Modellbearbeitung, vor. VcEdit zielt darauf ab, die Probleme der Multiansicht-Inkonsistenz in der bildgesteuerten 3D-Gaussian-Splatting-Bearbeitung zu lösen.
Der Kern des Ansatzes sind zwei innovative Konsistenzmodule:
Das Cross-Attention Consistency Module (CCM) konsolidiert die Multiansicht-Aufmerksamkeitskarten in den Diffusionsmodellen, um eine konsistentere Bearbeitung über die Ansichten hinweg zu erreichen.
Das Editing Consistency Module (ECM) kalibriert die inkonsistenten Bearbeitungsergebnisse direkt, indem es das 3D-Gaussian-Splatting-Modell zur Erzeugung konsistenterer Führungsbilder fein abstimmt.
Darüber hinaus erweitert VcEdit den Bearbeitungsprozess zu einem iterativen Muster, in dem die 3D-Gaussian-Splatting-Darstellung und die Führungsbilder sich gegenseitig verfeinern, um eine noch höhere Konsistenz und Bearbeitungsqualität zu erreichen.
Die umfassenden Experimente zeigen, dass VcEdit die Multiansicht-Inkonsistenz effektiv adressiert und deutlich bessere Bearbeitungsergebnisse als andere Methoden liefert.
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Yuxuan Wang,... pada arxiv.org 03-19-2024
https://arxiv.org/pdf/2403.11868.pdfPertanyaan yang Lebih Dalam