SALAD ist ein neuartiges kaskadenförmiges Diffusionsmodell, das eine Teil-Level-implizite 3D-Darstellung verwendet. Es übertrifft andere 3D-Diffusionsmodelle sowohl in der Qualität der Formgenerierung als auch in der Vielseitigkeit bei Teil-Level-Formmanipulationsaufgaben wie Vervollständigung, Mischung und textgesteuerte Bearbeitung.
Das Modell besteht aus zwei Phasen:
Diese kaskadenförmige Architektur ermöglicht es, die Diffusion in einem hochdimensionalen Latenzraum effektiv zu lernen. Darüber hinaus ermöglicht die Teil-Level-Darstellung das gezielte Bearbeiten einzelner Teile, ohne dass eine Region im 3D-Raum spezifiziert werden muss, was die Nutzung der Nullschuss-Manipulationsfähigkeit der Diffusionsmodelle entscheidend verbessert.
Die Experimente zeigen, dass SALAD den besten Stand der Technik in der Formgenerierung erreicht und vielseitige Teil-Level-Formmanipulationsaufgaben wie Vervollständigung, Mischung und textgesteuerte Bearbeitung ermöglicht.
To Another Language
from source content
arxiv.org
Principais Insights Extraídos De
by Juil Koo,Seu... às arxiv.org 03-21-2024
https://arxiv.org/pdf/2303.12236.pdfPerguntas Mais Profundas