SALAD ist ein neuartiges kaskadenförmiges Diffusionsmodell, das eine Teil-Level-implizite 3D-Darstellung verwendet. Es übertrifft andere 3D-Diffusionsmodelle sowohl in der Qualität der Formgenerierung als auch in der Vielseitigkeit bei Teil-Level-Formmanipulationsaufgaben wie Vervollständigung, Mischung und textgesteuerte Bearbeitung.
Das Modell besteht aus zwei Phasen:
Diese kaskadenförmige Architektur ermöglicht es, die Diffusion in einem hochdimensionalen Latenzraum effektiv zu lernen. Darüber hinaus ermöglicht die Teil-Level-Darstellung das gezielte Bearbeiten einzelner Teile, ohne dass eine Region im 3D-Raum spezifiziert werden muss, was die Nutzung der Nullschuss-Manipulationsfähigkeit der Diffusionsmodelle entscheidend verbessert.
Die Experimente zeigen, dass SALAD den besten Stand der Technik in der Formgenerierung erreicht und vielseitige Teil-Level-Formmanipulationsaufgaben wie Vervollständigung, Mischung und textgesteuerte Bearbeitung ermöglicht.
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Juil Koo,Seu... ב- arxiv.org 03-21-2024
https://arxiv.org/pdf/2303.12236.pdfשאלות מעמיקות