Core Concepts
BrightDreamer ist ein neuartiger Ansatz zur direkten Generierung von 3D-Gaussschen aus Textbeschreibungen, der eine hohe Effizienz und Generalisierungsfähigkeit aufweist.
Abstract
BrightDreamer ist ein innovativer Ansatz zur Text-zu-3D-Synthese, der eine deutlich höhere Effizienz und Generalisierungsfähigkeit bietet als bisherige Methoden.
Der Kern der Idee ist es, den Prozess der 3D-Gaussschen-Generierung als ein Problem der 3D-Formdeformation umzuformulieren. Dazu werden zunächst Ankerpositionen definiert, die dann mithilfe eines Text-gesteuerten Formdeformationsnetzwerks (TSD) an die gewünschte Form angepasst werden. Die resultierenden Positionen dienen als Zentren der 3D-Gaussschen.
Um die restlichen Attribute der 3D-Gaussschen (Skalierung, Rotation, Opazität, SH-Koeffizienten) zu bestimmen, wird ein neuartiger Text-gesteuerter Triplanar-Generator (TTG) entwickelt. Dieser generiert eine implizite räumliche Darstellung des 3D-Objekts, aus der die Attributwerte abgeleitet werden können.
Im Vergleich zu bestehenden Methoden, die auf zeitaufwendiger Optimierung pro Textprompt basieren, kann BrightDreamer 3D-Inhalte für beliebige Textbeschreibungen in nur 77 ms generieren. Zudem zeigt BrightDreamer eine deutlich stärkere Fähigkeit zum Verständnis komplexer Semantik.
Umfangreiche Experimente belegen die Überlegenheit von BrightDreamer gegenüber dem Stand der Technik in Bezug auf Effizienz, Generalisierungsfähigkeit und Qualität der generierten 3D-Inhalte.
Stats
Die Generierungslatenz von BrightDreamer beträgt nur 77 ms auf einer A800-GPU.
Die generierten 3D-Gaussschen können mit über 700 Bildern pro Sekunde gerendert werden.
Quotes
Keine relevanten Zitate gefunden.