Der Artikel stellt einen neuen Ansatz für die Text-zu-3D-Inhaltserstellung vor, der als Stein-Score-Distillation (SSD) bezeichnet wird. SSD erweitert bestehende Score-Distillations-Methoden wie Score-Distillations-Sampling (SDS) und Variational-Score-Distillation (VSD), indem es Kontrollvariaten auf Basis der Stein-Identität verwendet, um die Varianz der Gradientenschätzung zu reduzieren.
Der Kern der Arbeit ist die Erkenntnis, dass die hohe Varianz der Gradientenschätzung in SDS und VSD ein Hauptfaktor für deren suboptimale Leistung ist. SSD führt eine flexiblere Klasse von Kontrollvariaten ein, die auf der Stein-Identität basieren und beliebige Basisfunktionen zulassen. Dadurch kann die Korrelation zwischen den Kontrollvariaten und den geschätzten Gradienten erhöht werden, was zu einer signifikanten Varianzreduktion führt.
Die Autoren integrieren SSD in eine Text-zu-3D-Pipeline namens SteinDreamer. Die Experimente zeigen, dass SteinDreamer konsistent bessere Ergebnisse als die Baseline-Methoden liefert, sowohl in Bezug auf die visuelle Qualität als auch auf die Konvergenzgeschwindigkeit. SteinDreamer kann die Anzahl der benötigten Diffusionsmodell-Aufrufe um 14%-22% reduzieren, was auf die stabileren Gradientenaktualisierungen zurückzuführen ist.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Peihao Wang,... at arxiv.org 04-02-2024
https://arxiv.org/pdf/2401.00604.pdfDeeper Inquiries