Die Studie untersucht die Redundanz in diffusionsbasierten 3D-Generierungsmodellen bei ähnlichen Kameraansichten und Zeitschritten. Basierend auf dieser Erkenntnis wird Hash3D entwickelt, eine Hashing-basierte Methode, die zuvor berechnete Merkmale effizient wiederverwendet, um die Optimierung zu beschleunigen.
Hash3D verwendet ein adaptives Grid-Hashing, um Merkmale aus ähnlichen Kameraansichten und Zeitschritten abzurufen und wiederzuverwenden. Dadurch werden redundante Berechnungen vermieden, was die Effizienz der 3D-Generierung um den Faktor 1,3 bis 4 steigert, ohne die Leistung zu beeinträchtigen. Darüber hinaus führt der Ansatz zu einer verbesserten Konsistenz und Glättung der generierten 3D-Objekte.
Die Methode wurde in umfangreichen Experimenten mit 5 Text-zu-3D- und 3 Bild-zu-3D-Modellen getestet und erwies sich als vielseitig einsetzbar. Insbesondere in Kombination mit 3D-Gaussian-Splatting konnte die Verarbeitungszeit für Text-zu-3D auf etwa 10 Minuten und für Bild-zu-3D auf etwa 30 Sekunden reduziert werden.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Xingyi Yang,... at arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06091.pdfDeeper Inquiries