本論文では、テキストから3Dアセットを効率的に生成するための新しい手法「SteinDreamer」を提案している。従来のスコア蒸留手法であるSDS(Score Distillation Sampling)とVSD(Variational Score Distillation)は、期待値は同一であるものの、数値計算時の分散が大きく異なることが明らかになった。
そこで本手法では、Stein Identityに基づいて構築された柔軟な制御変数を用いることで、スコア蒸留の分散を大幅に低減することができる。具体的には、事前学習された深度推定器などを利用して制御変数を設計し、分散最小化問題を解くことで、より安定した勾配更新を実現している。
実験の結果、SteinDreamerは既存手法と比べて、物体レベルおよびシーンレベルの生成において、より滑らかな幾何学形状、詳細なテクスチャ、アーティファクトの低減を実現している。また、分散の低減により、収束速度も14%~22%向上している。
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések