Core Concepts
ラジアンスフィールドを最適化し、高品質なマルチビュー画像とジオメトリを生成する方法を提案します。
Abstract
この研究では、マルチビュー画像の生成において、従来の手法であるZero-1-to-3モデルに見られるバイアス問題を特定し、それに対処するUnbiased Score Distillation(USD)戦略を提案しています。さらに、2段階のDreamBoothプロセスを開発して、ビューのレンダリングを向上させます。これにより、複数の視点で一貫性がありながら画質が向上します。また、入力ビュー情報を活用して高品質なジオメトリと一貫性のあるマルチビュー画像を抽出する方法も提案されています。
Stats
Zero-1-to-3はChamfer Distanceで0.0339とVolume IoUで0.5035の結果を示す。
SyncDreamerはNeuSでChamfer Distanceが0.0261、Volume IoUが0.5421。
Wonder3DはiNGP+NeuSでChamfer Distanceが0.0199、Volume IoUが0.6244。
Quotes
"Generating multi-view images from a single input view using image-conditioned diffusion models is a recent advancement and has shown considerable potential."
"We consider the radiance field optimized during geometry extraction as a more rigid consistency prior, compared to volume and ray aggregation used in previous works."
"Our approach generates comparable-quality of multi-view images and geometry to the SOTA approaches, including SyncDreamer and Wonder3D, without enforcing any restriction on camera poses."