核心概念
多視点の擬似合成画像を入力とすることで、粗い3Dジェネレーション結果を短時間で高品質に改善することができる。
摘要
本論文では、「Magic-Boost」と呼ばれる多視点条件付き拡散モデルを提案している。このモデルは、Instant3Dによって生成された粗い3Dジェネレーション結果を入力として受け取り、擬似的に生成された多視点画像を活用することで、短時間で高品質な3Dアセットを生成することができる。
具体的には以下の特徴がある:
- 固定タイムステップのU-Netを用いて、多視点入力から密な局所特徴を効率的に抽出する
- 自己注意機構を拡張して3次元の相互作用を実現し、多視点の相関を暗黙的にエンコーディングする
- データ拡張手法を導入し、モデルの頑健性を高める
- 入力視点の影響度を調整できる条件ラベルを導入する
- アンカー反復更新損失関数を提案し、SDS最適化の過飽和問題を緩和する
これらの工夫により、Magic-Boostは粗い入力を短時間で(約15分)高品質な3Dアセットに変換することができる。豊富な幾何学的詳細とリアルな質感を持つ生成結果が得られることが実験的に示されている。
統計資料
提案手法は、入力の粗い3Dモデルから高品質な3Dアセットを短時間(約15分)で生成できる。
従来手法と比べ、提案手法は高いQIS、CLIP-Text、CLIP-Image スコアを達成している。
引述
「多視点の擬似合成画像を入力とすることで、短時間で高品質な3Dアセットを生成することができる」
「アンカー反復更新損失関数を提案し、SDS最適化の過飽和問題を緩和する」