المفاهيم الأساسية
BlockFusionは、拡張可能で高品質な3Dシーンを生成するための拡散モデルベースのアプローチを提案する。潜在空間上の三平面の抽出と外挿を通じて、既存のシーンに調和的に新しいブロックを追加することができる。
الملخص
本論文では、BlockFusionと呼ばれる新しい3Dシーン生成手法を提案している。主な特徴は以下の通りである:
- 3Dシーンをブロック単位で生成し、既存のシーンに新しいブロックを追加することで、無限に拡張可能なシーンを生成できる。
- 3Dブロックをトライプレーンと呼ばれる効率的な3D表現に変換し、潜在空間上でのディフュージョンモデルを用いて高品質な3Dシェイプを生成する。
- 既存のシーンの特徴を利用して、新しいブロックを調和的に追加するための外挿手法を提案する。
- 2Dレイアウト情報を条件として与えることで、シーン内の要素の配置を制御できる。
実験結果から、BlockFusionは室内、屋外のシナリオにおいて、高品質で多様性のある無限に拡張可能な3Dシーンを生成できることが示された。
الإحصائيات
3Dシーンデータセットからランダムにクロップされた3Dブロックを用いて学習を行っている。
各ブロックは符号付き距離関数(SDF)で表現されており、トライプレーンとMLPデコーダーを用いてモデル化されている。
トライプレーンは32チャンネル、128×128の解像度で表現されている。