核心概念
FlexiDreamerは、単一画像から高品質な3Dメッシュを迅速に生成することができる。FlexiCubesを活用することで、ポストプロセスを必要とせずに、エンドツーエンドで目標のメッシュを取得できる。
要約
FlexiDreamerは、単一画像から高品質な3Dコンテンツを生成する新しいフレームワークである。
多視点ディフュージョンモデルを使用して、入力画像から複数の視点の画像を生成する。
符号付き距離関数を表現するニューラルネットワークと、FlexiCubesと呼ばれる柔軟な勾配ベースの抽出手法を組み合わせることで、ポストプロセスを必要とせずにエンドツーエンドで3Dメッシュを取得する。
符号付き距離関数ネットワークには、マルチ解像度のハッシュグリッドエンコーディングスキームを採用し、幾何学的詳細を効果的にキャプチャできるようにしている。
テクスチャネットワークを統合することで、メッシュ表面にテクスチャを適用できる。
実験結果から、FlexiDreamerは他の手法と比べて優れた幾何学的精度とテクスチャ品質を示し、短時間で高品質な3Dコンテンツを生成できることが分かった。
統計
単一のNVIDIA A100 GPUで約1分で3Dコンテンツを生成できる。
従来手法と比べて、Chamfer Distance指標で最大38%、Volume IoU指標で最大10%の改善を達成した。
SSIMでは0.8405、LPIPSでは0.2308と、テクスチャ品質でも優れた結果を示した。