核心概念
スケッチの形状と文章の説明に合わせて、リアルな3Dアセットを生成する
要約
本論文は、スケッチの形状と文章の説明に基づいて、リアルな3Dアセットを生成するSketch3Dを提案している。
まず、スケッチと文章の説明を入力として、形状を保持しつつ色彩のある参照画像を生成する。次に、この参照画像から3Dガウシアン表現を初期化する。その後、IP-Adaptorを使って多視点の一貫したスタイルの画像ガイダンスを生成する。最後に、3つの最適化戦略を提案する:
分布転送メカニズムを使った構造最適化により、スケッチの形状に合わせる
単純なMSE損失を使った色最適化により、文章の説明に合わせる
CLIP幾何類似性損失を使ったスケッチ類似性最適化により、スケッチの形状に近づける
実験結果から、提案手法Sketch3Dは、スケッチの形状と文章の説明に合致した高品質な3Dアセットを生成できることが示された。
統計
3分以内に3Dアセットを生成できる
参照画像の生成に20秒、3Dガウシアンの初期化に40秒、最適化に2分かかる
引用
"スケッチは設計の初期段階で重要な役割を果たすが、色情報がなく、大規模データセットの学習が必要という課題がある。"
"提案手法Sketch3Dは、スケッチの形状と文章の説明に合致した高品質な3Dアセットを生成できる。"