Core Concepts
2Dディフュージョンモデルを使用して、グローバル構造と局所的な詳細を同時に保証する高品質の3Dヒューマンを直接生成する。
Abstract
本研究は、高品質で高解像度の3Dヒューマンを効率的に生成する新しい手法「Joint2Human」を提案する。
まず、2Dディフュージョンモデルを使用して、フーリエ占有フィールド(FOF)表現を直接生成することで、グローバル構造を保証する。
次に、3D関節の小型球面埋め込みを提案し、姿勢制御と多様な生成を実現する。
さらに、高周波エンハンサーと多視点再彫刻戦略を導入し、局所的な詳細を生成する。
実験結果から、提案手法は既存手法よりもグローバル構造、局所的な詳細、計算効率の面で優れていることが示された。
また、テキストによる3Dヒューマン生成にも対応している。
Stats
3Dデータセットを使用して事前学習したVAEのエンコーダとデコーダを用いる。
ディフュージョンモデルのノイズ付加と除去のプロセスをT=1000、T'=200ステップで行う。