PI3Dは、事前学習された2Dテキスト-画像ディフュージョンモデルの知識を活用し、限られた3Dデータから高品質で整合性の取れた3Dオブジェクトを短時間で生成することができる。
本研究は、テキストから3Dオブジェクトを柔軟に生成するための新しい手法を提案する。効率的な体積エンコーダを用いて大規模なデータセットを構築し、高次元の特徴体積に対応した拡散モデルを開発することで、テキストプロンプトに基づいて多様で認識可能なサンプルを生成することができる。