本論文では、3Dシェイプ生成のための自己回帰モデルを提案している。
まず、約90万個の多様な3Dオブジェクトからなる大規模データセット「Objaverse-Mix」を構築した。これにより、モデルが幅広い物体変化から学習できるようになった。
次に、容量の観点から、3Dグリッドベースの表現学習の課題を解決するため、離散表現学習を1次元の潜在空間で行う新しいフレームワーク「Argus3D」を提案した。これにより、計算コストの削減と幾何学的詳細の保持が可能になった。
さらに、拡張性の観点から、トランスフォーマーのレイヤー数と特徴次元を増やすことで、36億パラメータの大規模モデルを構築した。これにより、多様な条件下でより高品質な3Dシェイプを生成できるようになった。
実験の結果、Argus3Dは無条件および条件付き生成タスクで優れた性能を示し、3Dシェイプ生成の新しい水準を達成した。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor