WonderWorldは、ユーザーが対話的に制御できる3Dシーン生成を可能にする新しいフレームワークです。入力画像から、ユーザーが自由にシーンの内容と配置を指定できます。生成されたシーンは10秒以内に表示されるため、ユーザーは即座にフィードバックを得ることができます。
WonderWorldの主な技術的特徴は以下の通りです:
Fast LAyered Gaussian Surfels (FLAGS)と呼ばれる新しい3Dシーン表現を導入し、単一の入力画像から高速に生成できるようにしました。FLAGSは、従来の手法と比べて生成速度が大幅に向上しています。
ガイド付き深度拡散法を使うことで、生成されたシーンの幾何学的整合性を高めています。これにより、シーン間の接続が自然になります。
テキストプロンプトを使って、ユーザーが生成するシーンの内容を指定できるようにしています。これにより、多様なシーンを生成することができます。
WonderWorldは、仮想現実、ゲーム開発、クリエイティブデザインなどの分野で、ユーザーが自由に3Dコンテンツを生成・探索できる新しい可能性を開きます。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor