衛星画像から直接3Dアーバンシーンを生成する新しいアーキテクチャを提案する。ディフュージョンモデルと3D疎な表現を組み合わせ、ニューラルレンダリング技術と統合することで、高品質かつ一貫性のある画像を生成できる。