SSEditor는 사용자가 사전 제작된 마스크 자산을 사용하여 3D 장면의 생성 또는 편집을 사용자 지정할 수 있는 제어 가능한 시맨틱 장면 편집기입니다.
SSEditor is a novel, controllable framework for generating and editing complex 3D semantic scenes from masks, leveraging a two-stage diffusion model and a geometric-semantic fusion module to achieve superior controllability and quality compared to previous unconditional methods.
장면의 구조, 의미, 시각적 요소를 모두 담아내는 새로운 장면 표현 방식인 '장면 언어'를 통해 보다 사실적이고 편집 가능한 3D 및 4D 장면 생성이 가능해졌습니다.
L3DG is a novel method for generating 3D scenes by representing them as 3D Gaussians and using a latent diffusion model trained on a compressed latent space learned by a VQ-VAE with a sparse convolutional architecture.
SceneDreamer360은 텍스트에서 사실적이고 일관된 3D 장면을 생성하기 위해 파노라마 이미지 생성과 3D 가우시안 스플래팅을 결합한 새로운 텍스트 기반 3D 장면 생성 프레임워크입니다.
MagicDrive3D is a novel framework that leverages easily accessible driving datasets to generate highly realistic and controllable 3D street scenes, enabling diverse applications like autonomous driving simulation and enhancing 3D perception tasks.
SceneCraft는 사용자가 지정한 레이아웃과 텍스트 설명을 기반으로 사실적이고 복잡한 3D 실내 환경을 생성하는 혁신적인 방법을 제시합니다.
SceneCraft is a novel method for generating high-quality 3D indoor scenes by combining user-specified textual descriptions and spatial layouts, overcoming limitations of previous approaches by supporting complex multi-room scenes and free camera trajectories.
Depth inpainting is crucial for generating geometrically consistent 3D scenes from a single image or text prompt.
Frankenstein introduces a tri-plane diffusion-based framework for generating semantic-compositional 3D scenes in a single pass.