본 논문은 텍스트 입력을 바탕으로 3D 가우시안 표현을 직접 생성하는 새로운 방법을 제안한다.
첫 번째 단계에서는 GaussianVolume이라는 구조화된 볼륨 형태의 가우시안 표현을 도입한다. 이를 위해 기존의 무질서한 3D 가우시안 점들을 효과적으로 정돈하는 Candidate Pool Strategy를 제안한다. 이를 통해 고품질의 GaussianVolume을 생성할 수 있다.
두 번째 단계에서는 단계적 생성 파이프라인을 제안한다. 먼저 텍스트 입력을 바탕으로 Gaussian Distance Field(GDF)라는 거친 기하 구조를 생성한다. 이후 GDF와 텍스트 입력을 활용하여 3D U-Net 기반 모델로 최종 GaussianVolume의 속성을 예측한다. 이를 통해 세부적인 3D 기하와 외관을 생성할 수 있다.
제안된 GVGEN 프레임워크는 기존 방법들에 비해 우수한 성능을 보이며, 빠른 생성 속도(약 7초)를 달성한다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor