본 논문은 텍스트 입력을 바탕으로 3D 가우시안 표현을 직접 생성하는 새로운 방법을 제안한다.
첫 번째 단계에서는 GaussianVolume이라는 구조화된 볼륨 형태의 가우시안 표현을 도입한다. 이를 위해 기존의 무질서한 3D 가우시안 점들을 효과적으로 정돈하는 Candidate Pool Strategy를 제안한다. 이를 통해 고품질의 GaussianVolume을 생성할 수 있다.
두 번째 단계에서는 단계적 생성 파이프라인을 제안한다. 먼저 텍스트 입력을 바탕으로 Gaussian Distance Field(GDF)라는 거친 기하 구조를 생성한다. 이후 GDF와 텍스트 입력을 활용하여 3D U-Net 기반 모델로 최종 GaussianVolume의 속성을 예측한다. 이를 통해 세부적인 3D 기하와 외관을 생성할 수 있다.
제안된 GVGEN 프레임워크는 기존 방법들에 비해 우수한 성능을 보이며, 빠른 생성 속도(약 7초)를 달성한다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Xianglong He... at arxiv.org 03-20-2024
https://arxiv.org/pdf/2403.12957.pdfDeeper Inquiries