이 연구는 텍스트 기반 3D 콘텐츠 생성을 위해 다중 시점 2.5D 확산 모델을 제안한다. 기존 방식들은 2D 확산 모델을 활용하거나 직접 3D 데이터로 모델을 학습하는데, 이는 각각 생성 품질 저하와 데이터 부족 문제가 있다.
제안 방식은 사전 학습된 2D 확산 모델을 다중 시점 2.5D 데이터로 미세 조정한다. 이를 통해 3D 기하 정보를 직접 모델링하면서도 2D 모델의 강력한 일반화 능력을 유지할 수 있다.
구체적으로, 다중 시점 정상 맵을 생성하고 차별 가능한 래스터화 기법으로 이를 융합하여 3D 모델을 구축한다. 또한 생성된 정상 맵을 조건으로 하는 다중 시점 RGB 이미지 생성 모듈을 통해 빠르게 텍스처를 합성한다.
제안 방식은 기존 방식 대비 10초 만에 다양하고 고품질의 3D 모델을 생성할 수 있다. 정량적/정성적 평가를 통해 제안 방식의 우수성을 입증한다.
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Yuanxun Lu,J... : arxiv.org 03-22-2024
https://arxiv.org/pdf/2311.15980.pdfDaha Derin Sorular