이 논문은 텍스트 가이드 3D 도메인 적응과 아바타 생성을 향상시키기 위해 3D GAN과 확산 사전을 결합하는 새로운 프레임워크 DiffusionGAN3D를 제안한다.
도메인 적응 태스크에서는 사전 학습된 3D GAN 모델(예: EG3D)과 텍스트-이미지 확산 모델을 통합한다. 3D GAN은 안정적이고 고품질의 아바타 생성을 위한 강력한 기반을 제공하고, 확산 모델은 3D GAN의 도메인 적응을 위한 정보적인 방향을 제공한다. 또한 상대적 거리 손실을 도입하여 다양성 문제를 해결한다.
아바타 생성 태스크에서는 사전 학습된 3D GAN을 기반으로 하고, 사례별 학습 가능한 triplane을 도입하여 기하학과 텍스처의 높은 가변성을 모델링한다.
마지막으로, 확산 모델의 강력한 2D 생성 능력을 활용하여 점진적 텍스처 정제 단계를 제안하여 생성 결과의 텍스처 품질을 크게 향상시킨다.
실험 결과, 제안 방법은 도메인 적응과 아바타 생성 모두에서 우수한 성능을 보이며, 기존 방법들을 능가한다.
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Biwen Lei,Ka... às arxiv.org 04-15-2024
https://arxiv.org/pdf/2312.16837.pdfPerguntas Mais Profundas