DreamView는 텍스트 기반 3D 생성을 위한 접근법이다. 기존 방식은 전체 텍스트 설명만을 사용하여 3D 객체를 생성하므로, 특정 관점에서의 맞춤형 생성이 어려웠다. DreamView는 전체 텍스트와 뷰 특정 텍스트를 활용하여 이를 해결한다.
DreamView-2D는 텍스트 기반 이미지 생성 모델로, 전체 텍스트와 뷰 특정 텍스트를 적응적으로 활용하여 일관성 있고 맞춤형 이미지를 생성한다. 이를 위해 적응형 텍스트 주입 모듈을 제안하였다. 이 모듈은 각 U-Net 블록에서 전체 텍스트와 뷰 특정 텍스트 간의 균형을 동적으로 조절한다.
DreamView-3D는 DreamView-2D를 활용하여 일관성 있고 맞춤형 3D 생성을 달성한다. DreamView-2D의 강력한 뷰 내용 맞춤화 및 객체 수준 일관성 능력을 3D 표현에 전이시킨다.
실험 결과, DreamView는 기존 방식에 비해 텍스트 설명을 더 잘 반영하는 3D 객체를 생성할 수 있다. 또한 사용자 연구를 통해 DreamView의 우수한 성능을 확인하였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Junkai Yan,Y... lúc arxiv.org 04-10-2024
https://arxiv.org/pdf/2404.06119.pdfYêu cầu sâu hơn