DreamView는 텍스트 기반 3D 생성을 위한 접근법이다. 기존 방식은 전체 텍스트 설명만을 사용하여 3D 객체를 생성하므로, 특정 관점에서의 맞춤형 생성이 어려웠다. DreamView는 전체 텍스트와 뷰 특정 텍스트를 활용하여 이를 해결한다.
DreamView-2D는 텍스트 기반 이미지 생성 모델로, 전체 텍스트와 뷰 특정 텍스트를 적응적으로 활용하여 일관성 있고 맞춤형 이미지를 생성한다. 이를 위해 적응형 텍스트 주입 모듈을 제안하였다. 이 모듈은 각 U-Net 블록에서 전체 텍스트와 뷰 특정 텍스트 간의 균형을 동적으로 조절한다.
DreamView-3D는 DreamView-2D를 활용하여 일관성 있고 맞춤형 3D 생성을 달성한다. DreamView-2D의 강력한 뷰 내용 맞춤화 및 객체 수준 일관성 능력을 3D 표현에 전이시킨다.
실험 결과, DreamView는 기존 방식에 비해 텍스트 설명을 더 잘 반영하는 3D 객체를 생성할 수 있다. 또한 사용자 연구를 통해 DreamView의 우수한 성능을 확인하였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문