이 논문은 입력 3D 메시에 텍스트 가이드를 통해 기하학적 세부 사항을 추가하는 방법을 제안한다.
제안하는 방법은 3단계로 구성된다:
입력 메시와 텍스트 프롬프트를 이용해 단일 뷰 RGB 이미지를 생성한다. 이 이미지는 사용자에게 결과를 미리 볼 수 있게 하고 후속 다중 뷰 생성을 위한 강력한 조건을 제공한다.
입력 메시의 다중 뷰 노말 렌더링과 단일 뷰 RGB 이미지를 이용해 다중 뷰 노말 이미지를 생성한다. 이를 통해 일관성 있는 세부 사항을 생성할 수 있다.
생성된 다중 뷰 노말 이미지를 이용해 입력 메시를 최적화하여 세부적인 기하학을 생성한다.
제안하는 방법은 사용자가 입력 메시의 전체 구조와 로컬 기하학적 세부 사항을 모두 제어할 수 있게 한다. 또한 기존 방법들에 비해 약 90배 빠른 속도로 결과를 생성할 수 있다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問