제안된 방법은 360도 이미지 합성을 위한 두 단계 구조를 가지고 있다. 첫 번째 단계에서는 사전 학습된 VQGAN 모델을 활용하여 저해상도의 360도 이미지를 생성한다. 이때 VQGAN 모델은 기하학적 왜곡을 표현하지 못하므로 생성된 이미지에는 왜곡이 존재한다. 두 번째 단계에서는 다중 시야각 이미지를 합성하여 첫 번째 단계에서 발생한 왜곡을 보정한다. 이를 통해 전체적으로 타당하면서도 지역적으로 상세한 360도 이미지를 생성할 수 있다. 제안된 방법은 VQGAN 모델 학습 과정을 생략함으로써 기존 방법 대비 훈련 시간을 크게 단축할 수 있었다. 또한 다중 시야각 이미지를 동시에 생성하는 방식으로 추론 속도도 향상되었다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Atsuya Nakat... lúc arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.09969.pdfYêu cầu sâu hơn