제안된 방법은 360도 이미지 합성을 위한 두 단계 구조를 가지고 있다. 첫 번째 단계에서는 사전 학습된 VQGAN 모델을 활용하여 저해상도의 360도 이미지를 생성한다. 이때 VQGAN 모델은 기하학적 왜곡을 표현하지 못하므로 생성된 이미지에는 왜곡이 존재한다. 두 번째 단계에서는 다중 시야각 이미지를 합성하여 첫 번째 단계에서 발생한 왜곡을 보정한다. 이를 통해 전체적으로 타당하면서도 지역적으로 상세한 360도 이미지를 생성할 수 있다. 제안된 방법은 VQGAN 모델 학습 과정을 생략함으로써 기존 방법 대비 훈련 시간을 크게 단축할 수 있었다. 또한 다중 시야각 이미지를 동시에 생성하는 방식으로 추론 속도도 향상되었다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Atsuya Nakat... at arxiv.org 09-17-2024
https://arxiv.org/pdf/2409.09969.pdfDeeper Inquiries