이 논문은 희소 다중 뷰 이미지로부터 효율적이고 정확한 3D 가우시안 스플래팅 모델 MVSplat을 제안한다.
먼저, 다중 뷰 이미지 특징을 추출하고 이를 이용해 3D 공간에서의 비용 볼륨을 구축한다. 이 비용 볼륨은 깊이 정보를 예측하는데 활용되며, 이를 통해 가우시안 중심을 정확하게 추정할 수 있다.
다음으로, 가우시안의 불투명도, 공분산, 색상 등의 다른 파라미터들도 함께 예측한다. 이렇게 예측된 3D 가우시안 프리미티브들은 차별화된 렌더링 기술을 통해 효율적으로 활용된다.
제안 모델 MVSplat은 대규모 RealEstate10K와 ACID 벤치마크에서 최신 기술 대비 더 높은 화질과 빠른 추론 속도, 그리고 적은 모델 크기를 달성했다. 또한 다양한 실험을 통해 비용 볼륨 기반 설계의 중요성을 입증했다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Yuedong Chen... a las arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14627.pdfConsultas más profundas