이 논문은 희소 다중 뷰 이미지로부터 효율적이고 정확한 3D 가우시안 스플래팅 모델 MVSplat을 제안한다.
먼저, 다중 뷰 이미지 특징을 추출하고 이를 이용해 3D 공간에서의 비용 볼륨을 구축한다. 이 비용 볼륨은 깊이 정보를 예측하는데 활용되며, 이를 통해 가우시안 중심을 정확하게 추정할 수 있다.
다음으로, 가우시안의 불투명도, 공분산, 색상 등의 다른 파라미터들도 함께 예측한다. 이렇게 예측된 3D 가우시안 프리미티브들은 차별화된 렌더링 기술을 통해 효율적으로 활용된다.
제안 모델 MVSplat은 대규모 RealEstate10K와 ACID 벤치마크에서 최신 기술 대비 더 높은 화질과 빠른 추론 속도, 그리고 적은 모델 크기를 달성했다. 또한 다양한 실험을 통해 비용 볼륨 기반 설계의 중요성을 입증했다.
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Yuedong Chen... kl. arxiv.org 03-22-2024
https://arxiv.org/pdf/2403.14627.pdfDybere Forespørgsler