Core Concepts
단일 이미지에서 3D 인식 확산 모델인 ZeroNVS를 통해 실내외 다중 객체 장면의 360도 뷰 합성을 수행한다.
Abstract
이 논문은 단일 이미지에서 360도 뷰 합성을 위한 3D 인식 확산 모델 ZeroNVS를 제안한다. 기존 방법들은 마스크된 배경의 단일 객체에 초점을 맞추었지만, ZeroNVS는 복잡한 배경을 가진 실내외 다중 객체 장면에 대한 문제를 해결한다.
구체적으로 다음과 같은 기술적 혁신을 제안한다:
다양한 데이터 소스(CO3D, RealEstate10K, ACID)를 활용하여 장면 데이터를 학습하기 위한 새로운 카메라 매개변수화 및 정규화 기법
복잡한 배경의 다양성 향상을 위한 "SDS 앵커링" 기법
이를 통해 DTU 데이터셋에서 기존 방법을 능가하는 LPIPS 성능을 달성하였고, Mip-NeRF 360 데이터셋에서도 우수한 성능을 보였다.
Stats
단일 이미지에서 360도 뷰 합성 시 기존 방법 대비 DTU 데이터셋에서 LPIPS 점수 향상
Mip-NeRF 360 데이터셋에서도 우수한 LPIPS 성능 달성
Quotes
"단일 이미지, 360도 뷰 합성 모델은 사실적이고 다양한 결과를 생성해야 한다: 합성된 이미지는 자연스럽고 3D 일관성 있어야 하며, 관찰되지 않은 영역에 대한 다양한 설명을 포착해야 한다."
"우리는 SDS 앵커링을 제안하여 복잡한 배경의 다양성 향상을 도모한다."