Core Concepts
다양한 각도의 2D 이미지를 활용하면 3D 물체의 형상과 질감을 더 정확하게 복원할 수 있다.
Abstract
이 논문은 다양한 각도의 2D 이미지를 활용하여 3D 물체의 형상과 질감을 복원하는 시스템 SAP3D를 제안한다.
초기에는 RelPose++를 사용하여 입력 이미지들 간의 대략적인 카메라 자세를 추정한다.
그 후 테스트 시 미세 조정 단계를 통해 입력 이미지에 맞춰 사전 학습된 2D 확산 모델을 개선하고, 카메라 자세도 함께 최적화한다.
이렇게 얻은 인스턴스 특화 2D 확산 모델과 카메라 자세를 활용하여 3D 재구성과 새로운 뷰 생성을 수행한다.
입력 이미지 수가 늘어날수록 3D 재구성 품질과 새로운 뷰 생성 품질이 향상된다.
다양한 실험을 통해 제안 시스템의 효과를 검증하였다.
Stats
단일 이미지로 3D 재구성을 수행할 때 PSNR은 14.1, SSIM은 0.82, Chamfer Distance는 0.168, VolumeIoU는 0.25이다.
3개의 입력 이미지를 사용하면 PSNR은 18.5, SSIM은 0.83, Chamfer Distance는 0.024, VolumeIoU는 0.57로 향상된다.
5개의 입력 이미지를 사용하면 PSNR은 19.8, SSIM은 0.86, Chamfer Distance는 0.019, VolumeIoU는 0.68로 더욱 향상된다.