이 논문은 포즈 잔차 필드(PoRF)와 엡폴라 기하학 손실을 도입하여 신경 표면 재구성의 정확도를 높이는 방법을 제안한다.
PoRF: 카메라 포즈를 독립적으로 최적화하는 기존 방식과 달리, PoRF는 MLP 네트워크를 사용하여 포즈 잔차를 학습한다. 이를 통해 전체 시퀀스의 글로벌 정보를 활용할 수 있어 더 정확한 포즈 추정이 가능하다.
엡폴라 기하학 손실: 2D 특징점 대응을 활용하여 포즈 추정을 강화한다. 이는 기존 방식보다 계산량이 적고 정확도가 높다.
실험 결과, DTU 데이터셋에서 COLMAP 포즈 대비 회전 오차를 78% 감소시켰고, 재구성 정확도도 크게 향상되었다. MobileBrick 데이터셋에서도 ARKit 포즈를 개선하여 최신 성능을 달성했다. 또한 Nerfstudio 라이브러리에 통합하여 다양한 시나리오에서 성능 향상을 보였다.
Na inny język
z treści źródłowej
arxiv.org
Głębsze pytania