이 논문은 포즈 잔차 필드(PoRF)와 엡폴라 기하학 손실을 도입하여 신경 표면 재구성의 정확도를 높이는 방법을 제안한다.
PoRF: 카메라 포즈를 독립적으로 최적화하는 기존 방식과 달리, PoRF는 MLP 네트워크를 사용하여 포즈 잔차를 학습한다. 이를 통해 전체 시퀀스의 글로벌 정보를 활용할 수 있어 더 정확한 포즈 추정이 가능하다.
엡폴라 기하학 손실: 2D 특징점 대응을 활용하여 포즈 추정을 강화한다. 이는 기존 방식보다 계산량이 적고 정확도가 높다.
실험 결과, DTU 데이터셋에서 COLMAP 포즈 대비 회전 오차를 78% 감소시켰고, 재구성 정확도도 크게 향상되었다. MobileBrick 데이터셋에서도 ARKit 포즈를 개선하여 최신 성능을 달성했다. 또한 Nerfstudio 라이브러리에 통합하여 다양한 시나리오에서 성능 향상을 보였다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Jia-Wang Bia... alle arxiv.org 03-14-2024
https://arxiv.org/pdf/2310.07449.pdfDomande più approfondite