본 논문은 6자유도 카메라 자세 추정 문제를 해결하기 위한 iComMa 기법을 제안한다. 기존의 카메라 자세 추정 방법은 대상 물체의 CAD 모델이나 특정 객체 클래스에 맞춰 학습된 신경망을 필요로 한다. 최근 NeRF를 역전하는 방식으로 메시 없이 물체와 장면의 자세를 추정하는 방법이 제안되었지만, 여전히 큰 회전과 이동에 취약하다는 한계가 있다.
이를 해결하기 위해 본 논문에서는 3D 가우시안 스플래팅을 역전하는 효율적인 방법을 제안한다. 구체적으로, 기울기 기반의 차등 가능한 프레임워크를 통해 쿼리 이미지와 렌더링된 이미지 간 잔차를 최소화하는 방식으로 카메라 자세를 최적화한다. 또한 엔드-투-엔드 매칭 모듈을 도입하여 초기 조건에 대한 강건성을 높이고, 픽셀 수준의 비교 손실을 최소화하여 정확한 자세 추정을 달성한다.
실험 결과, 합성 데이터와 복잡한 실세계 데이터에서 제안 방법의 효과성과 정확성을 확인할 수 있었다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Yuan Sun,Xua... alle arxiv.org 03-21-2024
https://arxiv.org/pdf/2312.09031.pdfDomande più approfondite