이 논문은 옴니디렉셔널 비디오 입력을 이용하여 실내 및 실외 정적 장면의 기하학과 외관을 재구성하는 방법을 제안한다. 이 설정은 작은 기선과 큰 깊이 범위로 인해 광선 교차를 찾기 어려운 문제가 있다.
이를 해결하기 위해 논문에서는 부호화 거리 함수를 구면 이진 팔면체 트리 데이터 구조 내에서 추정하고, 넓이 우선 탐색 기반의 효율적인 트리 탐색 전략을 사용한다. 이 구조는 카메라 설정과 잘 맞아 메모리-품질 트레이드오프가 더 나은 것으로 나타났다.
초기 깊이 추정치에서 시작하여 이진 팔면체 트리를 최적화 과정에서 적응적으로 세분화한다. 이전 방법들은 고정된 깊이를 사용하여 장면이 과소 샘플링되는 문제가 있었다.
제안 방법은 3개의 신경망 최적화 방법과 2개의 비신경망 방법과 비교했을 때 평균적으로 기하학 오차가 감소했으며, 특히 세부적인 장면에서 두드러졌다. 또한 이러한 세부 사항을 표현하는데 필요한 voxel 수를 크게 줄였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Hakyeong Kim... a las arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00678.pdfConsultas más profundas