Core Concepts
다양한 시점의 RGB 이미지만을 입력으로 사용하여, 카메라의 위치와 방향 및 피사체의 위치와 방향을 통합된 조감도 평면에 등록하는 문제를 해결한다.
Abstract
이 연구는 다중 시점 카메라와 피사체 등록 문제를 다룬다. 기존 연구들은 사전에 주어진 카메라 보정 정보나 조감도 이미지를 필요로 했지만, 이 연구에서는 다양한 시점의 RGB 이미지만을 입력으로 사용한다.
제안하는 방법은 다음과 같은 3단계로 구성된다:
각 시점의 이미지에서 피사체의 위치와 방향을 추정하는 뷰 변환 모듈(VTM)
다중 시점 기하학 기반의 공간 정렬 모듈(SAM)을 통해 상대적인 카메라 자세 추정
카메라 자세 선택 및 피사체 융합 전략을 통해 통합된 조감도 평면에 카메라와 피사체 등록
실험 결과, 제안 방법은 기존 방법들에 비해 우수한 성능을 보였다. 특히 카메라 자세 추정의 경우 평균 오차가 6도 미만이며, 15도 이내 오차가 94% 이상으로 나타났다. 피사체 등록 결과 또한 평균 거리 오차 0.8m 이내, 15도 이내 방향 오차 79% 이상을 달성했다. 이는 실제 응용 분야에서 유용하게 활용될 수 있음을 보여준다.
Stats
카메라 자세 추정 평균 오차: 0.89m, 5.78도
카메라 자세 추정 오차 1m 이내: 72.4%, 10도 이내: 86.5%
피사체 위치 추정 평균 오차: 0.75m
피사체 위치 추정 오차 1m 이내: 81.43%
피사체 방향 추정 오차 10도 이내: 63.24%
Quotes
"There are just three problems in computer vision: registration, registration, and registration."
Takeo Kanade