이 논문은 무표지 데이터를 활용하여 대규모 지리 위치 추정(CVGL) 문제를 해결하는 새로운 프레임워크를 제안한다. 기존 CVGL 방법은 지상 이미지와 위성 이미지 쌍을 사용하는 지도 학습 방식에 의존하지만, 이는 정확한 쌍 데이터를 수집하기 어려운 문제가 있다.
저자들은 무표지 데이터를 활용하기 위해 두 단계로 구성된 프레임워크를 제안한다. 첫째, 무표지 데이터에서 초기 의사 레이블을 생성하는 cold-start 단계를 수행한다. 이를 위해 지상 파노라마 이미지를 위성 이미지와 유사한 형태로 변환하는 대응 없는 투영(CFP) 기법을 사용하고, 자기 지도 학습 기법으로 교차 뷰 정렬을 학습한다. 둘째, 반지도 학습 단계에서는 초기 의사 레이블을 정제하고 점진적으로 더 많은 데이터를 활용하는 커리큘럼 학습 기법을 적용한다.
실험 결과, 제안 방법은 기존 지도 학습 방식과 유사한 성능을 보이면서도 무표지 데이터를 효과적으로 활용할 수 있음을 보여준다. 특히 적은 수의 레이블 데이터로도 좋은 성능을 달성할 수 있다는 점에서 실용적인 의의가 있다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問