이 연구는 이미지 검색을 위한 학습 및 평가 데이터셋 간 클래스 중복 문제를 다룬다. 가장 널리 사용되는 학습 데이터셋인 Google Landmarks v2 clean (GLDv2-clean)에서 평가 데이터셋인 Revisited Oxford and Paris와 중복되는 클래스를 제거하여 새로운 버전인 RGLDv2-clean을 소개한다. 기존 방법들을 RGLDv2-clean으로 재평가한 결과, 성능이 크게 떨어지며 순위도 달라지는 것을 확인했다.
이와 함께 관심 객체를 탐지하고 배경 잡음을 무시하는 단일 단계 파이프라인 방법인 CiDeR를 제안한다. CiDeR는 객체 탐지와 표현 학습을 단일 네트워크에서 end-to-end로 학습하며, 위치 감독 없이도 우수한 성능을 달성한다. 실험 결과, CiDeR는 기존 데이터셋과 새로운 RGLDv2-clean 데이터셋에서 모두 최신 기술 수준을 넘어서는 성능을 보였다.
На другой язык
из исходного контента
arxiv.org
Дополнительные вопросы