이미지 검색을 위한 학습 및 평가 데이터셋 간 클래스 중복이 중요하며, 이를 해결하기 위한 단일 단계 파이프라인 방법을 제안한다.
텍스트 지침을 활용하여 다양한 이미지 관계를 포착하고 시각적 유사성을 넘어선 검색 결과를 제공할 수 있다.
지식 데이터베이스를 활용하여 참조 이미지의 속성 정보를 풍부하게 표현하고, 텍스트 개념과 정렬된 의사 단어 토큰을 생성함으로써 합성 이미지 검색 성능을 향상시킨다.
고해상도 특징을 활용하여 이미지 검색 성능을 크게 향상시킬 수 있다.
벡터 검색 결과의 유용성을 거리 기반 모델로 측정하는 RSM 지표를 제안하고, 이를 통해 기존 k-NN 검색 기반 기법보다 범위 검색이 더 효과적임을 보여줌.
범위 검색 결과의 유용성을 모델링하여 범위 검색 성능을 평가하는 새로운 지표인 RSM을 제안한다. RSM은 실제 응용 환경에 더 부합하며, 기존의 k-최근접 이웃 검색 지표보다 효율적이다.
기존 딥 메트릭 학습 손실은 테스트 클래스와 데이터 분포에 걸쳐 비균일한 클래스 내부 및 클래스 간 표현 구조를 초래한다. 이는 고정 임계값을 사용하는 경우 오탐률(FAR)과 오기각률(FRR) 성능의 큰 변동을 야기한다. 이러한 임계값 불일치 문제를 해결하기 위해 임계값 일관성 마진(TCM) 손실을 제안한다. TCM은 클래스 간 균일한 표현 구조를 유도하여 임계값 일관성을 향상시키면서도 정확도를 유지한다.
스케치와 텍스트를 효과적으로 조합하여 기존에 달성하기 어려웠던 정밀한 이미지 검색을 가능하게 한다.