Core Concepts
이 연구는 패션 제품 검색을 위한 새로운 접근법을 제안합니다. 기존의 객체 탐지 기반 방법과 달리, 우리는 약하게 감독된 조건부 학습을 통해 이미지 임베딩을 생성하여 우수한 성능을 달성합니다.
Abstract
이 연구는 패션 제품 검색을 위한 새로운 과제인 Referred Visual Search (RVS)를 소개합니다. RVS는 사용자가 이미지의 특정 부분에 관심을 가지고 있음을 나타내는 추가 정보를 제공하는 것을 허용합니다.
연구진은 LAION-RVS-Fashion이라는 새로운 대규모 공개 데이터셋을 출시했습니다. 이 데이터셋은 272,000개의 패션 제품과 842,000개의 이미지로 구성되어 있으며, 이 과제를 위해 특별히 설계되었습니다.
연구진은 기존의 객체 탐지 기반 방법과 달리, 약하게 감독된 조건부 대조 학습을 통해 우수한 성능을 달성할 수 있음을 보여줍니다. 제안된 방법은 가볍고 강건하며, 200만 개의 방해 요소에 대해 R@1이 우수한 수준에 도달합니다.
Stats
이 데이터셋에는 272,451개의 제품과 841,718개의 이미지가 포함되어 있습니다.
검증 세트에는 400개의 제품(800개 이미지)이 포함되어 있으며, 테스트 세트에는 2,000개의 제품(4,000개 이미지)이 포함되어 있습니다.
테스트 세트에는 2,000,014개의 방해 요소가 추가되어 있습니다.