핵심 개념
본 논문에서는 사전 학습된 비전-언어 모델 CLIP의 일반화 가능한 사람 재식별 작업 성능을 향상시키기 위해 깊이 우선 검색 기반의 어려운 샘플 마이닝 방법인 DFGS(Depth-First Graph Sampler)를 제안합니다.
Huazhong Zhao, Lei Qi, and Xin Geng. 2024. CLIP-DFGS: A Hard Sample Mining Method for CLIP in Generalizable Person Re-Identification. 1, 1 (October 2024), 20 pages.
본 연구는 사전 학습된 비전-언어 모델인 CLIP을 사용하여 일반화 가능한 사람 재식별 작업에서 성능을 향상시키는 것을 목표로 합니다. 특히, 세밀한 특징 표현 부족으로 인해 어려운 인스턴스를 구분하는 모델의 능력을 향상시키는 데 중점을 둡니다.