이 연구는 대조 학습에서 발생하는 불안정성 문제를 다룬다. 특히 InfoNCE 손실 함수와 그 변형들이 높은 학습률에서 임베딩의 과도한 융합 현상을 보이는 문제를 분석하였다.
실험적으로는 3차원 합성 데이터에서 다양한 대조 학습 손실 함수를 적용하여 이러한 현상을 관찰하였다. 이론적으로는 InfoNCE 손실 함수가 임베딩이 단일 rank-1 부공간에 수렴하는 국소 최소점을 가짐을 증명하였다.
이를 바탕으로 저자들은 새로운 회귀 손실 항을 제안하였다. 이 항은 fine-tuning 단계에 사용되는 레이블 정보를 활용하여 임베딩 클러스터의 분리를 유도한다. 실험 결과, 제안 방법은 기존 방법 대비 CIFAR10과 CIFAR100 데이터셋에서 큰 성능 향상을 보였다. 특히 레이블이 10% 밖에 없는 상황에서도 기존 방법 대비 25-37% 향상된 정확도를 달성하였다.
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問