이 논문은 자기지도 학습에 가장 도움이 되는 예시를 찾는 방법을 제안한다. 자기지도 학습은 레이블이 없는 데이터에서 고품질의 표현을 학습하는 것이다. 데이터셋이 커질수록 가장 중요한 예시를 찾는 것이 중요해진다.
저자들은 대조 자기지도 학습에 가장 도움이 되는 예시는 다른 예시와 가장 유사한 증강 데이터를 가진 예시라는 것을 증명했다. 이러한 예시는 클래스 내 예시들을 잘 모아주고, 클래스 간 예시들을 잘 구분해준다. 저자들은 이러한 성질을 활용하여 이 subset에 대한 일반화 성능 보장을 제공했다.
흥미롭게도, 저자들은 지도 학습에 가장 도움이 되는 예시가 자기지도 학습에 가장 도움이 되지 않는다는 것을 발견했다. 즉, 지도 학습에 쉬운 예시가 자기지도 학습에 가장 도움이 된다. 이러한 예시는 지도 학습에서 안전하게 제외될 수 있지만, 자기지도 학습에서는 중요한 역할을 한다.
다양한 실험을 통해 저자들은 제안한 방법이 CIFAR100에서 20%, STL10과 TinyImageNet에서 40%의 예시를 안전하게 제외할 수 있음을 보였다. 또한 다른 자기지도 학습 방법에서도 제안한 방법이 우수한 성능을 보였다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문