이 연구는 일반화된 클래스 발견(GCD) 문제를 다룬다. GCD는 레이블이 있는 데이터와 레이블이 없는 데이터를 활용하여 알려진 클래스와 새로운 클래스를 동시에 분류하는 과제이다.
기존 방법들은 클러스터링과 프로토타입 학습을 통해 이 문제를 해결하려 했지만, 클러스터링 알고리즘의 한계로 인해 충분한 프로토타입을 얻지 못하는 문제가 있었다.
이 연구에서는 이 문제를 해결하기 위해 다음과 같은 두 가지 핵심 기여를 제안한다:
학습 가능한 잠재적 프로토타입을 도입하여 클러스터링 결과에서 누락된 프로토타입을 보완한다. 이를 위해 자기 증류 학습 기법을 활용하여 잠재적 프로토타입을 최적화한다.
레이블이 없는 데이터만을 대상으로 한 효율적인 클러스터링 전략을 제안한다. 이를 통해 레이블이 있는 데이터와 레이블이 없는 데이터를 모두 클러스터링하는 기존 방식의 비효율성을 해결한다.
제안 방법인 PNP는 다양한 데이터셋에서 기존 방법들을 크게 능가하는 성능을 보였으며, 특히 Stanford Cars 데이터셋에서 9.7%의 큰 성능 향상을 달성했다. 또한 Herbarium 19 데이터셋에서 12배 빠른 클러스터링 효율을 보였다.
toiselle kielelle
lähdeaineistosta
arxiv.org
Tärkeimmät oivallukset
by Ye Wang,Yaxi... klo arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.08995.pdfSyvällisempiä Kysymyksiä