이 논문은 소스 데이터 없이 사전 학습된 폐쇄 집합 모델을 활용하여 공변량 이동과 범주 이동이 모두 존재하는 상황에서 타겟 도메인 모델을 효과적으로 업사이클링하는 방법을 제안한다.
먼저, 적응적인 one-vs-all 전역 클러스터링 알고리즘을 개발하여 타겟 데이터를 알려진 범주와 알려지지 않은 범주로 구분한다. 이때 실루엣 지표를 활용하여 타겟 도메인의 범주 수를 적응적으로 추정한다. 또한 소스 고유 범주의 부정적인 영향을 억제하기 위한 전역 신뢰도 기반 억제 전략을 도입한다.
이와 더불어 지역 k-NN 클러스터링 전략을 활용하여 부정적 지식 전달을 완화한다. 이러한 전역 및 지역 클러스터링 기법의 조합을 GLC라 명명한다.
GLC는 폐쇄 집합 소스 모델의 구조적 한계로 인해 알려지지 않은 데이터 내의 다양한 범주를 구분하는 데 어려움이 있다. 이를 해결하기 위해 GLC++에서는 새로운 대조적 친화력 학습 전략을 도입한다. 이 전략은 GLC뿐만 아니라 기존 방법들에도 상당한 이점을 제공한다.
다양한 벤치마크 데이터셋과 범주 이동 시나리오에 대한 실험 결과, GLC와 GLC++가 기존 방법들을 크게 능가하는 성능을 보인다. 특히 가장 까다로운 open-partial-set 시나리오에서 GLC와 GLC++는 VisDA 데이터셋에서 GATE 대비 각각 16.7%와 18.6% 높은 H-score를 달성했다. 또한 Office-Home 데이터셋의 open-set 시나리오에서 GLC++는 GLC 대비 알려지지 않은 범주 클러스터링 정확도를 4.3% 향상시켰다.
Egy másik nyelvre
a forrásanyagból
arxiv.org
Mélyebb kérdések