Core Concepts
비전-언어 모델의 지식을 경량 비전 모델로 증류하여 오픈셋 도메인 일반화 문제를 해결하는 실용적인 접근법을 제안한다.
Abstract
이 논문은 실용적인 도메인 일반화 문제를 다룬다. 먼저, 비전-언어 모델의 제로샷 능력을 경량 비전 모델로 전이하는 새로운 퍼터베이션 증류(Perturbation Distillation, PD) 알고리즘을 개발한다. 이를 통해 기존의 fine-tuning 패러다임에서 발생하는 큰 계산 비용을 피할 수 있다. 점수, 클래스, 인스턴스(SCI)에서의 퍼터베이션을 도입하여 비전-언어 모델의 지식을 충분히 활용한다. 또한, 하이브리드 도메인 일반화(HDG) 벤치마크와 새로운 H2-CV 지표를 제안하여 모델의 강건성을 종합적으로 평가한다. 실험 결과, 제안 방법이 다양한 지표에서 최신 기술 대비 큰 성능 향상을 보인다.
Stats
제안 방법 SCI-PD는 기존 SOTA 방법 XDED 대비 OfficeHome 데이터셋에서 정확도 3.91%, H-score 4.37% 향상을 보였다.
SCI-PD는 PACS 데이터셋에서 H=0 조건에서 MIRO 대비 정확도 20.05%, H-score 15.03% 향상을 보였다.
Quotes
"우리는 비전-언어 모델의 제로샷 능력을 경량 비전 모델로 전이하는 새로운 퍼터베이션 증류(Perturbation Distillation, PD) 알고리즘을 개발한다."
"우리는 하이브리드 도메인 일반화(HDG) 벤치마크와 새로운 H2-CV 지표를 제안하여 모델의 강건성을 종합적으로 평가한다."