본 논문에서는 사전 정의된 레이블 후보 없이 이미지에서 객체 명사를 직접 생성하는 새로운 제로샷 이미지 분류 모델인 NOVIC를 제안합니다.
본 논문에서는 레이블링 된 데이터 없이도 제로샷 이미지 분류 성능을 향상시키는 프레임워크인 Frolic을 제안합니다. Frolic은 프롬프트 분포 학습을 통해 다양한 시각적 표현을 학습하고, 레이블 없는 로그잇 조정을 통해 사전 학습된 모델의 편향을 수정합니다.
다중 모델 통합과 신뢰도 기반 가중치 기법을 통해 제로샷 이미지 분류 성능을 크게 향상시킬 수 있다.