본 연구는 추가 데이터나 보조 사전 훈련 모델 없이도 CLIP 모델을 활용하여 효과적인 오픈 어휘 의미 분할을 수행하는 방법을 제안한다.
개방형 어휘 분할 작업에서 모델 크기와 학습 비용이 큰 문제점을 해결하기 위해, 원칙적이고 전이 가능한 효율성 기술을 제안한다.
CLIP 데이터 큐레이션 프로세스를 공개하고 이를 기반으로 한 MetaCLIP 알고리즘을 제안하여 CLIP 성능을 개선한다.
ID 유사 OOD 샘플을 CLIP을 활용하여 자동으로 탐색하고, 이를 활용한 프롬프트 학습을 통해 가장 도전적인 OOD 샘플을 효과적으로 식별할 수 있다.