แนวคิดหลัก
본 논문에서는 사전 정의된 레이블 후보 없이 이미지에서 객체 명사를 직접 생성하는 새로운 제로샷 이미지 분류 모델인 NOVIC를 제안합니다.
บทคัดย่อ
NOVIC: 제약 없는 열린 어휘 이미지 분류: CLIP 반전을 통한 텍스트에서 이미지로의 제로샷 전이
제목: 제약 없는 열린 어휘 이미지 분류: CLIP 반전을 통한 텍스트에서 이미지로의 제로샷 전이
저자: Philipp Allgeuer, Kyra Ahrens, Stefan Wermter
소속: 함부르크 대학교
본 연구는 사전 정의된 레이블 후보 없이 임의의 이미지를 실시간으로 분류할 수 있는 제약 없는 열린 어휘 이미지 분류 모델을 개발하는 것을 목표로 합니다.