핵심 개념
본 논문에서는 기존의 오픈 보카불러리 객체 감지 모델을 텍스트 설명 없이도 퓨샷 객체 인식 모델로 변환하는 경량화된 방법을 제안합니다.
초록
오픈 보카불러리 객체 감지 모델 기반 퓨샷 타겟 기반 인스턴스 감지 연구 논문 요약
Crulis, B., Serres, B., De Runz, C., & Venturini, G. (2024). Few-shot target-driven instance detection based on open-vocabulary object detection models. arXiv preprint arXiv:2410.16028v1.
본 연구는 기존의 오픈 보카불러리 객체 감지 모델을 활용하여 적은 수의 예시 이미지만으로 새로운 객체 인스턴스를 인식할 수 있는 퓨샷 타겟 기반 인스턴스 감지 (TDID) 모델로 변환하는 것을 목표로 합니다.