แนวคิดหลัก
본 논문에서는 레이블이 지정된 데이터 없이 텍스트 프롬프트만을 사용하여 이미지에서 객체의 위치를 정확하게 파악하는 새로운 제로샷 객체 위치 파악(ZSOL) 프레임워크를 제안합니다.
บทคัดย่อ
텍스트 기반 제로샷 객체 위치 파악 연구 논문 요약
제목: 텍스트 기반 제로샷 객체 위치 파악
저자: Jingjing Wang, Xinglin Piao, Zongzhi Gao, Bo Li, Yong Zhang∗, Baocai Yin
학술지: JOURNAL OF LATEX CLASS FILES
출판년도: 2024년 11월
본 연구는 레이블이 지정된 데이터 없이 텍스트 프롬프트만을 사용하여 이미지에서 특정 객체의 위치를 정확하게 식별하고 파악하는 것을 목표로 합니다.