Core Concepts
LLMs를 사용하여 정치학에서 이미지 분석의 혁신을 이끌어내는 가능성을 탐구한다.
Stats
Gemini는 이미지에서 대부분의 객체를 정확하게 식별하고 각 객체의 수를 신뢰할 수 있는 추정으로 제공함.
Gemini는 이미지에 대한 504개의 단어(또는 구)를 사용하며 가장 빈도가 높은 단어는 '사람'이며, 가장 낮은 빈도의 단어는 '배송용 컨테이너', '수술용 마스크', '졸업 모자' 등이 한 번씩만 사용됨.
Gemini는 한 두 명의 사람이 있는 이미지에서 특히 잘 수행되는 경향이 있음.
Quotes
Gemini의 결과는 "Gemini의 성능은 인상적이며, 특히 그 주석이 제로샷임을 고려할 때"라고 설명합니다.