Core Concepts
자동 속성 테스트를 통해 시각적 프로그래밍 방법의 성능과 일반화 능력을 향상시킬 수 있다.
Abstract
이 논문은 시각적 프로그래밍 방법의 성능을 향상시키기 위해 자동 속성 테스트 기법인 PropTest를 제안한다. 시각적 프로그래밍 방법은 대규모 언어 모델(LLM)을 활용하여 문제를 분해하고 실행 가능한 컴퓨터 프로그램의 소스 코드를 생성한다. PropTest는 LLM을 사용하여 초기 솔루션에 대한 시각적 속성 테스트 코드를 생성한다. 이를 통해 데이터 유형 일관성, 구문 및 의미 속성을 확인한다. 제안된 솔루션은 기준선을 능가하며 공개적으로 사용 가능한 작은 LLM(CodeLlama-7B, WizardCoder-15B)을 사용하여 최신 방법과 비슷한 결과를 달성한다. 이는 시각적 질문 답변 및 참조 표현 이해 벤치마크에서 입증된다. 구체적으로 PropTest는 A-OKVQA 벤치마크에서 ViperGPT보다 8.3% 향상된 48.66% 정확도를, RefCOCO+ 벤치마크에서 3.3% 향상된 52.8% 정확도를 달성한다.
Stats
바나나 위에 있는 가전제품이 없는 경우 "no"를 반환한다.
바나나 위에 있는 가전제품이 있는 경우 해당 가전제품의 이름을 반환한다.