본 연구는 기존 시각-언어 모델의 한계를 극복하기 위해 자기 질문 기법을 제안한다. 이를 통해 모델이 이미지 내 정보를 효과적으로 활용하고 다양한 질문을 생성할 수 있게 되어 전반적인 시각-언어 이해 능력이 향상된다.
본 연구는 기존 시각-언어 모델의 한계를 극복하기 위해 자기 질문 기법을 제안한다. 이를 통해 모델이 이미지 내 정보를 효과적으로 활용하고 다양한 질문을 생성할 수 있게 되어 전반적인 시각-언어 이해 능력이 향상된다.
본 연구는 기존 시각 지시 학습 방식의 한계를 극복하고자 자기 질문 기법을 제안한다. 이를 통해 모델이 이미지 내 정보를 더 깊이 있게 이해하고 다양한 질문을 생성할 수 있게 된다.