이 논문은 대형 시각-언어 모델에서 숫자 환각에 대한 새로운 형태를 소개하고 20k 데이터셋과 해당 평가 결과를 제시하여 LVLMs에서 숫자 환각을 평가합니다. 이를 통해 이 모델들이 숫자 환각에 심각하게 영향을 받는 것을 밝히고, 내부 및 외부 불일치를 분석하여 일관성 훈련 방법을 제안하고 평균적으로 8%의 개선을 확인합니다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Huixuan Zhan... a las arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01373.pdfConsultas más profundas