이 연구는 데이터 시각화에 대한 인간의 해석과 대형 언어 모델의 예측 간 차이를 조사했다. 막대 그래프의 공간적 레이아웃이 인간의 해석에 미치는 영향을 바탕으로, 4가지 일반적인 막대 그래프 레이아웃(수직 나열, 수평 나열, 중첩, 누적)에 대해 실험을 진행했다.
실험 1에서는 다양한 구성 요소(언어 모델, 온도 설정, 차트 표현, 프롬프팅 전략)를 조합하여 최적의 구성을 식별했다. 실험 결과, 최신 대형 언어 모델도 의미적으로 다양하고 사실적으로 정확한 해석을 생성하는 데 어려움을 겪는 것으로 나타났다.
실험 2에서는 최적의 구성을 사용하여 8개의 시각화에 대한 해석을 생성했다. 인간의 해석과 비교했을 때, 대형 언어 모델이 생성한 해석은 인간이 수행하는 비교 유형과 일치하지 않는 경우가 많았다. 또한 문맥 정보를 제공하면 일부 경우에 모델 생성 해석의 정확도가 향상되었다.
실험 3에서는 차트의 문맥과 데이터가 대형 언어 모델의 해석에 미치는 영향을 조사했다. 그 결과, 대형 언어 모델은 인간과 달리 동일한 레이아웃의 차트에서도 문맥에 따라 비교 유형이 크게 달라지는 것으로 나타났다.
이 연구는 대형 언어 모델의 데이터 시각화 이해 능력에 대한 한계를 보여주며, 향후 모델 개발을 위한 과제를 제시한다.
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies