이 연구는 대규모 언어 모델(GPT-3.5)을 "데이터 과학자(LDS)"로 활용하여 주어진 데이터셋에서 핵심 정보, 상관관계 및 기본 정보를 추출하는 능력을 평가하였다. 15개의 벤치마크 데이터셋을 활용하여 모델의 성능을 테스트하였으며, 다양한 난이도의 질문에 대해 전반적으로 32.89%의 정확도를 보였다. 특히 대용량 데이터셋에서 36%의 정확도를 보여 대규모 언어 모델이 저수준의 데이터 분석 작업에 효과적으로 활용될 수 있음을 시사한다. 이를 위해 Chain-of-Thought 강화 및 SayCan 프롬프트 엔지니어링과 같은 기법을 활용하였다. 향후 GPT-4와 같은 더 발전된 모델을 활용하면 성능이 크게 향상될 것으로 기대된다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor