이 연구는 대규모 언어 모델이 범위 모호성이 있는 문장을 어떻게 처리하는지 조사했다. 범위 모호성은 문장에 포함된 다중 의미 연산자의 적용 순서가 모호한 경우 발생한다. 연구진은 GPT-2, GPT-3/3.5, Llama 2, GPT-4 등 다양한 언어 모델을 대상으로 실험을 진행했다.
실험 1에서는 범위 모호성이 있는 문장을 제시하고 모델이 선호하는 해석을 확인했다. 결과, 일부 대규모 모델(GPT-4, text-davinci-003, Llama2-70b 등)은 인간과 유사한 선호도를 보였다.
실험 2에서는 범위 모호성이 있는 문장과 없는 문장에 대한 모델의 반응을 비교했다. 결과, 대부분의 모델이 범위 모호성이 있는 문장과 없는 문장을 구분할 수 있었다. 특히 text-davinci-003과 Llama2-13b는 인간 판단과 높은 상관관계를 보였다.
이 연구는 대규모 언어 모델이 의미 구조와 세계 지식을 통합하여 범위 모호성을 처리할 수 있음을 보여준다. 또한 이를 통해 언어 모델의 추상적 언어 구조 표현 능력에 대한 통찰을 얻을 수 있다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Gaurav Kamat... a las arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04332.pdfConsultas más profundas