本研究では、大規模言語モデルが範囲曖昧文をどのように処理するかを調査した。
実験1では、範囲曖昧文に対する人間の好みと同様の解釈を示すモデルを特定した。特に、GPT-4、text-davinci-003、Llama2-70bなどの大規模モデルは、人間の好みに近い解釈を示した。
実験2では、範囲曖昧文と非曖昧文に対するモデルの反応の違いを分析した。ほとんどのモデルが範囲曖昧性を認識しており、text-davinci-003やLlama2-13bなどのモデルは人間の判断とも高い相関を示した。
これらの結果は、大規模言語モデルが言語の意味構造と世界知識の相互作用を捉えられることを示唆している。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Gaurav Kamat... a las arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.04332.pdfConsultas más profundas