Core Concepts
대형 언어 모델은 웹 규모의 언어 말뭉치로 훈련되어 근사적 검색을 수행하며, 원칙적인 추론 능력은 갖추지 못한다.
Abstract
대형 언어 모델(Large Language Models, LLMs)은 n-gram 모델을 기반으로 하며, 근사적 검색을 수행한다.
LLMs는 원칙적인 추론 능력이 아닌 근사적 검색 능력을 갖추고 있으며, 계획과 추론 작업에 대한 능력에 대한 의문이 제기된다.
GPT3부터 GPT4로의 발전은 계획 작업의 정확도 향상을 보여주었지만, 여전히 근사적 검색 능력에 의존하는 것으로 나타났다.
LLMs는 계획 작업을 자동으로 수행하는 데 어려움을 겪으며, 인간의 개입이 필요한 LLM-Modulo 프레임워크를 제안한다.
LLMs는 계획 및 추론 능력을 갖추지 못하지만, 아이디어 생성 능력을 통해 계획 및 추론 작업에 도움이 될 수 있다.
Stats
LLMs는 근사적 검색 능력을 갖추고 있다.
GPT4는 Blocks World에서 30%의 경험적 정확도를 보여준다.
LLMs는 계획 작업에서 근사적 검색 능력에 의존한다.
Quotes
"대형 언어 모델은 근사적 검색 능력을 갖추고 있어, 원칙적인 추론 능력은 갖추지 못한다."
"LLMs는 계획 작업을 자동으로 수행하는 데 어려움을 겪으며, 인간의 개입이 필요한 LLM-Modulo 프레임워크를 제안한다."