Core Concepts
대규모 언어 모델의 추론 능력을 향상시키기 위해서는 문제에 대한 깊이 있는 이해가 필수적이다.
Abstract
이 논문은 대규모 언어 모델(LLM)의 추론 능력 향상을 위한 새로운 프롬프트 전략인 DUP(Deeply Understanding the Problems) 프롬프팅을 제안한다. DUP 프롬프팅은 3단계로 구성되어 있다:
핵심 질문 추출: LLM을 사용하여 원본 입력에서 핵심 질문을 추출한다.
문제 해결 정보 추출: 핵심 질문을 기반으로 문제 해결에 필요한 정보를 추출한다.
답변 생성 및 추출: 핵심 질문과 문제 해결 정보를 결합하여 LLM이 단계별로 문제를 해결하고 답변을 생성하도록 한다. 마지막으로 생성된 복잡한 텍스트에서 최종 답변을 추출한다.
실험 결과, DUP 프롬프팅은 다양한 추론 데이터셋에서 기존의 제로샷 방법들을 크게 능가하는 성능을 보였다. 또한 수작업 CoT 및 자동 CoT 프롬프팅 전략과 비교해서도 대부분의 데이터셋에서 더 나은 성능을 보였다. 이는 문제에 대한 깊이 있는 이해가 LLM의 추론 능력 향상에 핵심적임을 보여준다.
Stats
총 60개의 의자가 있다.
11명이 의자에 앉아 있다.
총 79개의 소다 병과 사과가 있다.
Quotes
"LLM이 복잡한 추론 과제에 직면할 때 여전히 안정적이고 정확한 답변을 제공하는 데 어려움을 겪고 있다."
"문제에 대한 깊이 있는 이해가 복잡한 추론 과제를 해결하는 데 핵심적이다."