Core Concepts
언어 모델 간 협력을 통해 복잡한 추론 문제를 효과적으로 해결할 수 있다.
Abstract
이 논문은 복잡한 추론 문제를 해결하기 위해 언어 모델 간 협력 체계인 LM2를 제안한다. LM2는 세 가지 구성 요소로 이루어져 있다:
해답을 생성하는 Solver 모델
문제를 분해하고 개념을 식별하는 Decomposer 모델
Solver 모델의 답변을 검증하는 Verifier 모델
Decomposer 모델은 문제를 단계별 하위 문제로 분해하고 필요한 개념을 식별한다. Solver 모델은 이 하위 문제들을 순차적으로 해결한다. Verifier 모델은 Solver 모델의 답변을 검증하고, 오류가 있는 경우 Decomposer 모델에 피드백을 제공한다. 이를 통해 Decomposer 모델은 문제 분해 과정을 개선할 수 있다.
LM2는 MATH, JEEBench, MedQA 등의 복잡한 추론 문제 데이터셋에서 기존 방법들을 크게 능가하는 성능을 보였다. 특히 Verifier 모델과 Decomposer 모델이 중요한 역할을 하는 것으로 나타났다. 또한 LM2는 기존 방법들에 비해 효율적인 토큰 사용으로 비용 절감 효과도 있다.
Stats
삼각형의 세 변의 길이 a, b, c는 등차수열을 이룬다.
삼각형의 둘레는 60단위이다.
삼각형의 세 변의 길이 a, b, c는 정수이다.