MetaMath는 대규모 언어 모델의 수학 문제 해결 능력을 향상시키기 위해 질문 부트스트래핑 기법을 사용하여 MetaMathQA 데이터셋을 구축하고, 이를 활용하여 우수한 성능을 달성했다.
본 연구는 대규모 언어 모델의 수학 문제 해결 능력을 향상시키기 위해 자기 비평 파이프라인을 제안한다. 이 방법은 모델 자체에서 생성된 피드백 신호를 활용하여 언어와 수학 능력을 동시에 향상시킬 수 있다.