다단계 수학 추론 문제에서 중간 단계의 정확성보다는 최종 답안의 정확성을 우선시하는 결과 감독 가치 모델을 제안한다. 이를 통해 중간 단계의 정확성 레이블링에 드는 비용을 절감하면서도 우수한 성능을 달성할 수 있다.