이 논문은 수학적 추론 및 일반화 능력을 체계적으로 평가하기 위한 데이터 생성 및 교란 프레임워크를 제안한다. 이를 통해 변환기 모델의 수학적 추론 및 일반화 능력을 분석할 수 있다.