변환기 모델은 입력 쌍의 최대공약수를 계산하기 위해 기저 표현의 약수들과 작은 소수들의 곱으로 이루어진 정수 리스트를 학습한다. 학습 분포에 따라 모델 성능이 크게 달라지며, 균형 잡힌 최대공약수 분포로 학습하면 설명 가능성이 부분적으로 손실된다.