변환기 모델은 입력 시퀀스에 걸쳐 계산을 균일하게 분배하지만, 이 연구에서는 변환기가 시퀀스 내 특정 위치에 계산을 동적으로 할당하는 방법을 제안한다. 이를 통해 전체 계산 예산 내에서 성능을 향상시킬 수 있다.