본 연구는 수십억 개의 매개변수를 가진 대규모 언어 모델의 추론 속도를 높이는 것을 목표로 합니다. 저자들은 SPACE(Smart Parallel Auto-Correct dEcoding)라는 접근법을 제안하여 자동 회귀 언어 모델의 병렬 토큰 생성 및 검증을 가능하게 합니다.