투기적 디코딩과 대조 디코딩을 결합한 새로운 디코딩 방법인 투기적 대조 디코딩(SCD)을 제안하여, 단일 소규모 언어 모델을 활용해 대규모 언어 모델의 추론 속도와 품질을 동시에 향상시킬 수 있음을 보여줌.