대규모 언어 모델의 느린 추론 속도와 높은 계산 및 메모리 요구사항을 해결하기 위해 지식 증류 기반 양자화 기법을 제안하고, 신호 전파 분석을 통해 취약점을 파악하여 성능을 향상시킴.