대형 언어 모델의 효율적인 배포와 압축을 위해 기존 성능 지표의 한계를 극복하는 새로운 토큰 기반 지표를 제안한다. 이를 통해 모델 구성 요소별 성능 저하를 정확히 측정하고, 효과적인 압축 전략을 수립할 수 있다.