본 연구는 대규모 언어 모델의 성능 저하를 최소화하면서도 효율적으로 압축할 수 있는 Cross-Block 양자화 기법을 제안한다. 이를 위해 블록 간 의존성을 고려한 재구성 기반 양자화, 아웃라이어 처리 기법, 그리고 적응형 양자화 기법을 통합적으로 활용한다.