채널 유사성을 활용하여 데이터 없이도 효과적으로 신경망 모델을 압축할 수 있는 방법을 제안한다.
COMQ는 레이어 단위 재구성 오차를 좌표 단위로 최소화하는 혁신적인 포스트 트레이닝 양자화 알고리즘으로, 백프로퍼게이션 없이 정확도 손실을 최소화하며 효율적인 모델 압축을 달성한다.
유전 알고리즘을 활용하여 게이트 순환 유닛의 정확도와 모델 크기를 동시에 최적화하는 맞춤형 혼합 정밀도 양자화 기법을 제안한다.