COMQ는 포스트 트레이닝 양자화를 위한 혁신적인 알고리즘으로, 레이어 단위 재구성 오차를 좌표 단위로 최소화하는 방식을 사용한다. 기존 방식과 달리 백프로퍼게이션이 필요 없어 계산 복잡도가 낮으며, 가중치 양자화 시 정확도 손실을 최소화할 수 있다.
구체적으로 COMQ는 가중치 행렬을 부동소수점 스칼라와 정수 비트코드로 분해하고, 이를 좌표 단위로 순차적으로 업데이트한다. 이때 변수 업데이트 순서를 그리디 방식으로 설계하여 성능을 더욱 향상시킨다. 실험 결과, COMQ는 CNN과 Vision Transformer에서 기존 방식 대비 우수한 성능을 보였으며, 특히 4비트 및 3비트 양자화에서 탁월한 결과를 달성했다.
COMQ의 핵심 특징은 다음과 같다:
לשפה אחרת
מתוכן המקור
arxiv.org
תובנות מפתח מזוקקות מ:
by Aozhong Zhan... ב- arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07134.pdfשאלות מעמיקות