Core Concepts
유전 알고리즘을 활용하여 게이트 순환 유닛의 정확도와 모델 크기를 동시에 최적화하는 맞춤형 혼합 정밀도 양자화 기법을 제안한다.
Abstract
이 연구는 게이트 순환 유닛(GRU)의 양자화 기법을 개선하기 위해 유전 알고리즘을 활용한다. 기존의 균일 정밀도 양자화 기법과 달리, 제안하는 기법은 각 연산 단계의 비트 폭을 독립적으로 선택할 수 있는 모듈식 정수 양자화 방식을 사용한다. 유전 알고리즘을 통해 정확도와 모델 크기를 동시에 최적화하는 혼합 정밀도 양자화 방식을 탐색한다. 4가지 다양한 순차 분류 과제에 대한 실험 결과, 제안 기법이 균일 정밀도 양자화 기법에 비해 25%에서 55%의 모델 크기 감소를 달성하면서도 유사한 수준의 정확도를 유지할 수 있음을 보여준다.
Stats
양자화된 모델의 크기는 기존 FP16 모델 크기 대비 25%에서 55% 감소했다.
제안 기법의 정확도는 8비트 균일 정밀도 양자화 모델과 유사한 수준을 유지했다.
Quotes
"양자화 기법을 통해 모델 크기를 크게 줄일 수 있지만, 게이트 순환 유닛의 경우 내부 상태에 의존적이어서 8비트 미만 양자화의 이점을 충분히 누리기 어렵다."
"유전 알고리즘을 활용하여 정확도와 모델 크기를 동시에 최적화하는 혼합 정밀도 양자화 방식을 탐색한다."