이 연구는 게이트 순환 유닛(GRU)의 양자화 기법을 개선하기 위해 유전 알고리즘을 활용한다. 기존의 균일 정밀도 양자화 기법과 달리, 제안하는 기법은 각 연산 단계의 비트 폭을 독립적으로 선택할 수 있는 모듈식 정수 양자화 방식을 사용한다. 유전 알고리즘을 통해 정확도와 모델 크기를 동시에 최적화하는 혼합 정밀도 양자화 방식을 탐색한다. 4가지 다양한 순차 분류 과제에 대한 실험 결과, 제안 기법이 균일 정밀도 양자화 기법에 비해 25%에서 55%의 모델 크기 감소를 달성하면서도 유사한 수준의 정확도를 유지할 수 있음을 보여준다.
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문