Core Concepts
DNN 추론을 위한 로그-포지트 인코딩의 효율적인 알고리즘-하드웨어 공동 설계의 중요성과 성과
Abstract
전통적인 DNN 양자화 방법의 한계와 LP의 적응성 소개
LPQ 프레임워크를 통한 LP 매개변수 최적화 방법 소개
LPA 아키텍처 설명과 성능 향상 결과 제시
LPQ의 수렴 행동과 성능 비교 결과 제시
LPA의 면적 및 성능 비교 결과 제시
Stats
로그-포지트 인코딩을 통한 <1%의 정확도 하락
성능 단위 면적당 2배 향상
상태-of-the-art 양자화 가속기 대비 2.2배 에너지 효율 향상
Quotes
LPQ 프레임워크는 "전역-지역 대조 목적"을 통해 양자화 매개변수를 최적화합니다.
LP는 "효율적인 정확도를 제공하며 DNN 매개변수 분포에 적응"합니다.