본 연구는 신경망 온칩 구현을 위해 가중치 및 활성화 함수 단위로 혼합 정밀도 양자화를 자동으로 수행하는 혁신적인 기법을 제안한다. 이를 통해 기존 방식 대비 자원 사용을 최대 20배 줄이고 지연 시간을 5배 개선하면서도 정확도를 유지할 수 있다.