본 논문은 기존 신경망 모델을 조기 종료 신경망(EENN)으로 자동 변환하는 프레임워크를 제안한다. EENN은 추론 과정에서 동적으로 종료 시점을 결정하여 연산량과 지연 시간을 줄일 수 있어 임베디드 및 IoT 환경에 적합하다.
프레임워크의 주요 기능은 다음과 같다:
실험 결과, 음성 명령 인식 과제에서 평균 연산량을 59.67% 감소, ECG 분류 과제에서 평균 추론 에너지를 74.9% 감소, CIFAR-10에서 최대 58.75%의 연산량 감소를 달성했다. 또한 ResNet-152 기반 CIFAR-10 모델 변환에 9시간 미만의 짧은 검색 시간이 소요되어 일반 사용자도 활용할 수 있는 수준의 접근성을 제공한다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Max Sponner,... at arxiv.org 03-14-2024
https://arxiv.org/pdf/2403.07957.pdfDeeper Inquiries