核心概念
사후 훈련 증강을 통해 기존 모델을 조기 종료 신경망으로 자동 변환하여 이기종 및 분산 하드웨어 환경에 배포하고 실행 시 결정 메커니즘을 구성하는 프레임워크를 제안한다.
摘要
본 논문은 기존 신경망 모델을 조기 종료 신경망(EENN)으로 자동 변환하는 프레임워크를 제안한다. EENN은 추론 과정에서 동적으로 종료 시점을 결정하여 연산량과 지연 시간을 줄일 수 있어 임베디드 및 IoT 환경에 적합하다.
프레임워크의 주요 기능은 다음과 같다:
- 기존 모델의 아키텍처를 분석하여 EENN 구조를 자동 생성
- EENN의 서브그래프를 이기종 및 분산 하드웨어에 매핑
- 실행 시 결정 메커니즘 구성
실험 결과, 음성 명령 인식 과제에서 평균 연산량을 59.67% 감소, ECG 분류 과제에서 평균 추론 에너지를 74.9% 감소, CIFAR-10에서 최대 58.75%의 연산량 감소를 달성했다. 또한 ResNet-152 기반 CIFAR-10 모델 변환에 9시간 미만의 짧은 검색 시간이 소요되어 일반 사용자도 활용할 수 있는 수준의 접근성을 제공한다.
統計資料
음성 명령 인식 과제에서 평균 연산량이 59.67% 감소했다.
ECG 분류 과제에서 평균 추론 에너지가 74.9% 감소했고, 연산량이 78.3% 감소했다.
CIFAR-10에서 최대 58.75%의 연산량 감소를 달성했다.
ResNet-152 기반 CIFAR-10 모델 변환에 9시간 미만의 검색 시간이 소요되었다.
引述
"사후 훈련 증강을 통해 기존 모델을 조기 종료 신경망(EENN)으로 자동 변환하여 이기종 및 분산 하드웨어 환경에 배포하고 실행 시 결정 메커니즘을 구성하는 프레임워크를 제안한다."
"실험 결과, 음성 명령 인식 과제에서 평균 연산량을 59.67% 감소, ECG 분류 과제에서 평균 추론 에너지를 74.9% 감소, CIFAR-10에서 최대 58.75%의 연산량 감소를 달성했다."