Core Concepts
직접 합성과 가중치 병렬화를 통한 OpenEdgeCGRA에서의 최상의 성능과 에너지 효율성을 보여줌
Abstract
최근에는 엣지에서 딥러닝 솔루션을 효율적으로 배포하는 것이 중요해짐
CGRA를 활용한 합성 계층의 효율적 매핑을 탐구
직접 합성과 Im2col 변환을 통한 솔루션 비교
가중치 병렬화를 통해 CPU 구현을 능가하는 결과 도출
다양한 최적화 방향과 텐서 병렬화 축을 탐구
OpenEdgeCGRA 아키텍처의 하드웨어 플랫폼 소개
다양한 컨볼루션 매핑 전략 탐구
성능 측정 지표 및 실험 결과 분석
가장 효율적인 매핑 기술은 직접 합성과 가중치 병렬화
에너지 및 지연 면에서 CPU 구현을 능가
하이퍼파라미터 변화에 대한 강건성 평가
Stats
OpenEdgeCGRA에서 CPU 구현을 3.4배와 9.9배 에너지 및 지연 면에서 능가
Quotes
"직접 합성과 가중치 병렬화는 에너지 및 지연 면에서 CPU 구현을 능가한다."
"OpenEdgeCGRA 아키텍처를 활용한 가장 효율적인 매핑 기술은 직접 합성과 가중치 병렬화다."