Core Concepts
그래프 신경망의 계산 집약적인 부분을 엣지에, 계산 친화적인 부분을 디바이스에 분할하여 배포함으로써 효율성을 극대화하는 자동화 프레임워크를 제안한다.
Abstract
이 논문은 그래프 신경망(GNN)의 자동 설계 및 디바이스-엣지 공동 추론 시스템에 배포하는 GCoDE 프레임워크를 제안한다.
주요 내용은 다음과 같다:
GNN 아키텍처 설계와 매핑 스키마를 통합하여 공동 최적화하는 방법을 제안한다. 이를 통해 통신-계산 간 균형을 달성할 수 있다.
시스템 성능 인지 기법을 도입하여 다양한 이기종 환경에서 GNN 아키텍처의 효율성을 정확하게 평가할 수 있다.
제약 기반 랜덤 탐색 전략을 사용하여 효율적으로 최적의 GNN 아키텍처와 매핑 스키마를 찾아낼 수 있다.
통합된 공동 추론 엔진과 런타임 디스패처를 통해 자동화된 GNN 배포와 동적 실행을 지원한다.
실험 결과, GCoDE는 기존 접근법 대비 최대 44.9배 속도 향상과 98.2% 에너지 절감을 달성했다.
Stats
라즈베리 파이 4B에서 DGCNN 대비 11.5배 더 빠르고 92.3% 에너지 절감
Jetson TX2에서 DGCNN 대비 44.9배 더 빠르고 98.2% 에너지 절감
Quotes
"GCoDE는 디바이스-엣지 공동 추론 시스템을 위한 자동화된 GNN 설계 및 배포 프레임워크로, 기존 접근법 대비 월등한 성능을 보여준다."
"GCoDE는 아키텍처 설계와 매핑 스키마의 공동 최적화를 통해 통신-계산 간 균형을 달성하여 효율성을 극대화한다."