이 논문은 자원 제한적인 모바일 및 엣지 디바이스 클러스터에서 합성곱 신경망(CNN)을 분산 학습하는 방법을 제안한다. 기존의 클라우드 기반 학습 방식은 지연 시간과 프라이버시 문제가 있어, 최근 엣지 디바이스에서의 학습 방법이 연구되고 있다.
제안하는 방법은 특징 맵 중심의 초기 CNN 레이어에 초점을 맞춘다. 타일링과 퓨징 기반의 분할 기법을 통해 메모리 사용량을 줄이고 병렬성을 높인다. 또한 레이어 그룹화를 통해 계산과 통신의 균형을 조정한다.
구체적으로, 입력 특징 맵과 델타 그래디언트 맵을 타일 단위로 분할하여 각 디바이스에서 독립적으로 순전파와 역전파를 수행한다. 이때 인접한 타일 간 경계 데이터를 교환한다. 또한 여러 레이어를 그룹화하여 그룹 경계에서만 데이터를 교환함으로써 통신 오버헤드를 줄인다.
실험 결과, 4-6개의 Raspberry Pi 3 디바이스 클러스터에서 Yolov2 CNN 모델을 학습할 때 단일 코어 대비 2-15배 속도 향상과 최대 8배 메모리 사용량 감소를 달성했다. 또한 그룹화 기법을 통해 최대 1.5배 추가 속도 향상을 얻었다.
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor