핵심 개념
무선 다중 접속 채널을 활용하여 분할 학습의 지연 시간을 크게 줄일 수 있는 새로운 프레임워크를 제안한다. 이를 위해 디바이스를 그룹화하고 동시 전송을 활용하여 업링크 지연 시간을 최소화한다.
초록
본 논문은 무선 다중 접속 채널을 활용하여 분할 학습의 지연 시간을 크게 줄일 수 있는 새로운 프레임워크인 SplitMAC를 제안한다.
SplitMAC의 핵심 전략은 다음과 같다:
- 디바이스를 여러 그룹으로 나누고, 같은 그룹 내 디바이스들이 동시에 무선 다중 접속 채널을 통해 smashed data와 디바이스 측 모델을 전송할 수 있도록 한다.
- 서버 측 모델의 지역적 업데이트와 업링크-다운링크 동시 전송을 추가로 활용하여 지연 시간을 더욱 줄인다.
이를 위해 디바이스 그룹화 최적화 문제를 정의하고, 이의 해를 분석하여 디바이스 그룹화의 장점을 이론적으로 증명한다. 또한 두 디바이스 그룹화 경우에 대해 최적의 알고리즘을 제안하고, 이를 결합한 준최적 알고리즘을 제안한다.
시뮬레이션 결과, SplitMAC가 기존 분할 학습 프레임워크 대비 지연 시간을 크게 줄일 수 있음을 확인하였다.
통계
디바이스 k의 다운링크 전송률은 RDL
k이다.
디바이스 k의 업링크 전송률은 RUL
k이다.
디바이스 k의 CPU 성능은 fk이다.
서버의 CPU 성능은 fs이다.
한 배치의 데이터 크기는 D이다.
디바이스 측 모델의 크기는 Bd이다.
smashed data의 크기는 Bsd이다.
중간 gradient의 크기는 Bg이다.
디바이스 측 모델의 순전파 계산량은 γF
d이다.
디바이스 측 모델의 역전파 계산량은 γB
d이다.
서버 측 모델의 순전파 계산량은 γF
s이다.
서버 측 모델의 역전파 계산량은 γB
s이다.
디바이스와 서버의 연산 강도는 각각 κd와 κs이다.