Core Concepts
AutoDDL은 OneFlow의 SBP 추상화를 활용하여 근최적 통신 비용의 병렬화 전략을 자동으로 탐색하고 구현한다.
Abstract
AutoDDL은 최근 발전한 대규모 딥러닝 모델 학습을 위한 분산 학습 프레임워크이다. 대규모 모델 학습 시 통신 비용이 주요 성능 병목이 되므로, AutoDDL은 데이터, 연산자, 파이프라인 병렬화 기법을 활용하여 통신 비용을 최소화하는 병렬화 전략을 자동으로 탐색한다.
AutoDDL은 OneFlow의 SBP(Split, Broadcast, Partial Sum) 추상화를 활용하여 다양한 병렬화 전략을 기술할 수 있다. 이를 통해 2D, 2.5D, 3D 분산 행렬 곱셈 등 근최적 통신 비용의 전략을 탐색할 수 있다. 또한 AutoDDL은 성능 모델과 맞춤형 탐색 알고리즘을 활용하여 효율적으로 최적의 병렬화 전략을 찾아낸다.
실험 결과, AutoDDL은 전문가가 최적화한 구현 대비 Transformer 모델에서 최대 31.1%, VGG 모델에서 최대 71.5%의 학습 시간 단축을 달성했다. 이는 대규모 모델 학습 비용을 크게 절감할 수 있음을 보여준다.
Stats
분산 Transformer 모델 학습 시 AutoDDL은 최대 31.1%의 학습 시간 단축을 달성했다.
분산 VGG 모델 학습 시 AutoDDL은 최대 71.5%의 학습 시간 단축을 달성했다.
Quotes
"AutoDDL은 OneFlow의 SBP 추상화를 활용하여 근최적 통신 비용의 병렬화 전략을 자동으로 탐색하고 구현한다."
"실험 결과, AutoDDL은 전문가가 최적화한 구현 대비 Transformer 모델에서 최대 31.1%, VGG 모델에서 최대 71.5%의 학습 시간 단축을 달성했다."