Core Concepts
Adopter는 도메인 특화 언어(DSL)를 사용하여 딥러닝 모델 구조를 추출하고, 다양한 최적화 규칙을 적용하여 모델 구현을 자동으로 변환함으로써 모델 학습 및 추론 효율을 향상시킨다.
Abstract
이 논문은 딥러닝 모델의 계산 효율성을 높이기 위한 자동화 접근법인 Adopter를 소개한다.
Adopter는 도메인 특화 언어(DSL)를 사용하여 딥러닝 모델 구조를 추출한다. DSL은 모델 구조를 DL 레이어와 텐서 연산의 순서로 표현한다.
Adopter는 DSL 기반 모델 구조와 사전 정의된 최적화 규칙을 매칭하여 최적화 적용 위치를 찾는다. 최적화 규칙은 DL 레이어 초기화와 모델 구조 변환을 포함한다.
Adopter는 합성 기반 코드 변환 방법을 사용하여 최적화 규칙을 적용한다. 이를 통해 복잡한 제어 흐름을 가진 모델 구현에서도 최적화를 수행할 수 있다.
실험 결과, Adopter는 기존 자동 코드 변환 기법 대비 정확도와 재현율을 각각 3%와 56% 향상시켰다. 또한 9개 모델에 대한 분석 결과, Adopter를 통해 평균 22.7% 더 빠른 학습 속도와 10.5% 더 낮은 GPU 메모리 사용량을 달성할 수 있었다.
Stats
딥러닝 모델 학습 속도가 평균 22.7% 향상되었다.
딥러닝 모델의 GPU 메모리 사용량이 평균 10.5% 감소했다.
Quotes
"As deep learning models become increasingly bigger and more complex, it is critical to improve model training and inference efficiency."
"Though a variety of highly optimized libraries and packages (known as DL kernels) have been developed, it is tedious and time-consuming to figure out which kernel to use, where to use, and how to use them correctly."