Core Concepts
GPU 공유를 고려한 효율적인 DNN 워크플로우 스케줄링 알고리즘 ESG를 제안하여 SLO 달성률을 높이고 비용을 절감한다.
Abstract
이 논문은 서버리스 컴퓨팅 환경에서 GPU 공유를 활용한 DNN 워크플로우 스케줄링 문제를 다룬다. 기존 솔루션들은 함수 간 관계, GPU 공유, 배치 처리, 런타임 변동성 등 중요한 요소들을 간과하여 성능 저하를 겪었다.
이 논문에서는 ESG라는 새로운 스케줄링 알고리즘을 제안한다. ESG는 다음과 같은 특징을 가진다:
GPU를 1순위 요소로 다룬다.
A* 탐색과 이중 가지치기 기법을 통해 스케줄링 공간을 효과적으로 축소한다.
도미네이터 기반 SLO 분배 기법으로 확장성을 높인다.
최적성 기반 적응형 접근법으로 동적 변화에 대응한다.
실험 결과, ESG는 기존 솔루션 대비 61%-80% 더 높은 SLO 달성률을 보이며 47%-187% 더 낮은 비용을 달성했다.
Stats
DNN 모델의 최소 구성(1vCPU, 1vGPU, 배치 크기=1)에서의 실행 시간은 다음과 같다:
슈퍼 해상도: 86ms
분할: 293ms
디블러: 319ms
분류: 147ms
배경 제거: 1047ms
깊이 인식: 828ms
Quotes
"GPU 공유를 고려한 효율적인 DNN 워크플로우 스케줄링 알고리즘 ESG를 제안하여 SLO 달성률을 높이고 비용을 절감한다."
"ESG는 GPU를 1순위 요소로 다루며, A* 탐색과 이중 가지치기 기법으로 스케줄링 공간을 효과적으로 축소하고, 도미네이터 기반 SLO 분배 기법으로 확장성을 높인다."