Core Concepts
다중 테넌트, 다중 가속화기 시스템에서 테넌트별 QoS 관리를 위한 강화 학습의 중요성
Abstract
I. 서론
클라우드 서비스의 QoS 관리의 중요성
서비스 수행 기대치와 하드웨어, 소프트웨어 품질의 영향
일관된 QoS 유지를 위한 전략과 기술 필요
II. 관련 연구
클라우드 기반 DNN 실행의 현대적 추세
다양한 DNN 모델을 효율적으로 처리하기 위한 스케줄링 알고리즘 필요
III. 문제 제시 및 제안된 해결책
클라우드 기반 서비스 환경에서의 DNN 실행
Multi-Accelerator 시스템을 활용한 테넌트별 QoS 기대치 충족
IV. 실험
두 가지 사용 사례에 대한 평가 결과 제시
에너지 오버헤드 평가 결과 소개
V. 결론
강화 학습을 활용한 테넌트별 QoS 제공의 중요성 강조
Stats
"The work of M. Palesi, who has contributed to the development of Sec. 3, has been supported by the Spoke 1 ”FutureHPC & BigData” of the Italian Research Center on High-Performance Computing, Big Data and Quantum Computing (ICSC)."
"The work of V. Catania, who has contributed to Sec. 4, has been supported by PNRR MUR project PE0000013-FAIR."
Quotes
"Each user, or “tenant”, commonly has unique quality expectations."
"This paper will delve into managing tenant-specific QoS within an online, firm real-time scheduling framework for Deep Neural Networks (DNNs) in a multi-tenant, multi-accelerator setting."