Основні поняття
Deep Reinforcement Learning for tenant-specific QoS management in multi-tenant, multi-accelerator cloud environments.
Анотація
この論文は、クラウドサービスにおける品質サービス(QoS)の管理に焦点を当て、個々のテナントの期待とさまざまなサービスレベルインジケーター(SLI)の微妙なニュアンスに対処しています。提案されたアプローチは、Deep Reinforcement Learningを利用して、マルチテナント、マルチアクセラレーターのクラウド環境でテナント固有のQoS管理を行います。選択されたSLIである締め切り達成率は、各サービスリクエストに対して顧客がQoSを調整できるようにします。提案されたオンラインスケジューリングアルゴリズムは、マルチアクセラレーターシステム内のDeep Neural Networksのためにモデル固有のQoSレベルを保証することに焦点を当てており、リアルタイム制約も考慮しています。
Статистика
M. Hamdaoui and P. Ramanathan, “A dynamic priority assignment technique for streams with (m, k)-firm deadlines,” IEEE transactions on Computers, vol. 44, no. 12, pp. 1443–1451, 1995.
Y. Choi and M. Rhu, “Prema: A predictive multi-task scheduling algorithm for preemptible neural processing units,” in 2020 IEEE International Symposium on High Performance Computer Architecture (HPCA).
H. Kwon, L. Lai, M. Pellauer, T. Krishna, Y.-H. Chen, and V. Chandra, “Heterogeneous dataflow accelerators for multi-dnn workloads,” in 2021 IEEE International Symposium on High-Performance Computer Architecture (HPCA).
Цитати
"Each user commonly has unique quality expectations aligning with their expenditure on the service."
"This paper will delve into managing tenant-specific QoS within an online firm real-time scheduling framework."
"The proposed method contributes to fairer, more dependable, and efficient scheduling within multi-accelerator systems."