toplogo
Entrar

DNN Multi-Tenant Multi-Accelerator Systems Real-Time Scheduling via Reinforcement Learning


Conceitos Básicos
Deep Reinforcement Learning for tenant-specific QoS management in multi-tenant, multi-accelerator cloud environments.
Resumo

この論文は、クラウドサービスにおける品質サービス(QoS)の管理に焦点を当て、個々のテナントの期待とさまざまなサービスレベルインジケーター(SLI)の微妙なニュアンスに対処しています。提案されたアプローチは、Deep Reinforcement Learningを利用して、マルチテナント、マルチアクセラレーターのクラウド環境でテナント固有のQoS管理を行います。選択されたSLIである締め切り達成率は、各サービスリクエストに対して顧客がQoSを調整できるようにします。提案されたオンラインスケジューリングアルゴリズムは、マルチアクセラレーターシステム内のDeep Neural Networksのためにモデル固有のQoSレベルを保証することに焦点を当てており、リアルタイム制約も考慮しています。

edit_icon

Personalizar Resumo

edit_icon

Reescrever com IA

edit_icon

Gerar Citações

translate_icon

Traduzir Texto Original

visual_icon

Gerar Mapa Mental

visit_icon

Visitar Fonte

Estatísticas
M. Hamdaoui and P. Ramanathan, “A dynamic priority assignment technique for streams with (m, k)-firm deadlines,” IEEE transactions on Computers, vol. 44, no. 12, pp. 1443–1451, 1995. Y. Choi and M. Rhu, “Prema: A predictive multi-task scheduling algorithm for preemptible neural processing units,” in 2020 IEEE International Symposium on High Performance Computer Architecture (HPCA). H. Kwon, L. Lai, M. Pellauer, T. Krishna, Y.-H. Chen, and V. Chandra, “Heterogeneous dataflow accelerators for multi-dnn workloads,” in 2021 IEEE International Symposium on High-Performance Computer Architecture (HPCA).
Citações
"Each user commonly has unique quality expectations aligning with their expenditure on the service." "This paper will delve into managing tenant-specific QoS within an online firm real-time scheduling framework." "The proposed method contributes to fairer, more dependable, and efficient scheduling within multi-accelerator systems."

Perguntas Mais Profundas

どうやって新しいテナントがサービスを使用し始めた後でもポリシーを再トレーニングせずにオンラインスケジュール決定を更新することが可能ですか?

提案された方法では、新しいテナントがサービスを利用し始めてもポリシーの再トレーニングなしでオンラインスケジュール決定を更新することが可能です。これは、個々のテナント情報を明示的に必要とせず、データベース内に保存されるターゲットSLIおよび現在のSLI情報を活用しています。この情報はオンラインで取得され、スケジューラによって適切に更新されます。新たなテナントがサービスを開始しても、ポリシー・ネットワーク自体は追加データ負荷なく動作します。

提案された方法は他のメソッドと比較してどれだけ公平性を意識したものですか?

提案された方法は非常に公平性を重視したアプローチです。例えば、「Use Case 1: Fairness」では100人の異なるテナントから成る状況で各テナントごとにSLO達成率(目標通りの処理割合)が評価されました。結果からわかるように、提案手法では全体的なSLO達成率が高く出ています。また、「Use Case 2: Towards Firm Real Time Execution」でも同様に高いパフォーマンスが見られました。この手法は公正さや効率性向上など多方面から優れており、マルチアクセラレータ・システム内でより公平で信頼性の高いスケジュール管理が実現可能です。

エネルギーオーバーヘッドが最小限であることが重要ですか?

エネルギーオーバーヘッドは常に重要な考慮事項です。特定の技術やアプローチが採用される際、そのエネルギー消費量やコスト効率性は大きな影響力を持ちます。提案手法ではエネルギーオバードヘッドも評価対象として取り上げられており、従来手法や基準値と比較しつつその影響度合いや改善点等も考察されました。 結果的にエネルギー消費量低減策や省電力設計等も今後更なる研究課題及び展望と言えます。
0
star