核心概念
並列可能なジョブを持つ複数のクラスのワークロードを、限られたサーバ数で最小平均応答時間で処理するための最適なスケジューリングアルゴリズムを導出する。
要約
本論文では、並列可能なジョブを持つ複数のクラスからなるワークロードを、限られたサーバ数で処理するための最適なスケジューリングアルゴリズムを導出している。
まず、全てのクラスが同じ指数分布に従う場合、最も並列性の低いクラスのジョブを優先的に処理するLeast-Parallelizable-First (LPF)アルゴリズムが最適であることを示した。
次に、各クラスのジョブサイズ分布が異なる場合を考え、従来の重負荷極限では、最短期待残処理時間 (SERPT)アルゴリズムが最適であることを示した。
さらに、負荷が軽い場合(Sub-Halfin-Whitt)ではLPFが、負荷が重い場合(Super-NDS)ではSERPTが最適であることを明らかにした。これは、空きサーバの有無と待ち時間の重要性のトレードオフによるものである。
最後に、スケーリング挙動が事前に分からない場合の実用的な対処法や、非指数分布の場合の課題などについても議論している。
統計
並列可能なジョブは(サイズ, 並列度)の組で表される。
各ジョブクラスiは、サイズ分布Si、並列度ciを持つ。
全体の到着率は λ(k)、各クラスiの到着率は λ(k)i = piλ(k)。
全体の負荷は ρ = Σρi、各クラスiの負荷は ρi = λ(k)i / (kμi)。