Core Concepts
現実的なモデルにおいて、一般的な計算DAGを効率的にスケジューリングするアルゴリズムを開発し、分析する。
Abstract
本論文では、計算DAGを効率的にスケジューリングする問題を研究する。従来の研究では、比較的単純なモデルでアルゴリズムを開発・比較してきたが、本研究では、通信コスト、同期コスト、現代のプロセッサアーキテクチャの階層構造などの多くの現実世界の側面を捉えた、より現実的なモデルを分析する。
具体的には、以下の取り組みを行う:
既存のBSPモデルにNUMA効果を拡張する。
この拡張モデルに対して、いくつかの新しいスケジューリングアルゴリズムを開発する:
初期化ヒューリスティック
ヒルクライミングローカル探索法
整数線形計画(ILP)を用いたアプローチ
これらのアルゴリズムを組み合わせたフレームワークを構築する。
実世界の計算DAGを用いた実験を行い、ベースラインと比較して大幅な性能改善を示す。
NUMA効果がない場合でも、ベースラインより24-44%コストが低減
NUMA効果がある場合、最大で2.5倍の改善
さらに、通信コストが支配的な場合に有効なマルチレベルスケジューリングアルゴリズムを開発する。
最大で5倍の改善を達成
Stats
処理時間の最大値は、プロセッサ数Pが増えるほど、通信コスト係数gが大きいほど増加する。
NUMA効果が大きいほど(Δが大きいほど)、処理時間の最大値が増加する。
Quotes
"我々は、より現実的なモデルにおいて、一般的な計算DAGを効率的にスケジューリングするアルゴリズムを開発し、分析する。"
"我々のスケジューラは、ベースラインと比較して、最大で2.5倍の性能改善を達成する。"
"通信コストが支配的な場合には、マルチレベルスケジューリングアルゴリズムにより、最大で5倍の改善を達成する。"