本論文では、不規則並列計算の問題に対して、最適なカーネルを動的に選択するための予測フレームワーク「Seer」を提案している。
まず、GPUベンチマーキングを行い、様々なカーネルの性能データを収集する。次に、動的に計算される特徴量を収集するためのカーネルを実行する。これらのデータを用いて、決定木ベースの予測モデルを構築する。モデルには、既知の特徴量のみを使う簡易モデルと、動的に収集した特徴量も使うより高精度なモデルの2種類がある。さらに、これらのモデルを選択するためのメタモデルも構築する。
runtime予測の精度は、既知特徴量モデルが77%、動的特徴量モデルが83%、メタモデルが95%となった。メタモデルは、特徴量収集コストを考慮しつつ、最適なモデルを選択することができる。
本手法をSparse Matrix Vector Multiplication (SpMV)のケーススタディに適用した結果、Oracle選択に比べて2倍の性能向上、全体で6.5倍の平均速度向上が得られた。また、前処理コストの償却も適切に予測できることを示した。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문