Core Concepts
ディープシーケンスモデルを使用して、GPUコンピューティングカーネルの最適なチューニングパラメータを正確に予測することができる。
Abstract
本研究では、GPUコンピューティングカーネルの性能を最適化するためのチューニングパラメータを予測するためのディープシーケンスモデルを提案している。
主な内容は以下の通りです:
GPUコンピューティングカーネルのパフォーマンスチューニングパラメータを予測するためのシーケンス・ツー・シーケンスモデルの有効性を示す。
入力テンソルの特性と出力チューニングパラメータの関係を学習する新しいネットワークアーキテクチャを提案する。
ハードウェアの物理的制限と専門知識を組み込んだ制約付きビームサーチを導入し、検索空間を効果的に削減する。
提案手法は、AMDのMIOpenライブラリ内の様々な畳み込みカーネルに対して90%以上の高い予測精度を達成できることを示している。これにより、未知の入力構成に対するチューニングパラメータの開発時間とコンピューティングリソースを大幅に削減でき、ユーザーエクスペリエンスの向上につながる。
Stats
GPUコンピューティングカーネルの最適なチューニングパラメータを予測するためには、入力テンソルの特性を正確に捉える必要がある。
Quotes
"GPUカーネルは、高性能コンピューティングからマシンラーニングまで、さまざまな分野で重要な役割を果たしている。典型的なGPUコンピューティングカーネルは、アプリケーションの中で何百万、何十億回も呼び出されるため、その性能は非常に重要である。"
"最適なチューニングパラメータを発見するには、膨大な数のパラメータ組み合わせを網羅的に検索する必要があるが、これは現実的ではない。"