本論文は、分散メモリ並列化(DMP)のための自動コードジェネレーション手法を紹介している。主な内容は以下の通り:
Devito DSLとコンパイラフレームワークに統合された自動MPI コードジェネレーション手法を提案している。ユーザーは高レベルの記述から並列化を意識せずにHPC向けの分散メモリ並列化を活用できる。
計算と通信のオーバーラップ、通信パターンの最適化など、様々な並列化手法を自動的に生成する。これにより、実行時間の大幅な短縮と開発工数の削減を実現する。
4つの波動伝播モデルを用いた性能評価を行い、提案手法の有効性を示している。特に、計算集約型のTTIモデルでは、理想的な強スケーリング効率の76-78%を達成している。
提案手法は、Devito内部で実装されているが、有限差分ソルバーに一般的に適用可能な概念と手法を提示している。
他の言語に翻訳
原文コンテンツから
arxiv.org
深掘り質問