Core Concepts
本研究では、有限差分法に基づく大規模シミュレーションを効率的に実行するための自動MPI コードジェネレーション手法を提案する。
Abstract
本論文は、分散メモリ並列化(DMP)のための自動コードジェネレーション手法を紹介している。主な内容は以下の通り:
Devito DSLとコンパイラフレームワークに統合された自動MPI コードジェネレーション手法を提案している。ユーザーは高レベルの記述から並列化を意識せずにHPC向けの分散メモリ並列化を活用できる。
計算と通信のオーバーラップ、通信パターンの最適化など、様々な並列化手法を自動的に生成する。これにより、実行時間の大幅な短縮と開発工数の削減を実現する。
4つの波動伝播モデルを用いた性能評価を行い、提案手法の有効性を示している。特に、計算集約型のTTIモデルでは、理想的な強スケーリング効率の76-78%を達成している。
提案手法は、Devito内部で実装されているが、有限差分ソルバーに一般的に適用可能な概念と手法を提示している。
Stats
1/dt
1/(h_xh_x)
1/(h_yh_y)
-2.0u[t0,x + 2,y + 2]
dt(r0*u[t0, x + 2, y + 2] + ...)