本研究では、天気予報モデルWRFのFast Spectral Bin Microphysics (FSBM)スキームの最適化に取り組んだ。
まず、プロファイリングツールを使ってFSBMルーチンの計算時間を特定し、その中でも特に時間のかかるcoll_bott_newサブルーチンに着目した。Codeeを使ってこのサブルーチンの依存関係を分析し、グローバル配列の使用を削減することで大幅な高速化を実現した。
次に、OpenMP offloadを使ってcoll_bott_newのループをGPUに移行した。ただし、自動配列の使用によりスタックオーバーフローが発生したため、配列の宣言方法を変更して解決した。
最終的に、FSBM自体が2.99倍高速化され、WRFプログラム全体でも2.08倍の高速化を達成した。
GPUへのオフロードにより、WRFの計算時間を大幅に短縮できることが示された。今後は、他の計算集約的なルーチンもGPU化していく予定である。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Chayanon (Na... at arxiv.org 09-12-2024
https://arxiv.org/pdf/2409.07232.pdfDeeper Inquiries