本論文では、並列アーキテクチャの性能と規模の向上に対して、基礎的なアルゴリズムインフラストラクチャがそれらの計算能力を十分に活用できていないことを指摘している。特に、MPI内での不規則なコミュニケーションパターンがボトルネックとなっている問題に着目している。
論文では以下の3つの主要な貢献を行っている:
疎な動的データ交換のための新しいAPIを提案した。これにより、アプリケーション開発者は様々な最適化手法を利用できるようになる。
局所性を考慮した新しい疎な動的データ交換アルゴリズムを提案した。これにより、ソケット内、ソケット間、ノード間のコミュニケーションコストの違いを最小化できる。
提案手法の性能評価を行い、従来手法に比べて最大20倍の高速化を達成できることを示した。
具体的には、疎な動的データ交換問題を定式化し、既存の手法である個人化手法、非ブロッキング手法、RMA手法について説明している。その上で、局所性を考慮した拡張手法を提案している。性能評価では、Suitesparse Matrix Collectionのデータセットを用いて、提案手法の有効性を示している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Andrew Geyko... at arxiv.org 04-04-2024
https://arxiv.org/pdf/2308.13869.pdfDeeper Inquiries