本研究では、多次元高速フーリエ変換(FFT)アルゴリズムを非同期タスクモデルに移植するケーススタディを行った。FFTは多くのアプリケーションで使用される重要な演算であり、並列化手法の評価に適している。
まず、HPXを使用した複数の並列実装を検討し、非同期タスクモデルの課題を明らかにした。タスクの依存関係を最適化することで、キャッシュパフォーマンスが大幅に改善された。一方で、同期化を強制する実装が最も高い性能を示した。
次に、FFTWライブラリのHPXバックエンドを実装し、既存のバックエンドと性能を比較した。HPXバックエンドは、適切な計画時間を設定すれば、既存のバックエンドと同等の性能を発揮した。
最後に、分散環境でのFFT実装を検討した。HPXのコレクティブ操作を使用した実装は、FFTW のMPI+Xと同等の性能を示し、LCIパーセルポートを使用することで最大5倍の通信速度向上を実現した。
本研究の結果から、非同期タスクモデルの利点を最大限に活用するには、アルゴリズムの特性に加えて、キャッシュパフォーマンスやデータ通信などの重要な要因を考慮する必要があることが明らかになった。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies