本論文では、TTKをMPI対応させるための技術的基盤を文書化している。
まず、分散メモリ環境での入力データと出力データの分散表現のための概念モデルを定式化している(第3節)。次に、TTKの内部三角形データ構造をMPI対応させる拡張を提案している(第4節)。また、複数の topological アルゴリズムを単一の分散パイプラインで一貫して組み合わせるためのインターフェースを文書化している(第5節)。
性能評価では、通信ニーズに応じたTTKのtopological アルゴリズムのタクソノミーを提示し(第6.1節)、MPI+スレッド並列化の例を示している(第6.3節)。詳細な性能分析では、並列効率が20%から80%の範囲にあり(アルゴリズムによって異なる)、提案するフレームワークによる計算時間のオーバーヘッドが無視できることを示している(第7.1節)。
また、120億頂点のデータセットを64ノード(合計1536コア)のクラスタ上で実行する高度な分析パイプラインの例を示している(第6.4節、第7.2節)。最後に、MPI拡張の完了に向けたロードマップと、各アルゴリズムの通信カテゴリーに対する一般的な推奨事項を提示している(第8節)。
翻譯成其他語言
從原文內容
arxiv.org
深入探究