核心概念
TAOCSは、任意の入力ネットワークトポロジに対して、トポロジ対応型の集合的アルゴリズムを自動的に合成する。
要約
本論文では、TACOS (Topology-Aware Collective Algorithm Synthesizer) を提案する。TAOCSは、ネットワークトポロジと集合的パターンを入力として受け取り、時間拡張ネットワーク (TEN) を用いて、ネットワークリソースの利用を最大化するトポロジ対応型の集合的アルゴリズムを自動的に合成する。
TAOCSの主な特徴は以下の通りである:
TENの概念を分散機械学習の分野に初めて導入し、集合的アルゴリズムの表現に活用した。
任意の非対称、非均一なトポロジをサポートし、ノード障害や部分的な集合的実行にも対応できる。
ネットワーク輻輳の影響を合成プロセスに組み込むことで、高品質な検索結果を得ることができる。
貪欲マッチングアプローチにより、大規模トポロジに対しても効率的な合成時間を実現できる。
TAOCSは、64ノードシステムで従来手法に比べて最大4.27倍の性能向上を示し、40,000ノードのメッシュトポロジに対しても2.52時間で合成を完了した。また、256ノードの異種3Dトポロジを活用したエンドツーエンドの学習タスクでは、平均1.44倍の高速化を達成した。
統計
10.27 µs
20.53 µs
53.83 µs