核心概念
スリム フライ ネットワークの初の実世界展開を設計、実装、展開、評価し、その高性能を実証した。
要約
本論文では、低直径ネットワークトポロジーであるスリム フライ (SF) ネットワークの初の実世界展開について述べている。SF は、従来の Fat Tree、Clos、Dragonfly ネットワークに比べて大幅なコストとパワーの削減を実現する。
論文では以下の点に焦点を当てている:
- 展開、管理、運用の側面に注力し、200台のサーバーを持つテストクラスターを慎重に分析する。
- シンプルなケーブル配線とケーブル検証の手法を示す。
- InfiniBandベースの低直径トポロジーのための新しい高性能ルーティングアーキテクチャを提案する。
- 実世界ベンチマークにより、深層学習トレーニング、グラフ分析、線形代数カーネルなどの多くの現代的なワークロードに対するSFの強力なパフォーマンスを実証する。
- SFは非ブロッキングFat Treeよりもスケーラビリティに優れ、大規模なネットワークサイズでも同等以上のパフォーマンスを発揮しつつ、コストを削減できることを示す。
本研究は、SFの展開を促進し、提案するルーティングアーキテクチャ(オープンソース)は低直径インターコネクトを高速化するために完全に移植可能である。
統計
スリム フライ ネットワークは、従来の Fat Tree、Clos、Dragonfly ネットワークに比べて、コストとパワーをそれぞれ約25-30%削減できる。
スリム フライ ネットワークのレイテンシは、従来ネットワークの約50%である。
引用
"低直径ネットワークトポロジーは、レイテンシを低減するだけでなく、コストとパワー消費も削減する。"
"スリム フライ ネットワークの構築コスト、消費電力、レイテンシは、Clos や Fat Treeよりも低い。"