核心概念
大規模データセンターネットワークにおいて、ネットワークレベルメトリクス(NLM)とアプリケーション facing パフォーマンスメトリクス(AFM)間の関係をモデル化することで、アプリケーションのパフォーマンスを予測できる可能性がある。
要約
データセンターネットワークメトリクスを用いたアプリケーションパフォーマンス予測
本稿は、大規模データセンターネットワーク(DCN)において、ネットワークレベルメトリクス(NLM)からアプリケーション facing パフォーマンスメトリクス(AFM)を予測する手法を提案しています。
大規模アプリケーションは、複数のマシンに分散され、DCNのパフォーマンス(遅延やスループットなど)に依存します。
ネットワーク設計者や運用者は、ネットワーク設計や運用がアプリケーションパフォーマンスに与える影響を評価する必要があります。
しかし、スケール、プライバシー、アプリケーションへの計測の侵入性、将来のワークロードの未知数などの理由から、アプリケーションパフォーマンスを直接測定することは困難です。
本稿では、容易に測定可能なNLMからAFMを予測する、シンプルで直感的な予測モデルを作成する手法を提案しています。
データ収集: 複数の本番環境のDCNから、NLMとAFMのデータセットを収集します。
ニー検出: AFMとNLMの関係における「ニー」(変曲点)を検出します。ニーは、ネットワークが輻輳状態に移行するポイントを示唆しています。
分位点回帰: ニーの左側(輻輳していない領域)のデータに対して、分位点回帰を用いて、NLMとAFMの関係をモデル化します。分位点回帰は、外れ値の影響を受けにくく、信頼区間を提供します。
モデル選択: 線形モデルとキューイング理論に基づくモデルの両方で分位点回帰を実行し、最も適合度の高いモデルを選択します。