Core Concepts
マイクロサービスベースのアプリケーションにおける予期せぬまたは望ましくない動作の根本原因を特定することは重要な課題である。本研究では、この問題に取り組むための標準化されたデータセットを提供し、様々な因果関係および非因果関係のアプローチを評価する。
Abstract
本研究では、マイクロサービスベースのアプリケーションから収集された潜在的な性能問題を含むデータセットを紹介する。このデータセットには、5分間隔で収集された待ち時間、リクエスト数、可用性のメトリクスが含まれている。さらに、68の注入された性能問題が含まれており、システム全体の待ち時間の増加と可用性の低下を引き起こす。
このデータセットを使用して、因果関係と非因果関係の特徴付けを行う様々な手法の精度を評価する。因果関係を利用する手法は、因果グラフが与えられた場合に良好な性能を示すが、グラフを学習する必要がある場合は十分な性能が得られない。一方、因果グラフを必要としない手法は、限られたデータでも頑健に機能する可能性がある。本研究では、このデータセットを用いて、マイクロサービスにおける根本原因分析の新しい手法の開発を促進することを目的としている。
Stats
PetSiteノードの待ち時間が増加し、可用性が低下する原因となった。
PetSearchノードにおける問題が原因となっている。
payforadoptionノードの遅延が、PetSiteノードの応答時間に影響を与えている。