المفاهيم الأساسية
本稿では、動的グラフにおける異常検出において、時系列分析と極値理論を用いることで、従来手法の課題であった可変サイズのグラフや複雑な変化パターンへの対応、および高い精度と低い誤検出率の両立を実現する新しい特徴量ベースの手法を提案する。
本論文は、動的グラフにおける異常検出のための新しい手法を提案する研究論文である。
研究目的
本研究は、動的グラフにおける異常検出において、従来手法の課題であった、可変サイズのグラフや複雑な時間的ダイナミクスへの対応、および高い精度と低い誤検出率の両立を実現することを目的とする。
方法
本論文では、グラフの特徴量を抽出し、時系列分析を用いて時間的な依存関係をモデル化する手法を提案する。具体的には、まず、各グラフから20種類のグラフ特徴量を抽出し、固定長のベクトルに変換する。次に、自己回帰和分移動平均モデル(ARIMA)を用いて、特徴量の経時変化をモデル化する。そして、ARIMAモデルの予測値と実測値の残差を計算し、ロバスト主成分分析(PCA)を用いて2次元に次元削減する。最後に、一般化パレート分布(GPD)を用いて、次元削減された空間における低密度領域をモデル化し、異常値を検出する。
結果
提案手法を、TensorSplatおよびLaplacian Anomaly Detection(LAD)の2つの既存手法と比較評価した結果、提案手法は、Erdős-Rényiランダムグラフモデル、Barabási-Albert優先的アタッチメントモデル、Watts-Strogatzスモールワールドモデルの3種類のグラフを用いた実験において、いずれも既存手法よりも高い精度を達成した。
結論
提案手法は、動的グラフにおける異常検出において、従来手法の課題を克服し、高い精度と低い誤検出率の両立を実現する有効な手法であることが示された。
意義
本研究は、動的グラフにおける異常検出の分野において、従来手法の限界を克服する新しい手法を提案し、その有効性を示した点で意義深い。
限界と今後の研究
本研究では、グラフ特徴量の選択が経験的に行われている点が限界として挙げられる。今後の研究として、より適切な特徴量を選択するための手法の開発や、異常なサブグラフを検出するための手法への拡張などが考えられる。