核心概念
リアルタイムデータストリームからの突発的な変化を正確かつ効率的に検出するために、従来のCUSUMアルゴリズムの非パラメトリック拡張であるKCUSUMアルゴリズムを提案し、その性能を評価した。
要約
本研究では、リアルタイムデータストリームからの変化点検出に関する課題に取り組んでいる。従来のCUSUMアルゴリズムは、変化前後の分布が既知である必要があるという制限があった。そこで本研究では、非パラメトリックな手法であるMaximum Mean Discrepancy (MMD)を用いたKCUSUMアルゴリズムを提案した。
KCUSUMアルゴリズムの特徴は以下の通り:
変化前の参照サンプルとの比較に基づいて変化を検出する
変化前後の分布が未知でも変化点を検出可能
MMDの性質を利用して、検出遅延時間や平均誤検出時間などの理論的な性能解析が可能
本研究では、KCUSUMアルゴリズムの性能を分子動力学シミュレーションのデータを用いて評価した。具体的には以下の3つのケースを検討した:
平均値の変化 (原子衝突データ)
平均値の変化 (タンパク質構造変化データ)
平均値と分散の変化 (ペプチド折りたたみデータ)
各ケースにおいて、モンテカルロシミュレーションを用いて検出遅延時間と誤検出時間の関係を分析した。その結果、ケースによって性能が異なるものの、全体としてKCUSUMアルゴリズムが変化点検出に有効であることが示された。特に、変化の性質が事前に分からない状況でも良好な性能を発揮することが確認された。
統計
変化点検出時の平均遅延時間は以下の通りです:
ケース1: 約225サンプル
ケース2: 約300サンプル
ケース3: 約250サンプル