Core Concepts
変数間の依存関係を利用することで、より解釈可能性の高い意味のある異常を発見できる。
Abstract
本論文では、変数間の依存関係を利用した異常検知フレームワーク「DepAD」を提案している。DepADは、教師付き特徴選択と予測タスクとして異常検知を再定式化することで、ユーザーが特定の問題やデータに合わせて異常検知アルゴリズムをカスタマイズできるようにする。
DepADフレームワークは3つのフェーズから構成される:
関連変数の選択: 各変数について、その予測に最も関連する変数を選択する。
予測モデルの学習: 各変数について、関連変数を使って予測モデルを学習する。
異常スコアの生成: 各オブジェクトについて、観測値と予測値の差異から異常スコアを算出する。
DepADフレームワークでは、各フェーズで様々な既存手法を組み合わせることができる。本論文では、各フェーズの代表的な手法を評価し、特に因果的特徴選択手法(HITON-PC、FBED)と決定木ベースの予測モデル(CART、mCART)が優れた性能を示すことを明らかにした。また、異常スコアの生成では、RZPS(ロバストZ-score)とPSが良好な結果を得ることを示した。
さらに、DepADフレームワークを用いて検知された異常に対して、変数間の依存関係に基づいて解釈を行う方法についても説明している。
Stats
身長162cm、体重100kgの人物は肥満と判断される。
身長200cm、体重100kgの人物は正常と判断される。