本文提出了一種新的概念 - 異常自由區域 (AFR),用於改善異常檢測。
AFR是一個在數據空間中已知沒有異常的區域。這個區域可以包含任意數量的正常數據點,並且可以位於數據空間的任何位置。
AFR與常見的異常檢測方法中的濃度假設有所不同。濃度假設意味著正常數據點形成密集的簇,而異常則通常位於較稀疏的區域。而AFR不需要與高密度區域重合。
作者提出了一個理論基礎和參考實現,利用AFR進行異常檢測。實驗結果證實,使用AFR限制的異常檢測優於無限制的異常檢測。具體而言,當配備估計的AFR時,一種基於隨機猜測的高效算法成為一個強大的基準,許多廣泛使用的方法都難以超越。在一個有可用的真實AFR的數據集上,現有的最先進方法也被超越了。
在沒有已知AFR的情況下,也可以估計一個AFR。作者展示了提出的算法在沒有AFR的情況下也能表現出色,並且與最先進的異常檢測方法相競爭。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询