Centrala begrepp
ANOMIX 透過混合圖以生成困難負樣本,並利用多層次對比學習來有效地識別圖中的異常節點,即使在標記數據有限的情況下也能達到高準確率。
論文概述
本論文提出了一種名為 ANOMIX 的新型圖異常檢測框架,該框架透過混合圖來生成困難負樣本,並利用多層次對比學習來有效地識別圖中的異常節點。
研究背景
圖異常檢測 (GAD) 旨在識別與大多數節點顯著不同的節點,近年來,圖神經網路 (GNN) 因其透過訊息傳遞機制學習圖表示的能力而被廣泛應用於 GAD。圖對比學習 (GCL) 透過對比正負樣本來估計差異,已證明其在 GAD 中的有效性。然而,GCL 通常需要大量的樣本,這在計算上可能非常昂貴。一種減少樣本數量並提高檢測準確率的有效方法是生成或挖掘一組具有表達力的困難負樣本。
ANOMIX 框架
ANOMIX 由兩個模組組成:(1) 圖混合模組 (ANOMIX-M);(2) 多層次對比模組。
圖混合模組 (ANOMIX-M)
為了透過混合圖生成困難負樣本,ANOMIX-M 首先為異常和正常節點分別構建以目標節點及其鄰居節點為中心的自我網路 (ego-net)。然後,利用標記資訊作為先驗知識,以標籤引導的方式混合這些自我網路,生成同時包含異常和正常特徵的困難負樣本。
多層次對比模組
ANOMIX 採用節點級和子圖級對比網路來學習正常和異常節點的多層次表示。節點級對比網路學習目標節點與其在自我網路中的掩碼目標節點之間的表示差異,而子圖級對比網路則學習目標節點與整個自我網路表示之間的上下文特徵差異。
實驗結果
在六個真實世界網路上的實驗結果表明,ANOMIX 在 AUC 值方面優於所有其他最先進的基線方法,最高可提高 5.49%。消融研究和敏感性分析進一步證明了所提出的困難負樣本的有效性和 ANOMIX 對不同參數的穩健性。
結論
ANOMIX 透過混合圖生成困難負樣本,並利用多層次對比學習來有效地識別圖中的異常節點。實驗結果表明,ANOMIX 在各種真實世界網路中均取得了顯著的性能提升。
Statistik
ANOMIX 在 AUC 值方面優於所有其他最先進的基線方法,最高可提高 5.49%。
ANOMIX 可以將 GCL 所需的樣本數量減少近 80%。
ANOMIX 的運行速度比現有的 GCL 方法快 1.76 倍。