核心概念
隨著網絡規模的不斷增大,現有方法必須能夠處理大量的節點和邊,才能在實踐中具有相關性。分析子網絡已成為一種流行的方法,而不是直接處理整個(大)網絡。由於網絡固有的相互連接性,子採樣並非一項微不足道的任務。
摘要
本文提供了七種圖形子採樣算法的全面比較,將它們應用於社區結構和核心-邊緣(CP)結構的分治算法。在討論各種算法和子採樣程序後,我們導出了在不同子採樣方案下,用於CP結構的分治算法的誤分類率的理論結果。然後,我們對模擬和真實世界的數據進行了大量實驗。對於社區檢測任務,我們發現隨機均勻採樣節點的性能最佳。對於CP結構而言,沒有單一的優勝者,但是以較高的概率採樣核心節點的算法始終優於其他採樣程序,如隨機邊採樣和隨機遍歷採樣。不同任務上採樣算法的不同性能表明,為特定應用仔細選擇子採樣程序的重要性。
統計資料
隨機採樣節點可以獲得最佳的社區檢測性能。
以較高概率採樣核心節點的算法在CP結構識別任務上始終優於其他採樣程序。