核心概念
本文提出了一種名為 VD-STAR 的動態結構分群演算法,該演算法能夠有效地處理圖形更新,並支援多種相似性度量方法,同時適用於所有分群參數。
本文介紹了一種名為 VD-STAR 的動態結構分群演算法,旨在解決現有演算法在處理圖形更新和支援多種相似性度量方面的局限性。
結構分群簡介
結構分群是一種根據圖中頂點的結構相似性進行分組的方法。與其他分群方法不同,結構分群不僅可以識別頂點的分群,還可以識別頂點在分群結果中的不同角色(例如,核心、樞紐和離群值)。
現有演算法的局限性
現有的動態結構分群演算法,例如 GS*-Index、DynELM 和 BOTBIN,存在以下局限性:
GS*-Index 的更新時間複雜度較高,為 O(d^2_max · log n),其中 d_max 是最大度數。
DynELM 和 BOTBIN 雖然更新時間複雜度較低,但僅支援預先指定的參數 ε 和 µ,無法處理動態變化的參數。
BOTBIN 僅適用於 Jaccard 相似性度量,無法處理其他相似性度量方法。
VD-STAR 演算法的優勢
VD-STAR 演算法克服了上述局限性,具有以下優勢:
支援所有三種常見的相似性度量方法:Jaccard、Cosine 和 Dice。
將更新時間複雜度降低至 O(log n),優於現有演算法。
支援任意更新模式,無需像 BOTBIN 那樣假設更新是隨機的。
VD-STAR 演算法的實現
VD-STAR 演算法採用了更新承受能力的概念,並使用桶排序技術來有效地處理多個更新承受能力。此外,VD-STAR 還設計了一種演算法來追蹤每條邊的更新承受能力,該演算法易於實現且效率高。
實驗結果
實驗結果表明,VD-STAR 在更新效率、分群品質和查詢效率方面均優於現有演算法。
總結
VD-STAR 是一種高效、靈活且通用的動態結構分群演算法,為處理動態圖形數據提供了有效的解決方案。
统计
VD-STAR 的更新時間複雜度為 O(log n)。
VD-STAR 支援 Jaccard、Cosine 和 Dice 相似性度量。
實驗結果顯示,VD-STAR 的更新效率比現有演算法高出 9,315 倍。