Core Concepts
ネットワーク分析における重要な課題である構造的ノード類似性を捉えるための新しい役割類似性指標「ForestSim」を提案し、高速なトップk類似検索アルゴリズム「ForestSimSearch」を開発した。ForestSimは理論的に正当化でき、ForestSimSearchは前処理後にトップk検索を高速に行うことができる。
Abstract
本論文では、ネットワーク分析における重要な課題である構造的ノード類似性を捉えるための新しい役割類似性指標「ForestSim」を提案している。ForestSimは、グラフの全ての張る根付き森の中で各ノードを根とする木の平均サイズに基づいて定義される。
具体的には以下の通りである:
ForestSimは理論的に正当化でき、自己同型性の確認などの重要な性質を満たすことを示した。
ForestSimに対応するトップk類似検索アルゴリズム「ForestSimSearch」を提案した。前処理後にトップk検索をO(k)時間で行うことができる。
ForestSimの前処理計算時間とメモリ使用量を大幅に削減するため、高速近似アルゴリズムを用いて森行列の対角成分を計算する手法「ForestSim-AP」を提案した。
実験では、26の実世界ネットワークを用いて評価を行った。その結果、ForestSim-APは他の手法と同等の性能を示しつつ、大規模ネットワークでも高速に動作することが確認された。
Stats
大規模ネットワークにおいて、RoleSimとStructSimは24時間以内に計算を完了できないが、ForestSim-APは全てのネットワークで4時間以内に計算を完了できる。
ForestSim-APは、200万ノードを持つFlixsterネットワークの計算を約4時間で完了できる。