核心概念
グラフデータが現れるたびに重要になるコミュニティ検出の問題に対して、理論的に扱いやすく、異なる目標を最適化する多くの手法が提案されている。しかし、一般的で厳密な問題の説明と可能な手法は未だ明らかではない。
要約
本論文では、頂点と辺の追加に関して単調な、いわゆる関手的なクラスタリングスキームの性質を調べる。特に、解像度限界のない強い意味での関手的なスキームは、表現可能なスキームと同値であることを示す。表現可能なクラスタリングスキームは常に多項式時間で計算可能であり、疎密グラフ上では概ね二次時間で計算可能であることも示す。
さらに、階層的クラスタリングスキームの定義を拡張し、表現可能性の概念を導入する。
統計
コミュニティ検出の問題は、ネットワークデータが現れるたびに関連してくる。
多くの異なる手法やアルゴリズムが適用されているが、理論的に扱いにくく、異なる目標を最適化している。
モジュラリティの最大化は、解像度限界の問題を持つ。
モジュラリティの最大化は NP 困難である。
引用
"コミュニティ構造を推論する問題は、さまざまな形で多くの研究分野で現れる問題である。"
"しかし、コミュニティ構造の定義について普遍的な合意はない。"
"ほとんどのこれらの手法は、なぜ2つの頂点が同じパーツに属しているのかを説明する方法を与えない。"