toplogo
Giriş Yap

GSL-LPA: Fast Label Propagation Algorithm (LPA) for Community Detection with no Internally-Disconnected Communities


Temel Kavramlar
内部的に切断されたコミュニティを持たないように、高速なラベル伝播アルゴリズム(LPA)でコミュニティを検出するGSL-LPAの効果的な導入。
Özet

コミュニティ検出は、ネットワーク内の密接に接続したノードのクラスターを特定する問題です。この技術レポートでは、GSL-LPAが内部的に切断されたコミュニティを解決し、FLPA、igraph LPA、NetworKit LPAよりも55倍、10倍、300倍、および5.8倍の処理速度を達成しています。さらに、GSL-LPAはスレッド数が2倍になるごとに1.6倍のスケーリング率で動作します。これは3.8Bエッジグラフで844Mエッジ/秒の処理速度を実現しています。

edit_icon

Customize Summary

edit_icon

Rewrite with AI

edit_icon

Generate Citations

translate_icon

Translate Source

visual_icon

Generate MindMap

visit_icon

Visit Source

İstatistikler
GSL-LPAはFLPA、igraph LPA、NetworKit LPAよりもそれぞれ55倍、10倍、300倍、および5.8倍の処理速度を達成しています。 GSL-LPAは3.8Bエッジグラフで844Mエッジ/秒の処理速度を実現しています。 GSL-LPAはスレッド数が2倍になるごとに1.6倍のスケーリング率で動作します。
Alıntılar
"Community detection is the problem of identifying tightly connected clusters of nodes within a network." "LPA is well-suited for applications prioritizing high performance at the expense of slightly lower result quality." "GSL-LPA not only resolves this issue but also outperforms FLPA, igraph LPA, and NetworKit LPA by 55×, 10, 300×, and 5.8× respectively."

Önemli Bilgiler Şuradan Elde Edildi

by Subhajit Sah... : arxiv.org 03-05-2024

https://arxiv.org/pdf/2403.01261.pdf
GSL-LPA

Daha Derin Sorular

どのようにしてGSL-LAPは他のLAP実装と比較して優れていると言えるか?

GSL-LPAは、内部的に切断されたコミュニティを解決するための効果的な手法を導入しており、FLPA、igraph LPA、NetworKit LPAよりも優れたパフォーマンスを示しています。具体的には、平均でFLPAに対して55倍、igraph LPAに対して10倍、NetworKit LPAに対して300倍の速度向上が見られます。特にsk-2005グラフでは4.5秒でコミュニティを識別し、844百万エッジ/秒の処理率を達成しました。また、各実装で得られたコミュニティのモジュラリティも比較しました。平均ではGSL-LAPはFLPAより7.1%高く(特にロードネットワークやタンパク質k-merグラフ)、そしてigraph LPAより0.7%高い結果を記録しました。

どのように内部的に切断されたコミュニティが検出されているか?

内部的に切断されたコミュニティはLabel Propagation Algorithm (LPA)から生じます。この問題へのアプローチとしてSplit Last (SL)アプローチが採用されており、「最小ラベル」方式やBreadth First Search(BFS)技術などが使用されています。これらの手法は後処理段階で不連続なコミュニティを分割することで問題を解決します。

将来的な最適化方法や改善点は何か?

将来的な最適化方法や改善点として、「分割フェーズ」(Algorithm 2) の最適化が挙げられます。現在ではこのフェーズが全体ランタイム中大きな割合を占めており社会学網路データセット等でも目立っています。「分割フェーズ」と「ラベル伝播フェーズ」それぞれ個々でスケーリング性能評価も行われており、「分割フェーズ」では32スレッド時6.2×程度しか加速しない一方、「ラベル伝播フェーズ」で同数スレッド時14.5×程度加速することが確認されました。
0
star