核心概念
提出了一种新颖的Bipartite Mixed Membership Distribution-Free (BiMMDF)模型,可以对加权二分图网络中的重叠社区结构进行建模和估计。该模型不受边权重分布的限制,可以适用于各种分布。同时提出了一种有理论保证的高效算法来拟合该模型。
要約
本文提出了一种新颖的Bipartite Mixed Membership Distribution-Free (BiMMDF)模型,用于检测加权二分图网络中的重叠社区结构。
主要内容如下:
BiMMDF模型允许网络邻接矩阵的元素服从任意分布,只要其期望矩阵具有与节点隶属关系相关的块结构。这使得BiMMDF可以建模包括加权有符号网络在内的各种加权二分图网络。
提出了一种基于谱聚类的高效算法DiSP来拟合BiMMDF模型,并证明了该算法在BiMMDF模型下具有一致性估计的理论保证。
分析了不同分布下BiMMDF模型的分离条件,揭示了不同分布对分离条件的影响。
考虑了稀疏网络中存在缺失边的情况,提出了一种结合BiMMDF和二分图无权网络模型的策略来生成具有缺失边的邻接矩阵。
通过大量合成网络实验验证了理论结果,并在8个真实世界网络上展示了BiMMDF模型的有效性。
总之,BiMMDF模型为检测加权二分图网络中的重叠社区提供了一种新的有效工具,具有广泛的适用性。
統計
对于二分图网络N,其邻接矩阵A的期望矩阵Ω = ρΠrPΠ'c,其中ρ为缩放参数,Πr和Πc分别为行节点和列节点的隶属矩阵,P为一个满秩矩阵。
在BiMMDF(n, 2, Πr, Πc, αin, αout, F)模型下,当n足够大时,DiSP算法的错误率将小且接近于0,只要满足γmax(|αin|, |αout|) ≥ τ2 + o(1)且||αin| - |αout|| ≫ τ。