基于节点隶属度的标签传播社团结构挖掘方法

文档序号:6623177阅读:1267来源:国知局
基于节点隶属度的标签传播社团结构挖掘方法
【专利摘要】一种基于节点隶属度的标签传播社团结构挖掘方法,包括以下步骤:为网络中的各个节点赋予一个唯一的标签,并用标签表示节点所属的社团;将复杂网络邻接矩阵中的行向量看作是各节点的采样样本,计算两节点之间的权值系数作为边的权值;利用各节点连边权值系数的方差作为该节点的隶属度;在每次标签更新迭代中只更新隶属度大于标签更新阀值的节点标签,将隶属度小于标签更新阀值的节点作为重叠节点;如果标签改变或标签传播次数小于标签迭代阈值,则重复上述迭代过程,否则停止更新。本发明在时间复杂度提升不大的情况下能够很好地检测出复杂网络的重叠社团结构,具有良好的鲁棒性和准确性。
【专利说明】基于节点隶属度的标签传播社团结构挖掘方法

【技术领域】
[0001]本发明涉及的是一种复杂网络领域的方法,具体是一种基于节点隶属度的标签传播社团结构挖掘方法。

【背景技术】
[0002]现实社会中越来越多的复杂系统都可以用复杂网络模型来描述,如Internet网络中网页可以看作复杂网络中的节点,而网页之间的超链接则表示为网络的连边;社会网络可以将不同个体看作是节点,而节点之间的连边则表示个体之间的关系;生物蛋白质网络将不同生物蛋白作为网络节点并用连边揭示不同蛋白之间的相互影响。因此,作为研究复杂系统的有效工具,复杂网络的各种性质已经引起了各界学者的广泛关注。
[0003]社团结构是复杂网络的一个重要的拓扑特性。社团结构将复杂网络中的节点分为若干个社团聚类,社团内部的节点之间连边较为紧密而社团之间的连边较为稀疏。这种高内聚的网络结构可以很好地揭示复杂系统的结构特点、功能特性以及组织特征。例如,互联网的社团结构反映了讨论共同话题的网站,而社交网络的社团结构则表示了拥有共同兴趣爱好的人组成的团体。因此,复杂网络中社团结构的挖掘对于分析网络的特性和功能具有十分重要的现实意义。
[0004]近些年,复杂网络的社团结构挖掘越来越关注两方面的性能:第一,较低的时间复杂度。大部分复杂系统抽象出的复杂网络节点数目十分庞大,时间复杂度是社团结构挖掘方法优劣的重要指标之一;第二,复杂网络中重叠社团结构的检测。在现实的复杂网络中,社团结构经常存在重叠现象,即复杂网络中的一些节点同时属于多个社团结构,这些节点作为社团之间的桥节点连接着多个社团。这就要求社团结构挖掘方法能够检测出复杂网络中社区结构的重叠部分。
[0005]经文献检索发现,U.N.Raghavan 和 R.Albert 等人在文章 “Near linear timealgorithm to detect community structures in large-scale networks[J],,(应用于大规模网络中社区结构挖掘的一种接近线性时间复杂度的方法)(Phy s.Re V.E76,036106(2007))(物理综述E)中提出了一种应用于社团结构挖掘的标签传播方法。该方法首先为复杂网络中的每一个节点初始化一个互不相同的标签,并用标签表示社团,不同的标签代表不同的社团结构。之后,对网络中的所有节点分别进行标签传播迭代操作,将每个节点的标签更新为其邻居节点中占有比例最大的标签,直到整个网络中各节点的标签值都不再改变时结束迭代。此时,拥有相同标签的节点属于同一个社团结构。该方法时间复杂度低,但由于引入了随机性导致检测结果不统一,精度不高,并且无法挖掘重叠社团结构。
[0006]再经检索发现,魏芳在专利“一种基于全局划分和局部扩展的网络重叠社团检测方法”(200810041958.X)中提出了一种基于全局划分和局部扩展的重叠社团结构检测方法。该方法利用网络全局拓扑结构信息获取种子节点,采用随机游走的方式扩展局部社团,并通过定义局部社团的优化函数来评判局部社团结构的优劣。该方法可以划分重叠的网络社团结构,但是由于每个种子节点都需要扩展局部网络结构,因此时间复杂度较高。
[0007]再经检索发现,于秦、赵一甲和罗俊海等人在专利“基于标签交互的分布式社团发现方法”(201310200466.1)中提出了一个基于标签交互的分布式社团发现方法。该方法根据各个节点的本地唯一信息初始化自身标签号、传播因子和本地迭代次数等信息。在每次标签迭代过程中,各节点接收来自其邻居的标签号广播,通过对比该邻居节点广播的迭代次数和本地存储的迭代次数的大小,选择接收还是放弃该节点的标签号。对于可以接收的标签号,在更新标签号的同时,通过预先设定的门限值更新该邻居节点的传播因子和本地迭代次数等信息。当网络中各节点的标签不再变动时,表明网络社团结构已经划分完毕。该方法改进了传统的标签传播方法,从而可以更精确地查找网络社团结构,但是无法检测具有重叠结构的网络社团。
[0008]最后经检索发现,刘均、徐海鹏和董博等人在专利“基于重叠点识别的网络重叠社团检测方法”(201310272890.7)中提出了一种可以识别重叠社团结构的检测方法。该方法先通过由Girvan and Newman提出的GN(Girvan and Newman)社团分裂算法获取非重叠结构的社团划分结构,在此基础上,计算各社团边界点与相邻各社团的关联概率并选取关联概率大于给定阀值的节点作为社团边界的候选重叠节点。对于所有候选重叠节点,使用基于节点质量函数的重叠点判定规则识别重叠点;对于重叠节点数目大于给定阀值的多个社团则合并为一个大社团结构。该方法通过重叠节点关联概率的定义实现了对重叠社团结构的挖掘,但由于该方法先借助了 GN社团分裂算法,之后又进行了重叠节点的判定和重叠社团的合并,因此时间复杂度较高。同时,该方法中需要预先给定阀值参数,对于该方法的普适性有一定的影响。


【发明内容】

[0009]本发明的目的在于针对上述现有技术的不足,提出一个基于节点隶属度的标签传播社团结构挖掘方法。其主要思想是,首先,计算网络中相连节点之间的权值系数,并作为节点连边的权值;然后计算各节点连边权值系数的方差作为该节点的隶属度;在每次标签迭代中只迭代隶属度大于给定阀值的节点,将隶属度小于阀值的节点作为重叠节点,从而挖掘复杂网络中的重叠社团结构。
[0010]本发明是通过如下技术方案实现的:
[0011]一种基于节点隶属度的标签传播社团结构挖掘方法,其特点在于:该方法包括以下步骤:
[0012]1、为网络中的所有节点分别赋予一个唯一的标签,该标签表示节点所属的社团,初始状态下,每个节点分属不同的社团;预设标签更新阀值λ和标签迭代阈值T ;设标签传播次数t = O ;
[0013]2、计算网络中直接相连的所有节点对间的权值系数,并将这些权值系数作为各连边的权值;更新标签传播次数t = t+1 ;
[0014]3、利用节点标签及连边权值计算网络中各节点的隶属度;
[0015]4、对于隶属度大于给定阀值λ的节点进行标签传播更新;
[0016]5、如果在步骤4标签更新过程中存在标签改变的节点或者标签传播次数t小于预设的标签迭代阈值T,则重复步骤2至步骤4的迭代过程;否则停止标签更新。迭代结束后,网络中具有相同标签的节点属于同一个社团,而属于重叠区域的节点的标签则与周围社团的节点标签各不相同。
[0017]所述步骤I,具体如下:
[0018]1.1在一个具有N个节点Vi (i = 1,2,...,N)的复杂网络图G中,按照递增顺序为网络中的N个节点编号。一般的,第i个节点α = 1,2,...,Ν)的编号为i。
[0019]所述的复杂网络图G = (V, E)为具有N个节点Vi(i = 1,2,...,N),M条连边ek(k = 1,2,...,Μ)的网络拓扑图,其中,V = (V1, v2)...vN)表示网络节点的集合,E =(e1; e2,...eM)表示网络连边的集合。边ek(k = I, 2,..., Μ)按照其所连接的两个节点Vi'V」,也可表示为 eij0
[0020]1.2为每一个节点构造三元组{节点编号,节点标签,节点隶属度}。其中,节点标签的初始值等于该节点的编号,表示初始状态下每个节点分属不同的社团;节点隶属度的初始值为O。
[0021]网络中节点标签的集合可以表示为L = (I1, I2,…,IJ (S≤N),集合L的元素Ii (i=I, 2,..., S)是一个标签。
[0022]1.3预设标签更新阀值λ和标签迭代阈值T ;设标签传播次数t = O。
[0023]所述标签更新阀值λ为一个正实数,用来调整不同社团之间的重叠范围。
[0024]所述标签迭代阈值T为一个正整数,规定了标签传播计算的总次数。
[0025]所述步骤2,具体如下:
[0026]2.1利用网络图G的邻接矩阵Α,按公式⑴计算每条边eij的权值系数ru:

【权利要求】
1.一种基于节点隶属度的标签传播社团结构挖掘方法,其特征在于:该方法包括以下步骤: 51、在一个具有N个节点Vi(i = 1,2,…,N)的复杂网络图G中,按照由I至N的递增顺序为网络中的N个节点编号; 为每一个节点构造三元组{节点编号,节点标签,节点隶属度},其中,节点标签的初始值等于该节点的编号,节点隶属度的初始值为O ; 网络中节点标签的集合表示为L = (I1, I2,…,ls} (S≤N),集合L的元素IiQ =1,2,...,S)是一个节点标签; 预设标签更新阀值λ、标签迭代阈值T和令标签传播次数t = O ; 52、计算网络中直接相连的所有节点对之间的权值系数,并将这些权值系数作为各连边权值,并更新标签迭代次数t = t+1 ; 所述的计算网络中直接相连的所有节点对间的权值系数,是指利用网络图G的邻接矩阵A,按公式⑴计算每条边的权值系数ru:
其中,Bij 为网络邻接矩阵 A 中的元素,1 = 1,2,...,N, j = I, 2,...,Noai= ^Σ--=ι aiu。 53、利用节点标签及连边权值计算网络中各节点的隶属度,具体如下: 对网络中的所有节点Vi (i = 1,2,...,N),设集合G = (IiljIi2, -1」是节点Vi的直接邻居节点所具有的互异标签的集合,其中Q是互异标签的数目;用%(\)表示节点'的直接邻居节点中标签值为1iP的节点的集合,计算节点Vi与其直接邻居节点集合中,标签为1的节点连边的权值总和,公式如下
计算节点Vi所在的所有连边的权值的方差,并将该方差值作为节点Vi的隶属度D (i),公式如下:
54、对于网络中任意节点Vi(i = 1,2,...,N),若其隶属度D (i)大于标签更新阀值入,则更新将该节点标签; 55、判断是否有节点标签发生了改变或者标签迭代次数t小于预设的标签迭代阈值T,如有则返回步骤2 ;否则,输出网络G的具有重叠的社区结构。
2.根据权利要求1所述的基于节点隶属度的标签传播社团结构挖掘方法,其特征是,所述的步骤S4中节点标签的更新,具体是根据下式更新节点标签:
其中,= {iu,Ii2(iiQ}是节点Vi的直接邻居节点所具有的互异标签的集合,|κ|表示网络中标签为K的节点的个数。
【文档编号】G06F17/30GK104199852SQ201410393445
【公开日】2014年12月10日 申请日期:2014年8月12日 优先权日:2014年8月12日
【发明者】李生红, 张爱新, 李建华, 李琳 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1