基于中心人物的有权图重叠社区发现方法

文档序号:8395954阅读:427来源:国知局
基于中心人物的有权图重叠社区发现方法
【技术领域】
[0001] 本发明提出基于中心人物的有权图重叠社区发现方法,属于复杂网络技术领域。
【背景技术】
[0002] 近数十年来,对于网络理论的研宄取得了一系列重大的发展,让人们对于复杂网 络的认知,从互联网、通信网和社会网络,到自然界中的食物网、生物学上的蛋白质结构网 络等,无一不提高到了一个新的水平。网络的社区结构是复杂网络最普遍和最重要的拓扑 属性之一,对理解其功能、预测其行为和演变都具有十分重要的意义。
[0003] 在大量的真实世界的复杂网络中,节点之间的连接往往与其权值密不可分,权值 是区分不同连接之间的强度、紧密度和性能的重要衡量标准。在社会网络中,微博中互相关 注的好友互发的私信数、一对同事邮件的来往数、电影明星合作共演一部电影的次数、科学 家之间论文的共著数、航空公司某两地的航班的座位数等等,在这些网络里面,都需要用到 有权网络。有权网络由于其权值具有的现实意义,使其在社区划分中更显复杂。
[0004] 在有权网络的研宄中,众多学者以最大程度达到社区内连接紧密,社区间连接稀 疏为目的,而忽略了社区的内部结构的重要性。现实中的复杂网络具有社区结构,其社区内 部结构一定具有某种意义,使社区能够更长久地维持,同时每个社区又并非"孤岛",社区之 间可以进行畅通有效地交流。

【发明内容】

[0005] 观察现实中的众多网络,可以发现它们有一个共同特征,即网络中的每一个小集 团(社区)都会有一个地位最高的个体,称之为"中心人物"。这样的复杂网络有如下特征: 第一,网络中的社区是由中心人物为中心的联系紧密的小集团;第二,中心人物决定着集团 中其他个体的地位,和中心人物联系越紧密的个体,在集团中的地位就越高。据此,本发明 提供了一种基于中心人物的有权图重叠社区发现方法,以社区内部稳固、社区间交流便捷 为目的,构造复杂网络的社区结构,适用于复杂网络中最重要的两种网络:小世界网络和无 标度网络。
[0006] 本发明的基于中心人物的有权图重叠社区发现方法,将复杂网络表示为有权无向 简单图G,G= (V,E),V为节点集合,n为节点总数,E为边集合,然后进行如下步骤:
[0007] 步骤1 :找出中心人物节点。本发明以节点在网络中的网络排名值(PageRank)作 为节点中心度的衡量标准,计算所有节点的网络排名值PageRank,并从大到小对网络排名 值排序,设Pi为第i个网络排名值,选取PageRank最大的前d个节点作为中心人物节点。
[0008] d根据经验参数02来确定,满足:3幺02;
[0009] 设置经验参数?i,使满足:
[0010] 经验参数? 2均取值在(0, 1)之间。
[0011] 步骤2 :计算两两中心人物节点之间的相似度,合并相似节点。
[0012] 设定参数当两个中心人物节点的相似度大于等于S时,将两个节点合并,并 删除其中一个节点。把被删除节点的所有边及边的权值合并到保留节点上。参数S取值 在(0, 1)之间。
[0013] 步骤3:依据每个中心人物节点构造一个社区,找出与中心人物节点之间有强连 接的节点,并加入该中心人物节点所在的社区中。
[0014] 设依据中心人物节点x构造社区c,c为社区编号;找出包含中心人物节点x的所 有三元闭包,设三元闭包中另外两个节点为A和B,节点x与节点A连边的权值为wxA,节点 x与节点B连边的权值为wxB,节点A和节点B连边的权值为Wab,若满足下面公式:
[0015]
【主权项】
I. 一种基于中心人物的有权图重叠社区发现方法,将复杂网络表示为有权无向简单图 G,G= (V,E),V为节点集合,n为节点总数,E为边集合,其特征在于,所述方法包括如下步 骤: 步骤1 :找出中心人物节点; 计算V中各个节点的网络排名值,并从大到小对网络排名值排序,设Pi为第i个网络 排名值,选取网络排名值最大的前d个节点作为中心人物节点;
经验参数0:和0 2均取值在(0, 1)之间; 步骤2 :计算两两中心人物节点之间的相似度,合并相似节点; 设定参数8,当两个中心人物节点的相似度大于等于S时,将两个节点合并,并删 除其中一个节点;把被删除节点的所有边及边的权值合并到保留节点上;参数S取值在 (0, 1)之间; 步骤3 :依据每个中心人物节点构造一个社区,找出与中心人物节点之间有强连接的 节点,并加入该中心人物节点所在的社区中; 设依据中心人物节点X构造社区c,c为社区编号;找出包含中心人物节点X的所有三 元闭包,设三元闭包中另外两个节点为A和B,节点X与节点A连边的权值为wxA,节点X与 节点B连边的权值为wxB,节点A和节点B连边的权值为wAB,若满足下面公式:
则三元闭包是强三元闭包,若不满足则三元闭包为弱三元闭包; 定义混合参数①(C)为:cKc) = a ? Ws + P ww; a、|3为两个参数,且a+ |3 = 1; W^为所有包含节点X的强三元闭包中连接边的平均权值,<则为所有包含节点x的弱三 元闭包中连接边的平均权值; 设立衡量边是否为强连接还是弱连接的标准E(C)为:E(C) = (?IAGG,wxA >cp(c)},w巧表示中心人物节点X的所有连边权值大于①(c) 的连边的平均权值; 当中心人物节点X的邻居节点i,满足wxi^:E(c)时,说明节点i与节点X之间为强连 接,把节点i加入社区c,Wxi表示节点X与节点i连边的权值; 步骤4:通过加入弱连接扩张社区,具体对于每个当前不属于任何社区的自由节点,进 行下面过程: 设自由节点为A,其对社区c的归属度R(A,c)为
其中max(wAi) ie。为节点A与社区c内节点之间连边的最大权值; 设节点A与m个社区内的节点之间存在边,SQ(A)为A对m个社区的归属度的标准差; 定义权重函数W⑷=SQ(A);设定参数Y,参数S取值在(〇, 1)之间; 若W(A) <Y,则节点A同时属于m个社区,节点A位于m个社区的重叠部分;否则,从 m个社区中去掉归属度最小的社区,然后重新计算W(A),重新判断节点A所属的社区;当节 点A的m-1个社区均被删除了,只剩余一个社区c时,根据节点A对社区c的归属度R(A,c) 来判断,若满足R(A,c) <Y,则节点A属于社区c,否则,节点A为孤立节点; 步骤5 :对于每个孤立节点,建立一个社区。
2. 根据权利要求1所述的一种基于中心人物的有权图重叠社区发现方法,其特征在 于,所述的步骤1中,网络排名值的计算公式为:
其中,^P(V)表示节点V的网络排名值,<i>p(u)表示节点U的网络排名值,U和V均为V中节点,S为缩放因子,u-V表示存在u到V的连接边,'^表示节点V第i条边的权值, EjWj表示节点V所有边的权值总和。
3. 根据权利要求1所述的一种基于中心人物的有权图重叠社区发现方法,其特征在 于,所述的步骤1中,经验参数?2优选设置为〇. 2。
4. 根据权利要求1所述的一种基于中心人物的有权图重叠社区发现方法,其特征在 于,步骤2中所述的参数S优选设置为〇. 1。
5. 根据权利要求1或4所述的一种基于中心人物的有权图重叠社区发现方法,其特征 在于,步骤2中所述计算两两中心人物节点之间的相似度,采用大度节点有利指标HPI来计 算,计算公式为:
其中,s思11壤示节点u和节点V的相似度,Ir(u)nr(V)I为节点u和节点V的共同 邻居数,ku为节点u的度,kv为节点V的度,min{}为求取最小值。
6. 根据权利要求1所述的一种基于中心人物的有权图重叠社区发现方法,其特征在 于,所述的步骤4中,参数Y优选设置为0.6。
【专利摘要】本发明提出一种基于中心人物的有权图重叠社区发现方法,属于复杂网络技术领域。本方法适用于对有权网络的重叠社区发现,包括:计算所有节点的网络排名值,并确定中心人物节点;计算两两中心人物节点之间的相似度,合并相似节点;计算每个社区的E(c)值,并根据E(c)向每个社区添加强连接的节点;通过计算自由节点的归属度,计算获得权重函数W(A),并根据W(A)向社区添加弱连接节点;对于孤立节点,分别独自成为一个社区。通过实验证明,本发明方法有着较好的社区划分性能,尤其对于混合度较低的复杂网络性能更加优异。
【IPC分类】G06F17-30
【公开号】CN104715034
【申请号】CN201510114806
【发明人】童超, 谢忠玉, 牛建伟, 莫晓赟
【申请人】北京航空航天大学
【公开日】2015年6月17日
【申请日】2015年3月16日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1