一种时变网络中时效稳定社团的检测方法和装置与流程

文档序号:17984798发布日期:2019-06-22 00:20阅读:121来源:国知局
一种时变网络中时效稳定社团的检测方法和装置与流程

本发明属于复杂网络分析技术领域,具体涉及一种时变网络中的时效稳定社团检测方法和装置。



背景技术:

网络是刻画复杂系统中海量元素之间复杂关系的有效工具,实际生活中的很多系统都可以使用网络建模分析,如社交网络,蛋白质相互作用网络,交通网络等。

基于网络科学的研究已经发现了实际系统许多重要的性质,包括小世界属性,富人俱乐部以及社团结构等。网络中的社团是指节点的聚类,相同社团的节点连接紧密,不同社团的节点连接稀疏。基于网络结构将节点划分为社团的过程被称为社团检测。社团结构广泛地存在于实际系统当中,如社会学、生物学、计算机科学、经济学、交通系统和电力系统等。网络的拓扑结构与节点属性、网络功能的联系通过社团得以体现,社团结构对网络中的传播过程产生影响。检测和研究社团结构有助于我们理解网络的结构特征和行为变化。同时,社团检测在实际生活中有丰富的应用场景,如线上购物网站中的商品推荐,社交软件中的广告投放,生物学研究中蛋白质和基因功能的预测等。

由于社团结构的普遍存在和重要意义,近年来社团检测算法已成为网络科学的重要研究问题之一。图割和聚类等传统算法可以直接用于网络的社团检测,如层次聚类和谱聚类,其中层次聚类算法中最为著名的是newman和girvan提出的基于连边介数中心性的分裂算法。newman和girvan提出模块度(modularity)来衡量社团划分的质量,模块度值越大表明社团结构越明显。给定网络结构,最大化模块度是检测网络中社团结构的有效手段。由于这是一个np难问题,一系列启发式算法被提出寻找近似解,如blondel等人提出的louvain算法适用于加权网络。基于模块度最优化的方法是应用最广泛的社团检测算法,但是该方法存在精度限制,无法找到相对网络而言尺寸较小的社团。除了直接分析网络的拓扑结构,还可以基于网络中的动态过程检测社团,包括自旋模型,随机游走和同步。

已有的社团检测算法被广泛地应用到静态网络中,但是多数实际系统是随时间不断变化的。例如,当大脑受到外界信号的刺激时,脑区的活跃程度和不同脑区之间的联系会相应地改变;节假日期间,城市之间的交通流量会与平日不同。从网络拓扑的角度而言,系统的动态变化体现在节点的增加和减少,连边的出现和消失,以及连边权重的变化三个方面。为了保留网络结构在时间维度上的信息且模型的复杂度又不至于过高,多种关于时变网络的建模方式被提出。

结构的动态变化和建模方式复杂度的增加为时变网络中的社团检测带来一系列挑战。关于时变网络中社团结构的研究能够为我们理解、控制和预测网络结构的演化、网络结构特征的出现和形成,网络中的传播过程提供更加深入和全面的视角。近年来,时变网络中的社团检测引起了学者的广泛关注。使用网络序列表示结构随时间的变化,并用静态网络的方法检测序列中每个网络的社团是一个简单直观的思路,这类方法被称为序列检测,根据是否考虑社团结构变化的平滑性可以分为独立检测和演化聚类两类方法。这类方法的关键问题在于排除噪声等因素对社团结构变化的干扰,以及确定相邻时间社团的对应关系。而基于多层网络的检测算法被称为整体检测方法,但目前层间连边局限在相邻网络的同一节点之间,非相邻网络不同节点之间的联系还有待研究。无论跟踪社团结构的变化还是寻找时变网络中不变的社团,对网络结构时效变化的研究还不够充分,已有的研究多数局限在对网络整体结构在短时间内连续变化这一特点的考虑,缺乏对网络在更长时间范围内的时效变化特征,网络中连边的时效变化,以及网络结构非连续变化的讨论。



技术实现要素:

本发明目的在于提供一种时变网络中时效稳定社团的检测方法和装置,以解决现有社团检测方法局限于静态网络,忽视了实际系统动态变化特点的问题,从而提高社团检测的准确性,深化对实际系统时效变化的理解。

本发明提供的时变网络中时效稳定社团的检测方法,具体步骤为:

(1)获取一段时间内节点之间的连接随时间变化的情况,构建时变网络,使用邻接矩阵的集合表示各个时刻的网络结构;

(2)基于步骤(1)得到的时变网络计算连边的波动率矩阵,定量刻画连边的动态变化程度;

(3)初始化社团结构,结合波动率计算时变网络的动态模块度,用于定量刻画时变网络中的时效稳定社团;

(4)优化所述步骤(3)的动态模块度;动态模块度最大值对应的社团划分即为时变网络中的时效稳定社团。

本发明步骤(1)中,所述时变网络gd表示n个节点之间的连边随时间变化的情况,具体地,gd=(g(t),t=1…t),其中g(t)=(v,e(t))表示时刻t对应的网络结构,共t个时间点,v是n个节点构成的集合,各个时刻均相同,e(t)是t时刻连边构成的集合,随时间发生变化;将每个时刻的网络结构用邻接矩阵表示,即a(t)=[aij(t)]n×n,如果在时刻t节点i和节点j之间不存在连边,则aij(t)=0,否则aij(t)等于连边的权重,网络g(t)为无权无向网络,所以a(t)为对称矩阵。

本发明步骤(2)中,所述定量刻画连边的动态变化程度,是使用波动率表示在一段时间内连边权重的波动程度,用于定量刻画网络的动态变化;节点i和j之间连边eij的波动率vij按照如下方法计算:

其中,std(·)表示标准差运算符,δij(t)表示连边eij权重在时刻t的增长率;时变网络gd中所有连边的波动率组成波动率矩阵v=[vij]n×n。

本发明步骤(3)中,所述结合波动率计算时变网络的动态模块度,将通过动态模块度定量刻画时变网络中的时效稳定社团;时效稳定社团具体表现为:节点关于社团的隶属关系不随时间改变,所以不同时刻网络中对应的时效稳定社团结构是相同的,用向量c=[c1,c2,…,cn]表示各个节点所属的社团;在不同时刻,同一个社团内节点之间的连接比不同社团节点之间的连接密切;不同社团之间连边的动态变化程度比同一社团内连边的变化更剧烈;

动态模块度的计算方法如下:

其中,si(t)是在时刻t网络中与节点i相连的连边权重之和,ω(t)为所有连边的权重之和,ci表示节点i所属的社团,如果节点i和j属于同一个社团,则δ(ci,cj)=1,否则为0,mt为t时刻网络中的连边数目;动态模块度是结合波动率,将girvan-newman模块度从静态网络向时变网络的拓展,用社团内连边的平均权重表示连接的密切程度,用连边的平均波动率表示连边的动态变化程度。

本发明步骤(4)中,使用优化动态模块度的方法寻找时效稳定社团;当改变网络中的社团划分结构时,动态模块度发生变化;最大动态模块度对应的社团结构就是时变网络的时效稳定社团。

本发明提供的时变网络中时效稳定社团的检测装置包括:时变网络构建模块、波动率计算模块、动态模块度优化模块、时效稳定社团输出模块,其中:

所述时变网络构建模块,用于获取不同时刻节点之间的连接情况,构建包含n个节点,t个时间点的时变网络,并以邻接矩阵集合的形式表示网络在各个时刻拓扑结构;

所述波动率计算模块,用于计算连边权重在一段时间内的波动率,并用波动率矩阵存储所有节点对之间连边的波动率;

所述动态模块度优化模块,用于优化网络的动态模块度,寻找动态模块度的最大值;

所述时效稳定社团输出模块,用于给出最大动态模块度对应的社团划分,即时变网络的时效稳定社团结构。

本发明提供的技术方案具有如下优点:

本发明首次将社团的时效特征直接引入社团检测的过程中,通过定义连边波动率给出定量刻画网络连接随时间变化的途径,并基于波动率定义动态模块度,给出了发现时效稳定社团和定量衡量时效稳定社团质量的方法和装置。与以往局限于静态网络的社团检测技术相比,本发明给出了在时变网络中的社团检测方法,考虑了实际系统随时间变化的重要特性,提高了社团检测的准确性和可靠性,为理解网络的时变特性提供了新的视角。本发明提出的时效稳定社团检测方法和装置在生活中有广泛的应用场景和重要的使用价值,如发现社交网络中稳定的交互关系,给出交通网络中的关键枢纽,分析生物网络中的功能划分,挖掘推荐系统中的用户兴趣等。

附图说明

图1为本发明实施例提供的一种时变网络中时效稳定社团检测方法的流程方框示意图。

图2为本发明实施例提供的投票网络中时效稳定社团划分结果示意图。

图3为本发明实施例提供的投票网络中时效稳定社团在多个时刻的邻接矩阵图。

图4为本发明实施例提供的一种时变网络中时效稳定社团检测装置的组成结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图,以美国114届国会的投票记录数据为例,对本申请的发明实施例进行详细说明。

图1为本发明在时变网络中时效稳定社团检测方法的流程方框示意图,包括:

步骤100、获取一段时间内节点之间的连接随时间变化的情况,构建时变网络,使用邻接矩阵的集合表示各个时刻的网络结构。

以美国114届国会在2015~2016年期间的投票记录数据为例,构建议员投票时变网络。美国第114届国会由100名议员组成,对于每个法案议员可以投赞成票,反对票或者弃权。从网站https://www.senate.gov/legislative/lis/roll_call_lists/vote_menu_114_2.htm中可以获得每次投票中议员的投票情况。

以议员为节点,议员之间的投票相似性为连边,月份为时间单位构建投票时变网络。使用一个月内两位议员态度相同的投票数目与该月投票总数的比例衡量投票相似性,该比值作为对应节点之间连边的权重,如果一个月内两个议员的投票结果始终不同,则对应节点之间不存在连边。当一个月内投票次数过少时,分析结果不具有代表性,而且对应的网络较稀疏,于是将投票总数少于5次的月份去除,最终得到一个100个节点在20个时间点连接情况的投票时变网络。

本实施例中,步骤100获取一段时间内节点之间的连接随时间变化的情况,构建时变网络,使用邻接矩阵的集合表示各个时刻的网络结构,投票时变网络的邻接矩阵为20个100×100对称矩阵按时间顺序排列的矩阵序列a=(a(t),t=1,2,…20),其中a(t)=[aij(t)]100×100,且0≤aij≤1。

步骤101、使用波动率定量刻画网络中连边的动态变化程度。

首先,对于网络中的每条连边eij,从t=2开始计算连边权重的增长率δij,计算方法如下:

连边eij的波动率按照如下方法计算:

投票网络中所有连边的波动率可以构成波动率矩阵v=[vij]100×100。

步骤102、初始化社团结构,结合波动率计算时变网络的动态模块度;

实际生活中随着时间的变化,网络的拓扑结构处于不断改变的状态,但在这样的变化过程中,与节点属性、网络功能和动态过程相关的社团结构可能保持不变,例如静息态脑网络中的社团等,这种社团结构被称为时效稳定社团,具有以下特征:节点关于社团的隶属关系不随时间改变,所以不同时刻网络中对应的时效稳定社团结构是相同的,这里使用向量c=

[c1,c2,…,c100]表示各个节点所属的社团;在不同时刻,同一个社团内节点之间的连接比不同社团节点之间的连接密切;不同社团之间连边的动态变化程度比同一社团内连边的变化更剧烈。

使用动态模块度定量刻画上述时效稳定社团的特点,其计算方法如下:

其中,vij是波动率矩阵v中的元素,si(t)是在时刻t网络中与节点i相连的连边权重之和,ω(t)为所有连边的权重之和,ci表示节点i所属的社团,如果节点i和j属于同一个社团,则δ(ci,cj)=1,否则为0,mt为t时刻网络中的连边数目。动态模块度是结合波动率,将girvan-newman波动率从静态网络向时变网络的拓展,用社团内连边的平均权重表示连接的密切程度,用连边的平均波动率代表连边的动态变化程度。

步骤103、优化网络的动态模块度

网络中的时效稳定社团可以通过最大化动态模块度的方法获得。louvain算法是静态网络中经典的模块度优化算法,其基本思想是将社团看作节点,以模块度增量最大为准则将节点调整至邻居节点所在的社团,逐层优化直至网络的模块度不再增加。这里将louvain算法拓展到时变网络中优化动态模块度,与静态网络不同之处在于,改变节点所属社团时会影响所有时间点对应的网络,整个时变网络动态模块度的增量等于各层网络的增量之和,计算方法为:

步骤104、动态模块度最大值对应的社团划分即为时变网络中的时效稳定社团。

在本实施例中,投票网络的社团划分结果如图2所示,节点大小表示社团中节点的数目,连边粗细代表社团内和社团间连边的平均权重。投票网络的最大动态模块度为0.1415,对应的时效稳定社团为4个社团,社团大小分别为51个节点,45个节点,3个节点和1个节点。投票网络在多个时刻的邻接矩阵如图3所示,得到的社团在这段时间内稳定存在。

为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。

请参阅图4所示,本发明实施例提供的一种时变网络中时效稳定社团的检测装置400,可以包括:时变网络构建模块401、波动率矩阵计算模块402、动态模块度最大化模块403、时效稳定社团输出模块404。

时变网络构建模块401,用于获取不同时刻节点之间的连接情况,构建包含n个节点,t个时间点的时变网络,并以邻接矩阵集合的形式表示网络在各个时刻拓扑结构。

波动率矩阵计算模块402,用于计算连边权重在一段时间内的波动率,并用波动率矩阵存储所有节点对之间连边的波动率。

动态模块度最大化模块403,用于优化网络的动态模块度,寻找动态模块度的最大值。

时效稳定社团输出模块404,用于给出最大动态模块度对应的社团划分,即时变网络的时效稳定社团结构。

通过前述实施例对本发明的描述可知,首先获取一段时间内节点之间的连接随时间变化的情况,构建时变网络,使用邻接矩阵的集合表示各个时刻的网络结构;计算时变网络的波动率矩阵;将网络中的节点看作一个社团,对于每一个节点,计算将该节点从当前社团移动到邻居节点所在社团带来的网络动态模块度增量;如果最大的模块度增量为正,则将节点移动到对应邻居节点所在的社团,否则不改变,遍历所有节点直至调整节点所属社团无法使动态模块度继续增加;基于新的社团结构计算动态模块度;将新的社团看作节点,重复上述调整节点所属社团的步骤,直至动态模块度不再增加,此时可获得时变网络的时效稳定社团。本发明所提供的时变网络中时效稳定社团的检测方法和装置,与以往局限于静态网络的社团检测方法相比,给出了在时变网络中的社团检测方法,考虑了实际系统随时间变化的重要特性,提高了社团检测的准确性和可靠性,为理解网络的时变特性提供了新的视角。本发明首次将社团的时效特征直接引入社团检测的过程中,通过定义连边波动率给出定量刻画网络连接随时间变化的途径,并基于波动率定义动态模块度,给出了发现时效稳定社团和定量衡量时效稳定社团质量的方法。本发明提出的时效稳定社团检测方法和装置在生活中有广泛的应用场景和重要的使用价值,如通过对比病患和健康个体脑网络中时效稳定社团的差异实现对精神障碍类疾病客观准确的诊断等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行本发明各个实施例所述的方法。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1