基于分解的局部搜索多目标复杂动态网络社区划分方法

文档序号:7838849阅读:256来源:国知局
专利名称:基于分解的局部搜索多目标复杂动态网络社区划分方法
技术领域
本发明属于复杂网络领域,涉及动态网络社区划分方法,具体是一种基于分解的局部搜索多目标复杂动态网络社区划分方法,可用于检测复杂动态网络中的社区结构。
背景技术
从20世纪末开始,以internet为代表的信息技术的迅猛发展使人类社会大步迈入了网络时代。在现实世界中许多系统以网络的形式存在,从互联网世界中的万维网到交通系统中的路线网,从电子领域中的超大规模集成电路到电力系统中的大型电力网络,从生物系统中的细胞神经网络到蛋白质互相作用网络,从社会关系中的社交网络到科学家之间的合作关系网,复杂网络无处不在。在这些复杂网络中,存在着一些动态网络其网络结构随时间演化发展,例如,博客网络中,由于博友们兴趣和爱好的变化,不同博友间的互动状态随时间动态的变化;在科学家之间的合作关系中,随着科学家研究领域的改变,科学家之间的合作关系也随之发生变化;论文之间的引用关系,随着论文中提出观点在一个新的领域中使用程度发生变化,论文被引用的关系也随之发生变化。所有的这些网络都可以被看作是随时间演化的复杂动态网络。在这些动态网络中,不但包含静态复杂网络的特性,而且加入了网络结构随时间发生的动态演化特性。在复杂动态网络中,包含着一些典型的特性,小世界特性、无标度特性、社区结构特性以及动态演化特性。小世界特性是指复杂网络既拥有规则网络中的大的簇系数特性同时也拥有随机网络中的小的平均距离的特性。无标度特性是指在复杂网络中节点度服从幂率分布,也就是说,具有某个特定度的节点数目与这个特定的度之间的关系可以用一个幂函数近似地表示。由于幂函数曲线是一条下降相对缓慢的曲线,这使得度很大的节点可以在网络中存在。社区结构特性是指在复杂网络中,存在社区结构,大量实证研究表明,许多网络是异构的,一个复杂网络可以被分解为多个社区,其中社区内部节点之间存在较多的连接,而不同社区之间的节点连接则相对较少。动态演化特性是在复杂动态网络,尤其是在线网络中,一个重要的特征就是社区的时间演化特性,该特性是用于描述不同时刻网络随时间是演化发展的。目前,复杂动态网络研究已经涉及到社会学、经济学、计算机网络学,以及生物学等多个领域,典型的复杂动态网络包括互联网、万维网、社交网、社会政治和经济网、以及科研合作关系网等。关于复杂动态网络的定量和定性特征的科学理解,已引起科学界的广泛关注和研究。特别是,近几年对于不同时间段上网络社区结构的分析以及社区结构随时间的动态演化已经引起广大学者的关注,例如通过对科研合作关系网的研究,分析学术研究团队所研究课题在学科内部和交叉学科之间随时间发生的动态变化;通过对公司内部电话之间的通话网络研究,分析领导层的变化;通过对博客网络中博友间的互相访问网络的研究,分析博友兴趣爱好的变化。在现有的动态网络演化社区结构分析方法中,刚开始的研究方法主要分为两阶段进行分析,首先利用静态网络分析方法去分析各个时间段上的网络社区结构,然后引入社区演化去解释社区结构在各个时间段上随时间的变化。然而,现实世界的网络由于噪声的影响使得网络结构很模糊,在这样的一个场景下,如果不依赖已有时间段上的社区结构信息而独立获得每个时间段上的社区结构,这会导致得到的社区结构随时间显著变化,从而不能很好地反映出实际网络中社区结构的特性。近年来,学者们提出了一些利用时间平滑性框架处理动态网络中社区结构检测的方法。这些方法将社区结构提取和社区演化特性在统一框架下同步分析,具体是通过结合历史时间段上网络的社区结构这一先验知识来获得当前时间段上网络的社区结构,使得该社区结构不但能很好地反映当前时间段上网络的结构特征,同时可以结合动态网络中社区结构的时间演化特性,进而更好地符合实际网络中社区结构的特性。目前,动态网络中同步分析社区和它们之间演化特性的方法,均属于在时间平滑性框架下处理动态网络中社区结构检测问题的方法,按照所采用的基本优化策略不同,可以归纳为单目标优化处理和多目标优化处理两类。单目标优化处理,如 Lin 等在"FacetNet :A framework for analyzing communities and their evolutions in dynamic networks" (〈〈In Proceedings of International World Wide Web Conference Committee)), 2008, pages 685-694)中提出一种在动态网络中同步分析社区和它们之间演化特性的方法。这种方法将动态网络社区结构检测问题看作是一个单目标优化问题,具体是将网络中的社区质量函数和历史代价函数通过一个偏重参数合并成为一个单目标函数进行优化。该方法存在的不足是需要提前设定两目标的偏重参数和网络中社区划分模块数,这对于没有任何先验知识的实际网络来说, 是很难提前确定的,如果偏重参数和社区划分模块数提前设定不准确,将会造成网络社区误划分。多目标优化处理,如 Folino 等在 “AMulti-objective and Evolutionary Clustering Method for Dynamic Networks,,(《In Proceedings of International Conference on Advances in Social Networks Analysis and Mining》,2010, pages 256-263)提出一种利用多目标遗传算法检测动态网络中社区结构的方法,即DYN-MOGA方法。这种方法将动态网络社区结构检测问题看作是一个两目标问题,然后利用非支配多目标遗传算法同时优化这两个目标函数,该方法的优点是通过利用多目标优化方法同时优化这两个目标函数,不需要提前设定偏重参数和社区划分模块数,但是,由于遗传算法的局部搜索能力不足,使得在处理复杂度较高的动态网络时得到的社区结构不能很好地反映出动态网络中社区结构的特性。

发明内容
本发明的目的在于针对上述已有技术的不足,提出一种基于分解的局部搜索多目标复杂动态网络社区划分方法,以提高社区划分的准确性,实现对复杂动态网络的正确检测。本发明的技术方案是将动态网络社区结构检测问题看作是一个两目标问题,其中模块度函数和归一化互信息函数作为目标函数,利用基于分解的进化多目标方法同时优化这两个目标函数,并引入邻域局部搜索策略,搜索更好的网络社区结构划分,其实现步骤包括如下(1)输入目标动态网络DN= {G1; -,Gt,…GT},其中DN表示由T个时间段网络组成的一个动态网络序列,Gt表示t时间段上的网络,t e (1,…,T),T为时间段总数;(2)初始化将网络G1中社区结构检测看作是一个单目标优化问题,利用基于密母计算的网络社区结构检测方法找到初始时间段上网络的社区划分CR1 ;(3)构建归一化互信息函数匪I和模块度函数Q,作为目标函数3a)建立t时间段上网络社区划分与t-Ι时间段上网络社区划分之间的归一化互信息函数匪I

权利要求
1. 一种基于分解的局部搜索多目标复杂动态网络社区划分方法,其特征在于所述方法包括下列步骤(1)输入目标动态网络DN= {G1; -,Gt, ··、},其中DN表示由T个时间段网络组成的一个动态网络序列,Gt表示t时间段上的网络,t e (1,…,T),T为时间段总数;(2)初始化将网络G1中社区结构检测看作是一个单目标优化问题,利用基于密母计算的网络社区结构检测方法找到初始时间段上网络的社区划分CR1 ;(3)构建归一化互信息函数匪I和模块度函数Q,作为目标函数3a)建立t时间段上网络社区划分与t-Ι时间段上网络社区划分之间的归一化互信息函数匪I NMI(AB) =A=I乙尸ι ιι/ ι..〗),其中,A和B分别表示t和t-Ι两个时间段上网络的社区划分,Ca是指划分A中模块数, Cb是指划分B中模块数,Cij是指划分A中模块i与划分B中模块j共有的节点数目,C是 Cij的混合矩阵,Ci是指C中第i行的元素和,&是指C中第j列的元素和,N是网络中节点总数;3b)建立t时间段上网络社区划分的模块度函数Q β = ΣZ=I/ ( d; V--m I 2m其中,k为社区划分模块数,Ii为模块i中节点间连接边的总数,Cli为模块i中各节点度的总和,m为网络中边的总数; (4)优化目标函数4a)利用切比雪夫数学分解方法将步骤(3)中两个目标函数分别分解为N个单目标子函数;4b)构造初始解种群采用邻接点实数编码方法生成初始解种群,并在初始解种群中给每个单目标函数分配一个解个体作为它的解,设定种群进化终止代数gen ;4c)选择父代个体从解种群中选择两个父代个体,一个为第i个单目标函数对应的解个体,另一个是从解种群中随机选择一个解个体;4d)交叉变异对选择的两个父代个体进行均勻交叉操作,得到一个子个体,对子个体进行邻域变异操作,得到一个新子代;4e)更新第i个单目标子函数解个体对应的子种群根据各单目标子函数中权值参数之间欧式距离最小原则,给第i个单目标子函数解个体构造一个个体数目为M的子种群,利用新子代更新第i个子函数解个体对应的子种群;4f)重复步骤如)-步骤如),直到N个子函数都被执行完毕,得到解种群(X1,...,XJ ; 4g)局部搜索从解种群{X” . . .,中选择模块密度值最大的一个解个体,利用邻域局部搜索方法对模块密度值最大的解个体进行局部搜索操作,得到局部最优解个体,用局部最优解个体更新模块密度值最大的解个体对应的子种群,得到改进的解种群{X” ..., Xj ;4h)判断是否终止如果种群进化终止代数满足预先设定的代数gen,则执行(5),否则,重复步骤4c)_步骤4g);(5)选择最佳的社区划分从步骤4g)得到的改进解种群{X”.. . ,XJ中选择模块密度值最大的解个体作为最优解,并通过解码得到t时间段上网络社区划分CRt ;(6)如果t= T,输出网络社区划分序列ICR1, CR2, ... , C&},否则,t = t+Ι,返回步骤⑶。
2.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤(2)所述的利用基于密母计算的网络社区结构检测方法找到初始时刻网络社区划分CR1的步骤如下(2a)构造初始化种群,采用直接编码方法初始化种群中的个体,设定种群进化终止代数 gen ;(2b)选择操作(2bl)将模块度作为适应度函数;(2b2)计算当前种群中每一个个体的适应度函数值;(2b3)从当前种群中随机选择两个个体,将其中适应度函数值较大的个体加入父种群中;(2b4)重复步骤Ob3),直至得到整个父种群; (2c)交叉变异(2cl)从父种群中随机选择两个父个体;(2c2)对两个父个体进行双向传递交叉操作,得到两个临时子个体; (2c3)对两个临时子个体分别进行单点变异操作,得到两个子个体; (2c4)重复步骤Ocl)-步骤Oc3),直至得到整个子种群; (2d)局部搜索(2dl)从子种群中选择适应度函数值最大的一个个体;(2d2)利用爬山法对适应度函数值最大的个体进行局部搜索操作,得到局部最优个体;(2d3)用局部最优个体替代子种群中适应度函数值最大的个体,得到改进子种群; (2e)更新种群(2el)将改进子种群与当前种群合并,组成临时种群; (2e2)将临时种群中的个体按照适应度函数值大小由高到低排序; (2e3)截取临时种群中和当前种群规模大小相同的适应度函数值大的个体,得到下一代种群;(2f)判断是否终止如果迭代次数满足预先设定的代数gen,则执行下一步骤,否则, 重复步骤( )-步骤(2e)0
3.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤4a)所述的利用切比雪夫数学分解方法将步骤C3)中两个目标函数分别分解为N个单目标子函数,是通过如下切比雪夫数学分解公式进行minimize g{x) - max(χ) - ζ* j ,其中,χ为函数的解,fi (X)是解χ对应的函数值乂是fi (χ)的最大值,Xi是第i个目标函数对应的权值参数,i e (1,2),T为转置操作。
4.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤4b)所述的采用邻接点实数编码方法生成初始解种群,步骤如下(4bl)给每个基因位对应网络中的一个节点;(4b2)从每个基因位对应节点的邻接节点中随机选取一个节点作为该基因位的等位基因值;(4b3)由η个等位基因值组成一个解个体,作为解种群中的一个解个体,其中η为网络中节点的个数。
5.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤4d)所述的对选择的两个父代个体进行均勻交叉操作,是先随机生成一个二进制矢量,如果矢量值为1就选用第一个父代,如果矢量值为0就选用第二个父代,得到两个子代; 然后,选择单目标函数值最小的子代作为子个体。
6.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤4d)所述的对子个体进行邻域变异操作,是首先随机选择一个待变异的节点,查找该节点的所有相邻节点;然后从它的所有相邻节点中随机选择一个节点代替待变异节点。
7.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤4g)所述的从解种群{X” . . . , XJ中选择模块密度值最大的一个解个体,是通过模块密度函数H选择
8.根据权利要求1所述的基于分解的局部搜索多目标复杂动态网络社区划分方法,其中步骤4g)所述的利用邻域局部搜索方法对模块密度值最大的解个体进行局部搜索操作, 是首先查找模块密度值最大的解个体中待局部搜索节点的所有相邻节点,找出所有相邻节点中大多数节点所在的社区;然后从这个社区所包含的邻域节点中,随机选择一个节点代替待局部搜索节点。
全文摘要
本发明公开了一种基于分解的局部搜索多目标动态网络社区划分方法,主要解决现有技术在处理复杂动态网络时得到社区划分准确性不高的问题。其实现步骤为(1)确定目标函数;(2)构造初始解种群,采用邻域实数编码方法对解种群中的个体进行初始化;(3)依次对解种群中个体进行选择、交叉变异操作得到子代个体;(4)利用子代个体更新解种群;(5)局部搜索更新解种群;(6)判断是否终止如果迭代次数满足预先设定次数,则执行(7),否则转步骤(3);(7)根据模块密度最大原则,选出最佳社区划分解。本发明能同时优化两个目标函数,实现了社区划分与社区演化的同步分析,提高了社区划分的准确性,可用于解决复杂动态网络中社区结构检测问题。
文档编号H04L12/26GK102413029SQ201210001410
公开日2012年4月11日 申请日期2012年1月5日 优先权日2012年1月5日
发明者付宝, 侯田, 公茂果, 焦李成, 王爽, 王艳辉, 马文萍, 马晶晶, 马里佳 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1