一种网络异质多维标度方法

文档序号:6373581阅读:198来源:国知局
专利名称:一种网络异质多维标度方法
技术领域
本发明涉及数据挖掘和复杂网络分析领域,特别是针对网络的多维标度方法。
背景技术
由于网络(或图)能够方便地描述不同个体之间的相互作用关系,近十年来它被越来越多地运用到系统科学中用于描述不同领域的复杂系统,例如生命科学中的蛋白质网络(参照文献[I] M. Vidal, Μ. E. Cusickj and A. -L. Barabasij InteractomeNetworks and Human Disease, Cell 144,986 (2011),即 M. Vidal,Μ. E. Cusick,and A.-LBarabasi,相互作用网络与人类疾病,《细胞》,144,986 (2011)),脑纤维网络(参照文献[2] P. E. Vertesj A. F. Alexander-Blochj N. Gogtay, J. N. Gieddj J. L. Rapoportj andE. T.Bullmorej Simple Models of Human Brain Functional Networks, Proc. Natl.Acad. Sci. USA 109,5868 (2012),即 P. E. Vertesj A. F. Alexander-Blochj N. Gogtay·,J. N. Gieddj J. L. Rapoportj and E. T. Bullmore,一种人类大脑功能网络的简单模型,《美国科学院院刊》,109,5868(2012))和生态网络(参照文献[3] J. Bascompte, Structureand Dynamics of Ecological Networks, Science 329,765(2010),艮P J. Bascompte,生态网络的结构及其动力学,《科学》,329,765(2010)),地理科学中的公路网络(参照文献[4] S. Lammer5 B. Gehlsenj andD. Helbingj Scaling Laws in the Spatial Structureof Urban Road Networks, Physica A363,89 (2006),即 S. Lammer5 B. Gehlsenj andD.Helbing,城市道路网络的空间结构的标准律,《物理一》363,89 (2006))和空间邻接网络(参照文献[5] [5]Q. Xuan and Τ· -J. Wuj Country Neighborhood Network onTerritory and its Geometrical Model, Phys. Rev. E 79,046106 (2009),即宣琉,吴铁军,国家领土邻国网络及其几何模型,Phys.Rev.E 79,046106 (2009)),化学中的反应扩散网络(参照文献[6] Q. Xuanj F. Duj H. Dong, L. Yuj and G. Chen, Structural Control ofReaction-DiffusionNetworkj Phys. Rev. E 84,036101 (2011),即宣琉,杜方,董辉,俞立,陈关荣,反应扩散网络的结构控制,Phys. Rev. E 84,036101 (2011)),电脑科学中的因特网和万维网(参照文献[7] [7]D. Lusseauj The Emergent Properties of a DolphinSocial Network, Proc. R. Soc. Lond. B 270,S186 (2003),即 D. Lusseauj 一种关于海豚社会网络的新特性,Proc.R. Soc.Lond.B 270,S186 (2003)),以及社会科学中的各种社会网络(参照文献[8] R. Pastor-Satorrasj A. Vazquez, and A. Vespignanij Dynamicaland Correlation properties of the Internet,Phys. Rev. Lett. 87, 258701 (2001),即 R. Pastor-Satorrasj A. Vazquez, and A. Vespignanij 互联网的动态相关性质,Phys.Rev. Lett. 87,258701 (2001))等等。此外,网络作为一种离散空间,对于研究物质与信息流(参照文献[9] P. S. Dodds, Optimal Form of Branching Supply and CollectionNetworks, Phys. Rev. Lett. 104,048702 (2010),即 P. S. Dodds, 一种分支供应与收集网络的最佳形式,Phys. Rev. Lett. 104,048702(2010)),反应扩散,同步一致性(参照文献[10] W. YujG. Chen, and J. Lu,On Pinning Synchronization of Complex DynamicalNetworks, Automatica 45,429 (2009),即 W. Yu, G. Chen, and J. Li!,复杂动态网络的同步一致性,Automatica 45,429 (2009))等各个方面的动力学特性,均是良好的载体。另一方面,虽然通常认为于19世纪提出的舍去平行公设的非欧几何更适合用来建立现代物理理论如相对论(参照文献[11] J. Gray, Ideas of Space:Euclidean, Non-EucIidean, and Relativistic, 2nd ed. (Clarendon Press, 1989),即 J. Gray,《思想空间欧氏几何,非欧几何与相对论》,第二版.(Clarendon出版社,1989)),但不可否认,迄今为止,许多科学的基础仍然是欧氏几何n维欧氏空间Rn中的每个点由一个η维实数向量唯一确定,而任意两点之间的关系通常由它们之间的欧氏距离来表示。事实上,更广义而言,离散的网络空间和连续的欧氏空间只是对距离有着不同定义的度量空间(参照文献[12] V. Bryant, etric Spaces:Iterationand Application(Cambridge UniversityPress, 1985),即V. Bryant, ((etric空间:迭代与应用》,(剑桥大学出版社,1985)),比如,网络空间中两个节点之间的网络距离通常定义为它们之间任意路径的最小连接数(参照文
献[13] Q. Xuan, Y. Li, and T. -J. ffu, A Local-World Network Model Based on Inter-NodeCorrelation Degree, Physica A 378,561 (2007),即 Q. Xuan, Y. Li, and T. -J. ffu, 一种基于节点间关联度的局部世界网络模型,《物理一》378,561 (2007)),而欧氏空间中两点之间的欧氏距离则通常定义为连接它们的线段长度,这些距离通常需要满足一定的限制,比如众所周知的三角不等式限制等,才能称之为度量空间。由于这些度量空间在不同情况下各有其独特的优势,因此在两者之间建立联系具有重要的科学意义。目前有若干种方法可将欧氏空间中的一组点构造成一个网络。最简单的方法就是将欧氏空间中的点视为网络的节点,并且连接一对节点当且仅当它们之间的欧氏距离小于预定的阈值(参照文献[14] C. Herrmann, M. BartheIemy, and P. Provero, ConnectivityDistribution of Spatial Networks, Phys. Rev. E 68, 026128 (2003),即 C. Herrmann, M.Barthe I emy, and P. Provero,空间网络的连接分布,Phys. Rev. E 68, 026128 (2003))。有时,为了允许极少数长距离连接的存在,可以将以上这种确定性方法随机化,即连接一对节点的概率与它们之间的欧氏距离成反比(参照文献[15] R. Xulvi-Brunet andI. M. Sokolov, Evolving Networks with Disadvantaged Long-Range Connections, Phys.Rev. E 66,026118(2002),即 R. Xulvi-Brunet and I. M. Sokolov,缺少长距离连接的网络演化,Phys. Rev. E 66, 026118 (2002) )0事实上,现实中一对节点是否连接可能不仅取决于它们的欧氏距离同时还受到其他节点属性的影响。例如,在无线传感网络中(参照文献[16] J. Yick, B. Mukherjee, and D. Ghosal, Wireless Sensor Network Survey, Comp.Net. 52,2292 (2008),即 J. Yick, B. Mukherjee, and D. Ghosal,无线传感器网络纵览,Comp.Net. 52,2292 (2008)),每个传感器有一个传感半径,只有当一个传感器处于另一个的传感半径之内时才认为它们两个是连接的;在人工阿波罗网络,当两个刚性球体表面接触时才认为它们是连接的,也就是说,两球体中心间的距离必须等于其半径之和,等等。在所有这些例子中,半径分布和适应值一定程度上决定了所形成网络的度值分布,因为,统计上而言,网络中大半径或大适应值节点将拥有更多的邻居。然而,相反的情况,即只使用网络的拓扑信息来将所有节点定位到欧氏空间中,以满足如果网络中两个节点相连接则它们之间的欧氏距离比某个阈值小,反之则比该阈值大,则通常会比较困难。最近,研究人员发明了若干方法并开发了若干计算机工具,比如Cytoscape以及G印hi,用于将网络在二维或三维欧氏空间可视化。其中一种经典的方法称为多维标度(Multidimensional scaling,MDS)(参照文献[17] T. F. Cox and M. A. A. Cox,《多维标度》,第二版.(Chapman and Hall/CRC,2001)),通常用于在信息可视化领域直观显示数据间的距离或相似度。为了使用MDS方法,首先需要给出网络中两节点间距离的定义。在大部分情况下,传统网络距离是一个可行的选择,因为该距离同时满足三角不等式和网络不等式(网络中未连接节点间的距离大于已连接节点间的距离)。利用该方法,Venna和 Kaski (参照文献[18] J. Venna and S. Kaski, Local Multidimensional Scaling, inEuropean Symposium on Articial Neural Networks(Bruges, 2006)p. 26,即 J. Venna andS. Kaski,局部多维标度,《人工神经网络欧洲研讨会刊》(布鲁日,2006)p. 26)刻画了基因交互网络,Bonabeau(参照文献[19] E. Bonabeau, Graph Multidimensional Scaling withSelf-Organizing Maps, Inf. Sci. 143, 159(2002),即 E. Bonabeau,自组织映射图的多维标度,Inf. Sci. 143,159(2002))刻画了技术实验室的工作网络等。然而,由于这些方法大都认为节点是同质的,并没有考虑网络中节点的不同地位,而现实世界中许多真实网络却拥有异质结构,因此这些方法在尝试将现实网络嵌入欧氏空间中时将会失去部分有效性。

发明内容
为了克服现有的网络多维标度方法的不考虑广义网络距离和异质网络中节点特性的差异的不足,本发明提供一种网络异质多维标度方法(HMDS),全面考虑了广义网络距离和异质网络中节点特性的差异,通过计算异质距离矩阵并结合传统多维标度方法获得节点在嵌入欧氏空间中的坐标,以此将异质网络嵌入到合适维度的欧氏空间,从而完成网络的异质多维标度。本发明的关键在于对传统网络距离定义的两步扩展其一,将传统网络距离扩展至广义网络距离;其二,结合广义网络距离和节点特性,定义异质网络距离。与此同时,将三角不等式和网络不等式约束进行适当分离,即本方法中的广义网络距离满足三角不等式,而异质网络距离则满足网络不等式,从而可以更为灵活地完成异质网络在欧氏空间中的嵌入。一种网络异质多维标度方法,包括如下步骤步骤I :将目标网络通过一个邻接矩阵来表示,利用网络节点度值给出网络节点特性向量。步骤2 :利用邻接矩阵和网络节点特性向量定义网络异质最短距离,在网络不等式约束下,结合网络异质最短距离的定义和网络节点特性向量计算节点间相似度矩阵。步骤3 :通过相似度矩阵计算异质距离矩阵,利用该异质距离矩阵和网络节点特性向量定义距离矩阵,其中的距离满足三角不等式。步骤4 :基于获得的距离矩阵,利用传统的MDS方法获得网络所有节点在某一维度欧氏空间中的坐标。步骤5 :由各节点在欧氏空间中的坐标计算节点间嵌入异质距离,获得嵌入异质距离矩阵。步骤6 :将所有节点对根据它们的嵌入异质距离进行从小到大排序,选择与原始网络相同连边数量的排序靠前的节点对,并对它们进行连接,从而构建嵌入网络,因而该嵌入网络与原始网络具有相同数量的连边,比较两个网络并计算嵌入误差。至此,本方法结束。本发明的技术构思为本发明推广了网络距离的定义,在此定义下,两节点间的网络距离可能比它们之间对应的最短路径长度小但依然满足三角不等式。在异质网络中,每个节点赋有一个权重,与此同时,上述定义的广义网络距离的概念被进一步扩展即本发明给出了一种新的节点间异质距离的定义,它既考虑了节点间的广义距离也考虑了它们的个体特性。之后,基于这些定义,我们通过分别对待三角不等式和网络不等式提出了一种异质多维标度(Heterogeneous multidimensional scaling,HMDS)方法。在人工阿波罗网络上的实验结果表明,HMDS方法比MDS方法能够以更高的精度将真实异质网络嵌入到欧氏空间中。本发明的技术效果为通过减小在将网络嵌入欧氏空间的过程中所产生的相对嵌 入误差,以减小估计维度与真实维度之间的差异,尽量逼真地在欧氏空间重现原始网络。


图1(a)为本发明的一个二维的阿波罗圆盘填充。(b)为由迭代算法建立的阿波罗网络,图1(a)为一个迭代三次的二维阿波罗圆盘填充图。(b)为由迭代算法建立的阿波罗网络,其参数设置为网络维度D=2,迭代次数T=4。图2为本发明中分别利用MDS和HMDS方法将阿波罗网络嵌入到欧氏空间时所产生的相对嵌入误差ε与嵌入欧氏空间维数r的函数关系,其中D=2,3是阿波罗网络空间维度,T=4,5,6是建立阿波罗网络的迭代次数,次数愈大,网络愈复杂,η=0.5,1为算法距离参数,(当H=I时,本发明提出的网络距离退化为网络最短路径长度,即传统的网络距离)。图3为本发明中利用HMDS方法将不同参数的阿波罗网络嵌入到欧氏空间时所产生的相对嵌入误差计算函数g(r)与嵌入欧氏空间维数的函数r的关系图,当δ=0.1时,对网络参数为D=2,3和T=5,6情况下构建的人工阿波罗网络,采用HMDS方法以及距离参数设置为Π =0.5,I时,最佳维度均为3。。图4为本发明中利用HMDS方法,阿波罗网络在三维欧氏空间中的可视化结果,当距离参数设置为Π=0. 5时,网络参数设置为D=2,T=4和D=3,T=4的人工阿波罗网络在三维欧氏空间中的可视化结果,图中节点的大小正比于它们的度值,实线表示同时存在于原始网络和嵌入网络中的连边,虚线表示存在于原始网络中但不存在嵌入网络中的连边。。
具体实施例方式下面结合附图对本发明作进一步的详细说明。参照图f图3,一种网络异质多维标度方法,包括如下步骤步骤I :将目标网络通过一个邻接矩阵来表示,利用网络节点度值给出网络节点特性向量。步骤2 :利用邻接矩阵和网络节点特性向量定义网络异质最短距离,在网络不等式约束下,结合网络异质最短距离的定义和网络节点特性向量计算节点间相似度矩阵。步骤3 :通过相似度矩阵计算异质距离矩阵,利用该异质距离矩阵和网络节点特性向量定义距离矩阵,其中的距离满足三角不等式。
步骤4 :基于获得的距离矩阵,利用传统的MDS方法获得网络所有节点在某一维度欧氏空间中的坐标。步骤5 :由各节点在欧氏空间中的坐标计算节点间嵌入异质距离,获得嵌入异质距离矩阵。步骤6 :将所有节点对根据它们的嵌入异质距离进行从小到大排序,选择与原始网络相同连边数量的排序靠前的节点对,并对它们进行连接,从而构建嵌入网络,因而该嵌入网络与原始网络具有相同数量的连边,比较两个网络并计算嵌入误差。至此,本方法结束。本发明的目的是将目标网络嵌入到恰当维度的欧氏空间中,即将网络中的节点在对应的欧氏空间中进行定位,尽可能满足连接节点间的异质距离小于未连接节点间的异质距离。
本发明选取人工阿波罗网络来对MDS和HMDS方法进行算法实施,以此检验本发明中所提方法的优越性。人工阿波罗网络具有特别丰富的属性,比如无标度性,小世界性,高聚集性等等。由于其具有几何和异质的属性,阿波罗网络非常适合用来检测所提出的HMDS方法相比于传统MDS方法的优越性。人工阿波罗网络的节点是不同大小的实心球体,如果两个球体表面相接触则认为它们相连。在二维欧氏空间中,首先是三个互相接触同等大小的圆,随后是一个较小圆填充它们之间的空隙并保持与原先三个圆的接触,再次形成三个更小的空隙之后再以相同的方式由三个更小的圆来填充,如此继续下去。这个过程可以进一步推广到更高维度上。总体而言,HMDS和MDS方法的主要区别是当它们被用来将网络嵌入欧氏空间的时候,前者认为网络中的节点不相同而后者认为网络中的节点是相同的。然而,在多数情况下,我们只已知个体间的关系,即拓扑连接,而这些个体各自不同的特性事先是未知的,因此,HMDS方法通常无法直接应用。幸运的是,可以通过拓扑性质如度值和聚类系数等来一定程度上反映个体的特性。因此,为简便起见,本发明设定节点Vi的内在属性Qi=Ici,其中ki是节点Vi的度值。MDS和HMDS方法在不同参数维度D=2,3和迭代次数T=4,5,6的人工阿波罗网络中进行检测,其中本发明提出的HMDS方法步骤说明如下。步骤I :设模拟阿波罗网络为G=(V,E),其节点集和连边集分别为V={Vi,V2,...,Vn}和/.fczFxi·、连边数被简单表示为|E|。该网络也可用一个邻接矩阵Α=|^」]ΝΧΝ来表示,其满足如果(Vi, V」)e E则afl,否则afO。步骤2 :定义节点Vi和 ' 间异质最短路径长度为Iu,表示该两个节点之间(包括两端节点Vi和 ')任意路径的最小权重和。基于此,定义异质距离如下
Γ , (I - 2^)(6> + ^,) + 2ηΙνhtj=--L.⑴由于如果Vi和Vj相连,则Ii] =θ,+ θ} O \ 二 I,而如果它们不相连,则有h > θ,+θ} Λ, > I,故该异质距离满足网络不等式。步骤3 :利用获得的异质距离矩阵Η=[、_]_,计算距离矩阵 =[(^_]ΝΧΝ,其中的元素定义如下( Θ j+ Θ j).(2)
对任意三个节点Vi, V」,和Vk,假设dik≤ dJk ≤ (Iij,而根据异质最短路径长度的定义,我们有Iij ( iik+iJk- Θ k,结合⑴式和⑵式进而可得Clij= (1-2 η ) ( Θ j+ Θ j) +2 η Iij≤(1_2 η ) ( Θ j+ Θ j) +2 η (Iik+Ijk- θ k)≤ (1_2 η ) ( θ j+ θ j) +2 η (Iik+Ijk- θ k) +2 (I- η ) θ k= [ (1-2 η) ( θ j+ θ k) +2 Iik] + [ (1-2 η) ( θ』+ θ k) +2 Ijk]=dik+dJk.(3)而(3)式意味着根据以上方法计算获得的节点间距离满足三角不等式。步骤4 :基于获得的距离矩阵,按以下方法计算欧氏空间中节点的坐标。定义B=[bu]NXN为中心化内积矩阵,其元素由如下(4)式计算得到
权利要求
1.一种网络异质多维标度方法,其特征在于所述标度方法包括如下步骤 步骤I:将目标网络通过一个邻接矩阵来表示,利用网络节点度值给出网络节点特性向量; 步骤2:利用邻接矩阵和网络节点特性向量定义网络异质最短距离,在网络不等式约束下,结合网络异质最短距离的定义和网络节点特性向量计算节点间相似度矩阵; 步骤3 :通过相似度矩阵计算异质距离矩阵,利用该异质距离矩阵和网络节点特性向量定义距离矩阵,其中的距离满足三角不等式; 步骤4 :基于获得的距离矩阵,利用传统的MDS方法获得网络所有节点在某一维度欧氏空间中的坐标; 步骤5 :由各节点在欧氏空间中的坐标计算节点间嵌入异质距离,获得嵌入异质距离矩阵; 步骤6 :将所有节点对根据它们的嵌入异质距离进行从小到大排序,选择与原始网络相同连边数量的排序靠前的节点对,并对它们进行连接,从而构建嵌入网络,该嵌入网络与原始网络具有相同数量的连边,比较两个网络并计算嵌入误差。
全文摘要
一种网络异质多维标度方法,包括如下步骤步骤1利用网络节点度值给出网络节点特性向量;步骤2在网络不等式约束下,结合网络异质最短距离的定义和网络节点特性向量计算节点间相似度矩阵;步骤3利用该异质距离矩阵和网络节点特性向量定义距离矩阵,其中的距离满足三角不等式;步骤4基于获得的距离矩阵;步骤5由各节点在欧氏空间中的坐标计算节点间嵌入异质距离,获得嵌入异质距离矩阵;步骤6选择与原始网络相同连边数量的排序靠前的节点对,并对它们进行连接,从而构建嵌入网络,该嵌入网络与原始网络具有相同数量的连边,比较两个网络并计算嵌入误差。本发明全面考虑了广义网络距离和异质网络中节点特性的差异。
文档编号G06F17/30GK102890703SQ20121025169
公开日2013年1月23日 申请日期2012年7月20日 优先权日2012年7月20日
发明者宣琦, 马晓迪, 董辉, 张哲 , 俞立 申请人:浙江工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1