一种加权网络间的权重迭代节点匹配方法

文档序号:6618137阅读:259来源:国知局
专利名称:一种加权网络间的权重迭代节点匹配方法
技术领域
本发明涉及数据挖掘和复杂网络分析技术,尤其是一种节点匹配方法。
背景技术
随着计算机科学的发展,人们越来越习惯用网络来刻画这个世界,比如生物体内的蛋白质网络(见文献[1]E.Ravasz, A.L.Somera, D.A.Mongru, Z.N.0ltvai, andA.L.Barabasi, Hierarchical Organization of Modularity in Metabolic Networks,Science, 297 (5586): 1551-1555, 2002.即劳沃斯,索摩尔,蒙格鲁,欧尔特沃伊,巴拉巴西,代谢网络中分层的模块化组织,《科学》,297(5586):1551-1555, 2002.文献[2]A.L.Barabasi and Z.N.0ltvai, Network Biology:Understanding the Cell’sFunctionalOrganization, Nature Reviews Genetics, 5 (2): 101-113, 2004.即巴拉巴西,欧尔特沃伊,网络生物学:了解细胞的功能组织,《自然遗传学评论》,5(2):101-113,2004.文 献[3]C.Stark, B.J.Breitkreutz, T.Reguly, L.Boucher, A.Breitkreutz, andM.Tyers, Biogrid:A General Repository for Interaction Datasets.NucleicAcidsResearch, 34(suppl I):D535_D539, 2006.即斯塔克,布赖特克罗伊兹,赖古伊,鲍彻,泰尔斯,生物网:相互作用数据库的通用存储,《核酸研究》,34:D535-D539,2006.),日常语言网络(见文献[4] R.F.1 Cancho, R.V.Sole, et al.The Small World of HumanLanguage,Proceedings of the Royal Society of London.Series B:BiologicalSciences, 268(1482):2261-2265, 2001.即坎乔,舍勒,等.人类语言的小世界,《伦敦英国皇家学会论文集.B辑:生物科学》,268 (1482): 2261-2265,2001.文献[5]R.F.1 Cancho, R.V.Sole, andR.Kohler.Patterns in Syntactic Dependency Networks.Physical ReviewE, 69 (5):051915, 2004.即坎乔,舍勒,寇勒.依存句法网络的模式.《物理评论 E》,69(5):051915, 2004.文献[6]D.R.Amancio, L.Antiqueira, T.A.S.Pardo, L.F.Costa, 0.N.0liveira, and M.G.V.Nunes.Complex Networks AnalysisofManuaI and Machine Translations.1nternational Journal of Modern Physics C,19(4):583-598, 2008.即阿曼希奥,安提括拉,帕尔多,考斯塔,奥利韦拉,努内斯.人工与机器翻译的复杂网络分析.《现代国际物理期刊C》,19(4):583-598,2008.),描述人际关系的社交网络(见文献[7] C.M.Lakon, S.T.Ennett, and E.C.Norton.Mechanismsthrough Which Drug, Sex Partner,and Friendship NetworkCharacteristicsRelate to Risky Needle Use among High Risk Youth and Young Adults.SocialScience & Medicine, 63(9):2489-2499, 2006.即拉肯,恩耐特,诺顿.危险针头在高危青少年中的使用机制与毒品,性伴侣和友情网络的相关特性.《社会科学与医学》,63 (9): 2489-2499,2006.),等等。由于世间万物的多维度属性,使得我们可以从不同的角度看待同一个体,故可以认为多数网络不是单独存在的,即很多同类网络具有一定的相关性,而这种相关性很大程度上体现在相同个体在不同网络中存在的不同身份(见文献[8]M.Kurant and P.Thiran.Layered ComplexNetworks.Physical ReviewLetters, 96 (13): 138701, 2006.即库阮特,色万.分层复杂网络 《物理评论快报》,96 (13): 138701,2006.文献[9] S.V.Buldyrev, R.Parshani, G.Paul, H.E.Stanley, andS.Havlin.Catastrophic Cascade of Failures ininterdependent Networks.Nature, 464 (7291): 1025-1028, 2010.即布尔德列夫,普沙尼,保罗,斯坦利,豪夫林.相互连接的网络中故障的灾难性串联.《自然》,464 (7291):1025-1028,2010.文献[10]Q.Xuan, F.Du, and T.J.ffu.EmpiricalAnalysis of Internet Telephone Network:FromUser Id to Phone.Chaos:AnInterdisciplinary Journal of Nonlinear Science, I9(2):023101-023101,2009.即宣琦,杜方,吴铁军.互联网电话网络的实证分析:从用户ID到电话.《混沌:非线性科学的多学科期刊》,19(2):023101-023101,2009.文献[11]Q.Xuan and T.J.ffu.Node Matching Between Complex Networks.PhysicalReviewE, 80(2):026103, 2009.即宣琦,吴铁军 复杂网络上的节点匹配.《物理评论E)), 80 (2):026103, 2009.)。例如,不同蛋白质网络中的同源蛋白质通常由一个共同的原始蛋白质在不同的生物体中逐渐演化而形成。虽然这些属于不同生物体的同源蛋白质可能拥有不同的形态,但在调节生物体时可能发挥相似的作用。因此,当把同源蛋白质视为同一蛋白质的不同形态时,可以认为不同的蛋白质网络是彼此相关的。此外,同一个语义在不同的语种中也拥有不同的词汇表述,甚至对于同一语种,因为历史的演化也会产生这种语义表述差异,如一脉相承的中国商代甲骨文、周朝青铜器铭文、秦朝篆书、汉朝隶书以及魏晋楷书等。而由于国际文化的交流融合以及历史传承,这些不同朝代不同国家的不同语言网络可能存在结构上的相似性,因此,当把某些不同的文字视为同一语义的不同形态时,可以认为不同的语言网络同样具有相关性。再者,在现代社会,人们可以使用各种方式与其他人交流,比如电话(见文献[12]J.P.0nnela, J.Saramaki,J.Hyvdnen, G.Szabo, D.Lazer, K.Kaski, J.Kertesz, and A.L.Barabas1.Structure andTie Strengths in Mobile CommunicationNetworks.Proceedings of the NationalAcademy of Sciences, 104(18):7332, 2007.即翁内拉,萨拉玛奇,豪翁恩,萨博,拉泽,卡斯基,凯尔泰斯,巴拉巴西.移动通信网络中的结构与约束力.《美国国家科学院会议论文集》,104(18):7332, 2007.文献[13] A.E.Motter, T.Nishikawa, andY.C.La1.Large-scale Structural Organizationof Social Networks.Arxiv PreprintCcond-mat/0303571, 2003.即莫特,尼施卡瓦.社交网络的大型组织结构.《Arxiv非正式版本》/0303571,2003.)、电子邮件(见文献[14]M.E.J.Newman, S.Forrest, andJ.Balthrop.EmaiI Networks and the Spreadof Computer Viruses.PhysicalReviewE, 66(3):035101,2002.即纽曼,弗利斯特,巴斯欧.电子邮件网络与计算机病毒传播 《物理评论 E)),66(3):035101, 2002.)、MSN (见文献[15]T.Mah, H.Hoek, and Y.L1.Funnel Report Mining for the MsnNetwork.1nProceedings of the Seventh ACM SIGKDDInternational Conference onKnowledge Discovery and Data Mining, pages 450-455.ACM, 2001.即马斯,胡克,李.MSN网络的汇总报告挖掘.《第七届ACM知识发现与数据挖掘国际会议论文集》,450-455.ACM,2001.)等等。如果两个人使用其中某种方式相互沟通,那他们可能因为某些原因,如友情发展等,在另一时间使用其他方式进行联系,由此可见,现代通讯网络之间也存在相关性。此类例子举不胜举。因此,当将不同种类的复杂系统描述成复杂网络时,诸如同源蛋白质发现,古词翻译,互联网跨网犯罪跟踪等不同领域的现实问题均可转换为网络间的节点匹配问题,从而纳入统一的理论框架进行求解。假设不同的目标网络存在结构相关性,该问题可以利用小部分已匹配节点对提供的信息,通过设计节点匹配算法得到一定程度上的解决。特别是我们近期提出的一种有效的迭代节点匹配算法(见文献[16]Q.Xuan,F.Du,andT.J.ffu.1terative Node Matching between ComplexNetworks.Journal of PhysicsA:Mathematical and Theoretical, 43:395002, 2010.即宣綺,杜方,吴铁军 复杂网络的迭代节点匹配.《物理A期刊:数学与理论》,43:395002,2010.),在揭示两个相关的人工无标度网络间(见文献[17]A.L.Barabdsiand R.Albert.Emergence of Scaling inRandom Networks.Science, 286 (5439): 509-512,1999.即巴拉巴西,阿尔伯特.随机网络中标度的出现.《科学》,286(5439):509-512,1999.)对应节点时有着非常好的效果。事实上,我们只利用少于2%的已匹配节点对就正确匹配了超过90%的剩余节点。然而,进一步的实验表明,当目标网络中大量节点具有较高对称性(见文献[18]Y.Xiao, M.Xiong, ff.Wang, and H.Wang.Emergence of Symmetry in Complex Networks.PhysicalReviewE, 77
(6):066108, 2008.即肖华,熊明,王威,黄骅.复杂网络中对称性的出现.《物理评论E)), 77 (6):066108, 2008.)时,即这些节点具有很多相同邻居,纯粹基于拓扑的节点匹配算法通常会失效。这一结果毫不意外,因为在同一网络中都很难区分这些对称节点,更不用说仅通过其局部拓扑结构 利用一对一匹配算法对它们进行精准匹配。而由于研究发现实际网络通常具有较高的对称性拓扑结构,因此现有的一对一节点匹配算法需要进一步改进以满足现实需求。弥补一对一迭代节点匹配算法的这一缺陷可以从两方面下手。一方面是提出一对多(见文献[19] F.Du, Q.Xuan, and T.WU.0ne-to-many Node Matchingbetween ComplexNetworks.Advances in Complex Systems, 13(6):725, 2010.即杜方,宣綺,吴铁军 复杂网络上的一对多节点匹配.《复杂系统进展》,13(6):725, 2010.)甚至多对多节点匹配算法。当目标只是设定为迅速缩小搜索范围时,该方法不失为一个好的选择,然而,在大多数情况下,该方法只能认为是一种折衷而非真正意义上的改进方案。另一方面是推广节点间相似度定义使之包含更多信息以便差异化拓扑结构上的对称节点。考虑到大多数真实世界网络为加权网络,足以提供此类额外信息,因此本发明将首次沿着这一方向把链接权重考虑进相似度计算,进而改进原有的节点匹配算法。事实上,现实网络节点间的权重有可能是正相关的,比如由于某些正面的激励,如果某个个体在某个网络花费了更多的时间与其某些邻居互动,则该个体在另一个网络中可能也会花费较多的时间与对应的邻居互动;也有可能是负相关的,如果网络中某个个体与其邻居互动的时间比较均等,而对不同的邻居采用的互动方式具有较大差异,此时可以认为当该个体在某个网络中花费更多时间与某些邻居互动,则该个体在另一个网络中只能花费更少的时间与对应的邻居互动。

发明内容
为了克服已有迭代节点匹配方法的匹配效果较差、精度较低的不足,本发明提供一种提升匹配效果、提高匹配精度的加权网络间的权重迭代节点匹配方法。本发明解决其技术问题所采用的技术方案是:一种加权网络间的权重迭代节点匹配方法,所述匹配方法包括以下步骤:
步骤1:已匹配节点对的选择,具体过程如下:网络G1中的节点集R1依据节点度值通过以下步骤选取K1中度值最大的节点首先被选定为R1的唯一元素,用=0)表示R1的邻居集,即满足U1中的每个节点至少被R1中的一个节点连接,而集合V1X (U1 U R1)中的任一节点与R1中的任一节点均没有连接;将集合V1XR1中的节点根据它们属于仏的邻居数按降序排列,选择排序第一的节点,将其添加到R1中;更新R1和U1并重复以上选择过程直到R1集总共包含已个节点;之后G1中隶属于R1集合的节点以及它们在G2中的匹配节点被选定为已匹配节点对;
步骤2:相似度计算:来自不同网络的两个未匹配节点v,i和vj与k对已匹配节点对V1J V,2,1=1,2,…,k分别连接,记vl和V丨之间连边的权重为W,1,而v;3和vf之间连边的权重为< 测权重网络间节点相似度定义为:
权利要求
1.一种加权网络间的权重迭代节点匹配方法,其特征在于:所述匹配方法包括以下步骤: 步骤1:已匹配节点对的选择,具体过程如下: 网络G1中的节点集R1依据节点度值通过以下步骤选取=G1中度值最大的节点首先被选定为R1的唯一元素,用U1表示T1的邻居集
全文摘要
一种加权网络间的权重迭代节点匹配方法,包括以下步骤步骤1已匹配节点对的选择;步骤2相似度计算来自不同网络的两个未匹配节点和与k对已匹配节点对l=1,2,…,k分别连接,记和之间连边的权重为而和之间连边的权重为则权重网络间节点相似度定义为(4);步骤3节点匹配每一轮迭代选定属于不同网络的一对相似度最高的未匹配节点为当前的匹配节点对,之后将其认为是一对新揭示的已匹配节点对并转到步骤2,根据公式(4)重新计算相似度;步骤4终止条件直到一个目标网络中的所有节点被匹配完,结束。本发明提升匹配效果、提高匹配精度。
文档编号G06F17/30GK103207884SQ20121048319
公开日2013年7月17日 申请日期2012年11月23日 优先权日2012年11月23日
发明者宣琦, 张哲 , 马晓迪, 董辉, 俞立 申请人:浙江工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1