一种基于BenefitRanks在加权网络上链路预测方法与流程

文档序号:12622561阅读:361来源:国知局
本发明涉及通讯
技术领域
,特别涉及一种基于BenefitRanks在加权网络上链路预测方法。
背景技术
:链路预测是复杂网络分析中一个重要的研究课题。网络中的链路预测(LinkPrediction)是指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性。这种预测既包含了对未知链接(existyetunknownlinks)的预测也包含了对未来链接(futurelinks)的预测。随着网络科学的快速发展,在理论方面,链路预测为网络的结构进化提供了切实的证据,其理论上的研究成果为链路预测搭建了一个研究的平台,使得链路预测的研究与网络的结构与演化紧密联系起来。在实际应用方面,链路预测应用非常广泛,从社会网络到生物网络(蛋白质互作网络、基因调控网络、代谢网络),从社会网络的推荐系统推断相似目标到恐怖分子网络的未知联系预测,从万维网的朋友关系预测到学术界的科学家合作关系预测等。尤其是在很多生物网络,例如蛋白质相互作用网络和新陈代谢网络,节点之间是否存在链接,或者说是否存在相互作用关系,是需要通过大量实验结果进行推断的。我们已知的实验结果仅仅揭示了巨大网络的冰山一角。仅以蛋白质相互作用网络为例,酵母菌蛋白质之间80%的相互作用不为我们所知,而对于人类自身,我们知道的仅有可怜的0.3%。由于揭示这类网络中隐而未现的链接需要耗费高额的实验成本。那么如果能够事先在已知网络结构的基础上设计出足够精确的链路预测算法,再利用预测的结果指导试验,就有可能提高实验的成功率从而降低试验成本并加快揭开这类网络真实面目的步伐!实际上,社会网络分析中也会遇到数据不全的问题,这时候链路预测同样可以作为准确分析社会网络结构的有力的辅助工具。除了帮助分析数据缺失的网络,链路预测算法还可以用于分析演化网络,即对未来的预测。举例来说,近几年在线社交网络发展非常迅速,链路预测可以基于当前的网络结构去预测哪些现在尚未结交的用户“应该是朋友”,并将此结果作为“朋友推荐”发送给用户:如果预测足够准确,显然有助于提高相关网站在用户心目中的地位,从而提高用户对该网站的忠诚度。另外,链路预测的思想和方法,还可以用于在已知部分节点类型的网络(partiallylabelednetworks)中预测未标签节点的类型――这可以用于判断一篇学术论文的类型或者判断一个手机用户是否产生了切换运营商(例如从移动到联通)的念头。技术实现要素:为了解决上述问题,本发明提供一种基于BenefitRanks在加权网络上链路预测方法,其特征在于,包含:获取BenefitRank值;根据所述BenefitRank值做链路预测。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,在获取BenefitRank值的步骤中,通过以下公式获得BenefitRank值:ranki=Σnj∈nei(i)rankj·pj,i,]]>其中,Pij为从状态i到状态j的转移概率。3、如权利要求2所述的基于BenefitRanks在加权网络上链路预测方法,其特征在于,从状态i到状态j的转移概率Pij的计算公式变为:pi,j=wi,jαΣz∈nei(i)wi,zα]]>其中,α为弱链接参数。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,在获取BenefitRank值的步骤中,需同时满意条件一:每条边的权值必须大于零和条件二:弱链接参数α的值提前设定。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,所述弱链接参数α的值大于等于零且小于等于一。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,所述弱链接参数α的值为0。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,所述获取BenefitRank值的过程经过若干次迭代获得。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,设定所述迭代次数为两次。进一步的,在所述的基于BenefitRanks在加权网络上链路预测方法中,在根据所述BenefitRank值做链路预测的步骤中,通过以下公式获得相似性度量:SxyBrRA=Σz∈Γ(x)∩Γ(y)w(x,z)a+w(z,y)arank(z);]]>其中,x、y、z为结点,且结点z为结点x和结点y的共同邻居,α为弱链接参数,rank(z)为结点z的BenefitRank值。本发明提供的基于BenefitRanks在加权网络上链路预测方法具有以下有益效果:本发明主要集中在蛋白质相互作用加权网络上的链路预测问题,很明显地,在实际的各种类型的网络中,结点之间的关系紧密程度不是完全一致的,在加权网络上的链接预测要比在无权网络上的链接预测更接近于实际。本发明是在加权的蛋白质相互作用网络上定义能够准确度量结点之间相似性的度量函数,并设计有效地链接预测算法,完成在加权网络上的链接预测任务。附图说明图1是本发明基于BenefitRanks在加权网络上链路预测方法的流程图;图2是本发明基于BenefitRanks在加权网络上链路预测方法的获得网络中结点BenefitRank值得示例图。具体实施方式以下将以图式揭露本发明的复数个实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本发明。也就是说,在本发明部分实施方式中,这些实务上的细节是非必要的。此外,为简化图式起见,一些习知惯用的结构与元件在图式中将以简单示意的方式绘示之。本发明是基于BenefitRanks在加权网络上的链路预测方法,因此先来定义何为BenefitRank:已知加权网络G=(V,E,W),结点ni的BenefitRank值,用ranki表示,ranki的计算公式:另外,计算网络结点的权威度,弱连接起到重要作用。为掌控弱链接对相似性度量的相对贡献,在获得结点的权威度即BenefitRank值时,引入自由参数。对于获得每个结点权威度,需要满足两个条件:需求1:每条边的权值必须大于零。需求2:当计算每个结点的BenefitRank值时,弱链接参数α的值须提前设定。需求1保证每个结点到另外一个结点的转移概率大于零而小于1.否则,当获得每个结点的转移概率值的时候,可能会是无限大不合乎常理。需求2保证不同的类型的网络可能对能不同的弱连接系数,在实际结点的权威度时,需要不断调整。已知加权网络G=(V,E,W),获得每个结点的BenefitRank值必须满足以上两个需求。本发明将加权网络模拟为马尔科夫链M(MarkovChain),同时考虑弱连接系数,从状态i到状态j的转移概率Pij的计算公式变为:pi,j=wi,jαΣz∈nei(i)wi,zα.]]>请参考图1,其是本发明基于BenefitRanks在加权网络上链路预测方法的流程图。如图1所示,本发明提供一种基于BenefitRanks在加权网络上链路预测方法,包括以下步骤:步骤一:获得BenefitRank值。在该步骤中,给定加权网络图G,假定设置弱链接参数α=1,那么对于图G中,在加权网络上,每个节点ni的从状态i转移的状态j的转移概率Pij已知可以得到点ni的BenefitRank值,记作ranki。这个获得BenefitRank的过程可以看作是在一个加权网络上的一个随机游走的过程,需要几次迭代达到一个稳定的状态。ranki(k)是第k次迭代所计算BenefitRank值。起初设定ranki(0)为1,当然ranki(0)也可以设置为任意常数c,则BenefitRank值的结果将是ranki(0)设置为1时候的倍,同时,根据弱链接理论,弱链接系数α可以从正到负调节。如图2所示,第一次迭代,每个结点ni更新其BenefitRank值ranki(1),这时每个结点都已经利用它的邻居结点的信息。第二代轮迭代,每个结点可以间接通过其一阶邻居收集到其二阶邻居的信息,同时其一阶邻居也通过它的一阶邻居收集到二阶邻居的信息。因此,k轮迭代之后,结点ni更新获得BenefitRank值ranki(k),同时收集到其k阶邻居的信息。第一轮迭代,n6会从其一阶邻居{n4,n5,n7,n8,n10}获取相似性信息。同样,n4和n5结点能它们的邻居交换信息。第二次迭代,n6能够从其二阶邻居{n2,n9,n11}获得其加权信息,因为第一轮迭代其一阶邻居n4,n5,n7,n8,n10已经利用{n2,n9,n11}。对于很大的复杂网络,网络越大计算代价也越大,因此对于不同的网络可以提前设定迭代的次数。在一优选的实施例中,开始,设置每个结点ni的初始BenefitRank值ranki(0)=1。对于每个结点ni,计算它到邻居结点nj的转移概率pij,同时传送信息给nj。例如,n6传送到传送0.0769到n5,到n10等等,同时,n6从其邻居获得到BenefitRank值信息。例如,n6结点从n5结点接受到BenefitRank的信息,直到从所有的邻居获得BenefitRank信息,n6会更新其BenefitRank值到rank6(1)。其计算过程如下:rank6(1)=Σj∈4,5,7,8,10rankj(0)·pj,i=1·p6,4+1·p6,5+1·p6,7+1·p6,8+1·p6,10=0.41.2+0.21.4+0.70.7+0.50.5+0.82.0=2.876]]>那么在第一轮迭代结束后,获得相应数值结果。下面进行第二轮迭代后,结点根据第一轮迭代得到的值更新每个结点BenefitRank信息。例如,现在n2传送到n5,同理,当n5收到所有它的邻居的BenefitRank值的信息,n5就可以更新其第二轮迭代得到的BenefitRank值。假设开始设定的迭代次数Υ=2,n5将停止继续更新其BenefitRank值,这时候获得了网络中所有结点经过两轮迭代得到的BenefitRank值见表1。表1步骤二:根据所述BenefitRank值做链路预测。传统的基于网络资源分配的策略的链路预测度量指标RA,该方法考虑网络中没有直接相连的连个结点x和y,从x可以传递一些资源到y,而在此过程中,它们的共同邻居就成为传递的媒介。假设每个媒介都有一个单位的资源并且将平均分配传给它的邻居,则y可以接受到的资源数定义为结点x和y的相似度。其定义的相似性度量公式如下:SxyRA=Σz∈Γ(x)∩Γ(y)1s(z)]]>这里z是结点x和y的共同邻居,s(z)是结点z的度。事实上,资源分配策略主要思想是识别两个未建立链接结点的共同邻居,结点度高的共同邻居会为两个未建立链接的结点传递权值较少资源,未建立链接贡献较少,反之,结点度低的会传递较多的资源,为建立链接贡献较多。本发明提出应用于无向加权网络上的扩展的基于资源分配策略的相似性度量,相似性度量公式如下:SxyBrRA=Σz∈Γ(x)∩Γ(y)w(x,z)a+w(z,y)arank(z)]]>同样,这里z是结点x和y的共同邻居,rank(z)是结点z的BenefitRank值。通过上述描述,本发明定义的相似性度量不同于传统的应用于无权网络的经典相似性度量。第一,本发明的相似性度量是应用于无向加权网络上;第二,本发明定义的相似性度量是通过在加权网络上建立马尔科夫模型,考虑了加权网络上的弱链接效应,对结点计算值加权定义的相似性度量;第三,本发明定义的相似性度量,形式上是根据未建立链接的两个结点的共同邻居,实质上在计算值的时候,未建立链接的两个结点的共同邻居已经收集到其一阶邻居、二阶邻居甚至高阶邻居的局部或者全局信息。这样很明显,当设置弱链接系数α=0时,在计算结点的BenefitRank值时,相当于网络所有边的权值为1,既然网络边的权值相等,既是相当于无权网络。这样本发明定义的链路预测方法其实既可以适用于加权网络,也适用于无权网络的链路预测。为了方便比较现存的方法WCN,WAA和WRA,依次详细列出这些相似性度量方法:SxyWCN=Σz∈Γ(x)∩Γ(y)w(x,z)a+w(z,y)a]]>SxyWAA=Σz∈Γ(x)∩Γ(y)w(x,z)a+w(z,y)alog(1+s(z)).]]>虽然本发明已以实施方式揭露如上,然其并不用以限定本发明,任何熟习此技艺者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视后附的申请专利范围所界定者为准。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1