基于多阶路径中间节点资源分配的链路预测方法与流程

文档序号:16007128发布日期:2018-11-20 20:12阅读:131来源:国知局

本发明涉及网络科学技术和网络链路预测的技术领域,特别涉及一种基于多阶路径中间节点资源分配的链路预测方法。



背景技术:

城市的高速发展,在我们身边构成了各种各样的复杂网络,如社会关系网络、经济网络、交通运输网络、电力网络等,近年来大量的研究从网络结构的角度理解社会、生物和信息等复杂系统的性质,随着网络科学的日益发展和普及,人们对复杂网络的认识越来越深入和清晰。链路预测是网络科学的重要分支,主要研究两方面内容:一方面对一些实际存在但由于信息缺失而未被检测出的连边进行预测,另一个重要方面是对网络演化过程中未来可能产生联系的连边进行预测。

在计算机领域,链路预测方法主要是利用节点属性等外部信息基于机器学习和马尔科夫链来进行相似性刻画。由于节点属性等信息的获取比较困难,比如信息保密原因或信息本身不可信,传统的利用节点属性进行链路分析的方法在实际应用中作用有限。因此,基于连接关系网络的拓扑结构着手来进行链接预测有着更重要的研究与应用价值。这里面最经典也最简单的当属共同邻居算法(CN),认为两个节点有越多的共同邻居节点,两个节点就越相似;再比如Adamic-Adar算法(AA)和资源分配算法(RA),都是考虑了两未连接节点共同邻居的度值信息,并为不同邻居节点赋予了不同权重。还有比如局部路径算法(LP),在共同邻居的基础上,考虑了三阶路径的影响。上述这些传统的基于局部结构信息的预测算法的优势在于计算复杂度较低。但是这些算法考察的信息太有限,在一些大型复杂网络中表现并不突出。传统的链路预测方法对网络结构的提取和挖掘不够,没有充分挖掘出中间节点的资源合理分配问题,也没有深入挖掘中间节点在两个未连接节点中的重要作用;有的只考虑到邻居节点而没有再继续探讨三阶甚至更高阶节点的影响,一旦两个未连接节点没有公共邻居节点,就认为它们之间没有相似度,这显然是不够严密的。



技术实现要素:

为了克服现有的基于局部结构信息的链路预测方法考虑的信息有限导致预测精度不高的情况,本发明提出了一种预测精度较高的基于多阶路径中间节点资源分配作用的链路预测方法。

为实现上述目的,本发明提出的基于多阶路径中间节点资源分配的链路预测方法,其包括如下步骤:

S1,建立无权无向网络模型G=(V,E),V代表节点的集合,E代表边的集合;

S2,选取网络G中任意两个未连接节点x和节点y作为待预测节点对,根据待预测节点对的所有二阶路径中间节点的资源分配,计算待预测节点对在所有二阶路径中间节点资源分配作用下的相似度值L2x,y,其计算过程如下:

S21,任意选取所有二阶路径中的一条二阶路径,该二阶路径的中间节点记为w,计算节点x通过中间节点w连接到节点y的分配值:其中,k(w)表示节点w的度值,|Owy|表示节点w和节点y的共同邻节点数量;

S22,计算节点y通过中间节点w连接到节点x的分配值:其中,|Owx|表示节点w和节点x的共同邻节点数量;

S23,根据步骤S21中选取的二阶路径中间节点w在网络G中的中心性,计算中间节点w的中心性指标:其中,N代表该网络模型的节点总数;

S24,计算待预测节点对步骤S21中选取的二阶路径中间节点w资源分配作用下的相似度值:

S25,重复步骤S21~S24,计算待预测节点对在所有二阶路径中间节点w资源分配作用下的相似度值:

其中,(l2)x,y表示待预测节点对(x,y)之间长度为2的路径集合,w表示路径集合中任一条路径上经过的一个中间节点;

S3,根据待预测的节点对的所有三阶路径中间节点的资源分配,计算该节点对在所有三阶路径两个中间节点资源传递分配作用下的相似度值:

其中,(l3)x,y表示待预测节点对(x,y)之间长度为3的路径集合,(a,b)表示路径集合中任一条路径上经过的两个中间节点,α表示三阶路径对相似度值L3x,y的贡献度,α>0;

S4,结合二阶路径和三阶路径中间节点资源分配作用,构建第一链路预测算法模型,通过该第一链路预测算法模型计算网络G中任意两个未连接节点对的最终相似度值,根据两个未连接节点对的最终相似度值对该两个未连接节点对进行网络链接预测;其中,所述第一链路预测算法模型的构建过程如下:

S41,结合二阶路径和三阶路径的中间节点资源分配作用,计算待预测节点对(x,y)的最终相似度值:

S42,计算网络G中所有未连接的节点对相应的最终相似度值,将得到最终相似度值按照降序排列,并对应的节点对一起组合得到第一相似度-节点对列表,根据第一相似度-节点对列表对网络G中的链接进行预测。其中,第一相似度-节点对列表越靠前的节点对的最终相似度Sxy越大,表示该节点对产生链接的可能性更大。

优选地,还包括:S5,结合二阶路径至n阶路径中间节点资源分配作用,构建第二链路预测算法模型,通过该第二链路预测算法模型计算网络G中任意两个未连接节点对的最终相似度值,根据两个未连接节点对的最终相似度值对该两个未连接节点对进行网络链接预测;其中,所述第二链路预测算法模型的构建过程如下:

S51,结合二阶路径至n阶路径中间节点资源分配作用下,待预测节点对(x,y)的最终相似度值,计算待预测节点对(x,y)的最终相似度值:

其中,(a,b,c,d,…,μ,γ)表示n阶路径集合的任一条路径上经过的n-1个中间节点,αn-2表示n阶路径对最终相似度值Snxy的贡献度;

S52,对网络G中所有未连接的节点对,按Snxy的计算公式计算所有未连接的节点对相应的最终相似度值,将得到最终相似度值按照降序排列,并对应的节点对一起组合得到第二相似度-节点对列表,根据第二相似度-节点对列表对网络G中的链接进行预测。其中,第二相似度-节点对列表越靠前的节点对的最终相似度Snxy越大,表示该节点对产生链接的可能性更大。

本发明提出的网络链路预测方法充分挖掘了未连接节点对的中间节点对网络链接的资源分配作用并考虑到三阶甚至更高阶路径,并考虑了不同节点的中心性,区分节点本身的重要性。相比传统方法,本发明提供的链路预测方法将网络结构信息进一步扩展至网络的全局结构信息,更深入的挖掘了网络路径结构特点,更深入的刻画了关键节点的作用,从而有效提升链路预测的精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1为本发明的流程原理图;

图2为本发明的具体实施流程图;

本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

本发明提出一种基于多阶路径中间节点资源分配的链路预测方法。

参照图1-2,图1为本发明的流程原理图,图2为本发明的具体实施流程图。

如图1-2所示,在本发明实施例中,该链路预测方法包括如下步骤:

S1,建立无权无向网络模型G=(V,E),V代表节点的集合,E代表边的集合,网络中节点总数记为N。

S2,选取网络G中任意两个未连接节点x和节点y作为待预测节点对,根据待预测节点对的所有二阶路径中间节点的资源分配,计算待预测节点对在所有二阶路径中间节点资源分配作用下的相似度值L2x,y。具体的,相似度值L2x,y的计算过程如下:

S21,任意选取所有二阶路径中的一条二阶路径,该二阶路径的中间节点记为w,计算节点x通过中间节点w连接到节点y的分配值:其中,k(w)表示节点w的度值,|Owy|表示节点w和节点y的共同邻节点数量;

S22,考虑到网络G中的不对称现象,计算节点y通过中间节点w连接到节点x的分配值:其中,|Owx|表示节点w和节点x的共同邻节点数量;

S23,根据步骤S21中选取的二阶路径中间节点w在网络G中的中心性,计算中间节点w的中心性指标:其中,N代表该网络模型的节点总数,利用中心性指标区别不同节点本身的重要程度;

S24,计算待预测节点对步骤S21中选取的二阶路径中间节点w资源分配作用下的相似度值:

S25,重复步骤S21~S24,计算待预测节点对在所有二阶路径中间节点w资源分配作用下的相似度值:

其中,(l2)x,y表示待预测节点对(x,y)之间长度为2的路径集合,w表示路径集合中任一条路径上经过的一个中间节点。

S3,类比步骤S2中二阶路径中间节点的资源分配作用,进一步考虑三阶路径两个中间节点的资源分配作用,再根据待预测的节点对的所有三阶路径中间节点的资源分配,计算该节点对在所有三阶路径两个中间节点资源传递分配作用下的相似度值:

(l3)x,y表示待预测节点对(x,y)之间长度为3的路径集合,(a,b)表示路径集合中任一条路径上经过的两个中间节点,α表示三阶路径对相似度值L3x,y的贡献度,α>0。

在步骤S3中,考虑到3阶路径的两个中间节点的资源传递分配作用,传递时,相邻节点之间采用乘积方式连接。另外,由于三阶路径相对于二阶路径的贡献度更低,因此,在所有三阶路径两个中间节点资源传递分配作用下的相似度值的累加值前添加调节参数α,α为较小正小数,用于减小相似度值L3x,y的在最终相似度值Sxy中的权重。

S4,结合二阶路径和三阶路径中间节点资源分配作用,构建第一链路预测算法模型,通过该第一链路预测算法模型计算网络G中任意两个未连接节点对的最终相似度值,根据两个未连接节点对的最终相似度值对该两个未连接节点对进行网络链接预测。

具体地,第一链路预测算法模型的构建过程如下:

S41,结合二阶路径和三阶路径的中间节点资源分配作用,计算待预测节点对(x,y)的最终相似度值:

S42,计算网络G中所有未连接的节点对相应的最终相似度值,将得到最终相似度值按照降序排列,并对应的节点对一起组合得到第一相似度-节点对列表,根据第一相似度-节点对列表对网络G中的链接进行预测。其中,第一相似度-节点对列表越靠前的节点对的最终相似度Sxy越大,表示该节点对产生链接的可能性更大。

进一步的,在本实施例中,为了将更大量的网络结构信息包含进来,考虑网络的全局信息,链路预测方法还包括:S5,结合二阶路径至n阶路径中间节点资源分配作用,构建第二链路预测算法模型,通过该第二链路预测算法模型计算网络G中任意两个未连接节点对的最终相似度值,根据两个未连接节点对的最终相似度值对该两个未连接节点对进行网络链接预测。

具体地,第二链路预测算法模型的构建过程如下:

S51,结合二阶路径至n阶路径中间节点资源分配作用下,待预测节点对(x,y)的最终相似度值,计算待预测节点对(x,y)的最终相似度值:

其中,lnx,y表示待预测节点对(x,y)之间长度为n的路径集合,(a,b,c,d,…,μ,γ)表示n阶路径集合的任一条路径上经过的n-1个中间节点,αn-2表示n阶路径对最终相似度值Snxy的贡献度;

S52,对网络G中所有未连接的节点对,按Snxy的计算公式计算所有未连接的节点对相应的最终相似度值,将得到最终相似度值按照降序排列,并对应的节点对一起组合得到第二相似度-节点对列表,根据第二相似度-节点对列表对网络G中的链接进行预测。其中,第二相似度-节点对列表越靠前的节点对的最终相似度Snxy越大,表示该节点对产生链接的可能性更大。

在步骤S5中,按照步骤S1~步骤S4公开的同样的节点资源分配作用原理,引申到n阶路径,并综合考虑不同阶数路径的中间节点资源分配作用,同样地,也考虑了网络不对称现象。此外,当路径的阶数每升一阶,其相对贡献也会相对减少,还通过在每阶路径中添加可调参数αn-2来调节不同路径的贡献度,即减小多阶路径的权重。由此,在考虑上述综合因素后,提高对网络G中的链路预测精度。

本发明提供的优势在于充分挖掘了未连接节点对的中间节点对网络链接的重要作用,在考虑了节点的个数和度值等传统基于节点的预测方法的基础上,考虑了中间节点的资源合理分配作用和节点本身中心性差异。同时,也考虑了二阶路径计算中相似度值的分数值分布情况集中,区分度非常有限的不足,考虑到三阶甚至更高阶路径上的中间节点的影响作用,对二阶路径没有分辨出的相似度进行再次区别,将网络结构信息进一步扩展,着眼于网络的全局结构信息,实现对网络结构的深度挖掘和网络中关键节点的刻画,使链路预测精度实现有效提升。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1