一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法与流程

文档序号:12720495阅读:621来源:国知局

本发明涉及网络与链路预测领域,特别是指一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法。



背景技术:

随着互联网技术的蓬勃发展,人类跨入了网络新时代,对世界的认识也越来越深刻。如今,网络几乎覆盖了我们学习、工作、生活等各个方面。上网查资料、线上找工作、网上购物等均涉及到万维网。越来越多的人通过互联网来获取外界信息,从而了解社会动态。实际生活中我们与人相处就会形成一张人际关系网,网上购物数据就会形成一张订制的个人偏好网络,交通出行也构成了一张错综复杂的交通网络。网络大数据的研究为我们生活提供了便利,发展了现代科技,为电商等带来极高的价值。

链路预测是指通过网络中已知的节点信息去预测网络中其他未知状态或者还没有直接连接的节点间产生连接的概率。在生物网、互联网、交通网、金融网等各式各样的网络中都可以创造可观的价值。总结前人经验,链路预测的研究主要是基于网络结构特性,给出节点连接的相似性分数,然后与真实网络进行对比,衡量算法的优劣性,如:RA指标,CN指标。由于网络的多样性以及网络数据越来越庞大,越来越复杂,更新链路预测算法使得预测精度与效率达到满意程度就显得十分必要。对于简单的网络,许多算法可能都会适用,一旦网络变得复杂,网络数据中存在的特性难以用简单的算法提取,常常会出现噪声过多导致预测效果变差的情况,因此对链路预测的特性提取研究就显得非常必要。



技术实现要素:

为了克服现有预测网络连边的方法的获取网络信息不全面、预测精度较低、预测性能较差的不足,为了更全面地获取网络信息,提升现有算法的预测性能,本发明提出一种准确性较高、预测精度较高的一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法。

本发明解决其技术问题所采用的技术具体步骤是:

一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法,包括如下步骤:

步骤一:构建内部连通的无向无权网络G(V,E),E为连边,V为节点,其邻接矩阵用A表示;

步骤二:任意选取网络G中两个无连边的节点i和j为两个种子节点,i和j之间路径长度为2的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部群落,该群落的节点总数记为CNij,总连边数量记为SCSij,节点i和j的一阶和二阶邻居的总数分别记为Ti和Tj,其中与节点i或j的路径长度等于1的节点为其一阶邻居,与节点i或j的路径长度等于2的节点为其二阶邻居;

步骤三:计算二阶局部群落的边聚类系数:

步骤四:计算二阶局部群落的简谐平均距离:

其中,

上式中,g和h表示二阶局部群落中任意两个节点,dgh为g和h两个节点之间的路径长度;

步骤五:计算二阶局部群落的连边密度:

Dij=SCSij/CNij

步骤六:计算二阶局部群落系数:

步骤七:计算节点i,j的皮尔逊积矩相关系数:

上式中,<Ai>表示邻接矩阵中第i行元素的均值其中n表示邻接矩阵A含n个节点;

步骤八:计算两个节点i,j之间的相似性分数指标:

HJCPij=LCTij*CNij*SCSij/(Ti+Tj-CNij)+λ*Sij

上式中,λ为可调参数;

步骤九:遍历网络,针对所有未直接连接的节点对,重复步骤二至步骤八,计算相应的HJCP指标作为节点对之间的可能产生连边的评价指标,HAJCP指标越高,节点对之间越可能存在连边;将网络中所有的未直接相连的节点对之间的HJCP指标按照由高到低的顺序排列,取前h个HJCP指标对应的节点对为可能的预测连边,h≤H,其中H为网络中没有直接连边的节点对的总数。

本发明的技术构思为:基于网络结构的链路预测方法,从高阶邻居网络结构中获取的信息往往带有一定的噪音。本发明利用二阶邻居节点,在考虑二阶局部群落的结构特征的同时,考虑共同邻居比例信息,使用皮尔逊积矩相关系数为高阶邻居网络信息降噪,提取网络中二阶局部群落的有效信息,提高预测算法的预测精度和准确性。

本发明的有益效果为:考虑了两个未连接节点之间的二阶局部群落的结构特征,充分利用了共同邻居比例信息,并用皮尔逊积矩相关系数降噪,准确性较高,预测精度较高。

附图说明

图1为二阶局部群落的示意图,白色圆点为不存在直接连边的节点对,即种子节点,黑色圆点为一阶共同邻居节点与二阶共同邻居节点,虚线为一阶和二阶共同邻居节点之间的边,实线为种子节点和一阶、二阶共同邻居之间的边,黑色圆点和他们之间的虚线组成了二阶局部群落。

具体实施方式

下面结合附图对本发明做进一步说明。

参照图1,一种基于二阶局部群落共同邻居比例和节点相关性的预测网络连边的方法,包括如下步骤:

步骤一:构建内部连通的无向无权网络G(V,E),E为连边,V为节点,其邻接矩阵用A表示;

步骤二:任意选取网络G中两个无连边的节点i和j为两个种子节点,i和j之间路径长度为2的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居,即图1中的黑色圆点,为一阶共同邻居和二阶共同邻居,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,即图1中黑色圆点间的虚线,构成二阶局部群落,该群落的节点总数记为CNij,总连边数量记为SCSij,节点i和j的一阶和二阶邻居的总数分别记为Ti和Tj,其中与节点i或j的路径长度等于1的节点为其一阶邻居,与节点i或j的路径长度等于2的节点为其二阶邻居;

步骤三:计算二阶局部群落的边聚类系数:

步骤四:计算二阶局部群落的简谐平均距离:

其中,

上式中,g和h表示二阶局部群落中任意两个节点,dgh为g和h两个节点之间的路径长度;

步骤五:计算二阶局部群落的连边密度:

Dij=SCSij/CNij

步骤六:计算二阶局部群落系数:

步骤七:计算节点i,j的皮尔逊积矩相关系数:

上式中,<Ai>表示邻接矩阵中第i行元素的均值其中n表示邻接矩阵A含n个节点;

步骤八:计算两个节点i,j之间的相似性分数指标:

HJCPij=LCTij*CNij*SCSij/(Ti+Tj-CNij)+λ*Sij

上式中,λ为可调参数;

步骤九:遍历网络,针对所有未直接连接的节点对,重复步骤二至步骤八,计算相应的HJCP指标作为节点对之间的可能产生连边的评价指标,HAJCP指标越高,节点对之间越可能存在连边;将网络中所有的未直接相连的节点对之间的HJCP指标按照由高到低的顺序排列,取前h个HJCP指标对应的节点对为可能的预测连边,h≤H,其中H为网络中没有直接连边的节点对的总数。

如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1