一种基于二阶局部社团信息的预测网络未知连边的方法与流程

文档序号:12366025阅读:392来源:国知局

本发明涉及网络与链路预测领域,特别是指一种基于二阶局部社团信息的预测网络未知连边的方法。



背景技术:

随着科学飞速发展,人类进入了网络时代。各类以互联网为载体的技术与产业也应运而生,极大地改善了人们的学习与生活。我们生活在形形色色的网络中。与人交往就会出现关系网,出行则会有交通网络。自然科学的快速发展,使得我们对世界的认识越来越多。人类研究的网络越来越庞大且复杂,在如今大数据的背景下,随着需要处理的单个数据规模和数据总规模的增大,数据的平均质量却是在下降,而数据的不完整性造成的影响变得更加突出。这时就可使用链路预测来预测或重构接近真实且较完整的数据。链路预测技术可应用于任何可以将实体及其间接关系抽象成网络形式的系统中,如在线社交网络、电子商务网站等,从而产生可观的商业价值。因此,链路预测的研究显得十分有必要。

网络的链路预测包括对未知连边的预测,还包括对未来的连边预测。出于某种原因网络的信息会存在少量丢失的情况,利用网络中已知的信息去分析,最终还原缺失信息,这种就属于前者。考虑到网络的变化,节点及节点间的联系均存在变化,根据现有信息对网络中未来信息(现在不存在,但未来可能会存在)的预测则是后者。链路预测简单的说就是通过已知的节点信息去预测其他还未直接相连或未知状态的节点间产生连接的概率。近些年来,对于链路预测的研究主要是基于节点相似性,分别基于节点与路径对真实网络数据进行测试,如:AA指标,CN指标。周涛等在此基础上提出两种新指标:资源分配指标和局部路径指标。刘伟平和吕琳媛提出了两种局部随机游走指标。有限步的随机游走有时会比全局收敛后的预测精度要高,而最优的游走步数受到网络平均距离的强烈影响。传统上人们在解决问题时,往往考虑一阶共同邻居节点并对二阶共同邻居节点对整个网络的链路预测的重要作用考虑的不够多,本发明提出了一种基于二阶局部社团信息的预测网络未知连边的方法,考虑了种子节点的共同邻居节点之间的联系,同时还考虑到了边聚类系数和平均最短路径的影响。充分利用网络中的局部信息是提高链路预测算法准确性的一种新的有效手段。本发明针对相似性算法进行了扩展,种子节点的社团信息由原来的一阶邻居节点扩展到二阶邻居节点。



技术实现要素:

为了克服已有链路预测算法准确率低,信息利用率低的不足,本发明考提出一种准确率高、预测效果良好的基于二阶局部社团信息的链路预测方法。

本发明解决其技术问题所采用的技术具体步骤是:

一种基于二阶局部社团信息的预测网络未知连边的方法,包括如下步骤:

步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;

步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;

步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij

步骤四:计算二阶局部社团的边聚类系数:

<mrow> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>LCL</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>/</mo> <mfrac> <mrow> <msub> <mi>CN</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>CN</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mn>2</mn> </mfrac> <mo>;</mo> </mrow>

步骤五:计算二阶局部社团的简谐平均距离:

其中,

上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;

步骤六:计算二阶局部社团系数:

<mrow> <msub> <mi>TLCC</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>/</mo> <mover> <msub> <mi>L</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>;</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

步骤七:计算节点i,j之间的相似性分数指标:

LCARij=CNij*LCLij*TLCCij

步骤八:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤七,计算相应的LCAR指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。

本发明的技术构思为:许多的链路预测算法仅仅考虑一阶邻居节点而没有利用到高阶邻居节点,往往二阶邻居节点对整个网络的链路预测有着不可忽视的影响;本发明利用二阶邻居节点同时加入简谐平均距离和边聚类系数,充分利用网络中的局部信息,在具有局部特性结构的网络中有很好的预测效果,可以提高链路预测算法准确性。

本发明的有益效果为:本发明将局部社团从一阶邻居扩展到二阶邻居,充分利用了已知的网络节点以及网络局部结构信息,算法的精确度高。

附图说明

图1为二阶局部社团描述图,黑色圆点为种子节点,白色圆点为共同邻居节点,虚线为邻居节点之间存在的连边,实线为种子节点与共同邻居之间的连边,白色圆点和虚线构成了二阶局部社团。

具体实施方式

下面结合附图对本发明做进一步说明。

参照图1,一种基于二阶局部社团信息的预测网络未知连边的方法,包括以下步骤:

步骤一:在保证整个网络保持连通的条件下建立网络模型G(V,E),其中V为网络中的节点,E为网络中的边;

步骤二:选取网络中一对没有连边的节点i和j作为两个种子节点,即图1中黑色圆点,提取所有i和j的一阶共同邻居节点和二阶共同邻居节点以及这些节点之间的连边,如图1中的白色圆点及其连边,构成二阶局部社团,其中i和j之间长度为2的路径的中间的一个节点为一阶共同邻居,长度为3的路径的中间2个节点为二阶共同邻居;

步骤三:遍历整个二阶局部社团,节点总数记为CNij,总连边数量记为LCLij

步骤四:计算二阶局部社团的边聚类系数:

<mrow> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>LCL</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>/</mo> <mfrac> <mrow> <msub> <mi>CN</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>CN</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mn>2</mn> </mfrac> <mo>;</mo> </mrow>

步骤五:计算二阶局部社团的简谐平均距离:

其中

上式中,g和h表示二阶局部社团中任意两个节点,dgh为g和h两个节点之间的路径长度;

步骤六:计算二阶局部社团系数:

<mrow> <msub> <mi>TLCC</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>p</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>/</mo> <mover> <msub> <mi>L</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&OverBar;</mo> </mover> <mo>;</mo> </mrow>

步骤七:计算节点i,j之间的相似性分数指标:

LCARij=CNij*LCLij*TLCCij

步骤八:遍历整个网络,对任意两个未连接节点,重复步骤二至步骤七,计算相应的LCAR指标作为节点对之间的相似性分数指标,相似性分数越高,相应的节点对之间出现连边的可能性越大,将所有的未连接节点对之间的相似性分数按降序排列,取前m个指标对应的节点对为预测连边,m≦M,M为整个网络中所有未连接节点对的总数。

如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1