一种基于全局路径感知图神经网络模型的链路预测方法

文档序号:34572385发布日期:2023-06-28 12:22阅读:84来源:国知局
一种基于全局路径感知图神经网络模型的链路预测方法

本发明涉及复杂网络中链路预测,尤其涉及一种基于全局路径感知图神经网络模型的链路预测方法。


背景技术:

1、近些年来,计算机科学快速发展,各种实体(人或物)之间形成的各种复杂的关系组成了很多复杂网络。并且图结构具有强大的表现力,用机器学习方法分析图的研究越来越受到重视。图神经网络(gnn)将深度学习应用于图结构数据并取得了良好的性能。在复杂网络中,链接预测任务是长期存在的主要问题之一,包括预测已存在但未发现或者丢失的边和不久的将来将会出现的边。其主要对网络的节点的附加属性信息以及拓扑结构等进行学习,充分利用这些关联因素进行预测。链路预测的研究不仅可以有助于加快网络科学的发展和演变,同时有着广泛的应用场景,例如用于指导生物实验以提高实验成功率,对社交网络中的朋友推荐和敌友关系进行预测,电子商务网站上的商品推荐,以及通过识别隐藏的链边和虚假的链边对信息不完全或含有噪音的网络进行重构等等。

2、由于gnn在很大程度上依赖于平滑的节点特征,没有考虑链接预测任务独有的性质,忽略了图的结构特征,从而在链接预测下游任务中,gnn通常比简单启发式方法性能更差。但图的结构信息,例如共同邻居信息、节点的度和节点间的路径信息对链路预测至关重要。启发式方法如cn、aa、ra往往需要人为设计,存在很大局限性。浅层embedding如deepwalk、line、node2vec等,则通过得到两个节点的结构信息的向量表示,然后通过两个向量的相似度来判断两个节点的连边概率(分数),相比于启发式,对结构信息的捕捉更有效。但是大部分浅层的embedding学习无法结合节点自身的属性。


技术实现思路

1、本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于全局路径感知图神经网络模型的链路预测方法,融合网络的属性信息和结构信息,从邻接矩阵中学习节点间的全部路径信息作为节点间的分数,并通过计算待预测节点对的共同邻居得分进行链接预测。

2、为解决上述技术问题,本发明所采取的技术方案是:

3、一种基于全局路径感知图神经网络模型的链路预测方法,对静态属性网络进行结构信息和属性信息的提取,通过链路预测函数进行打分,再将两分数进行融合,得到最终预测结果;通过拟合预测值和真实值的差距进行模型训练和参数更新。

4、其中结构信息的提取包括:权重提取,学习节点属性的潜在信息;节点初始结构表示提取;路径感知聚合。最终得到节点的结构表示。

5、属性信息的提取是将初始属性表示放入图神经网络得到节点属性的表示;

6、所述链路预测函数进行打分包括:对待预测的节点对的结构表示进行hadamard积得到链路预测的结构得分;对待预测的节点对的属性表示先相乘后输入多层感知机mlp得到链路预测的属性得分。

7、所述融合过程为对链路预测函数得到的结构得分和属性得分分配可学习的权重并加和,作为最终链路预测的评分。

8、模型训练和参数更新是使用二元交叉熵损失函数,分别以不同的权重从结构、属性、结构属性混合三个方面,来拟合预测值和真实数据,再反向传播更新模型参数。

9、进一步地,所述权重提取,将节点的初始属性潜在信息添加到结构信息提取子模型中,使得提取到的信息更加完整,具体方法为:

10、步骤1:对于给定的图,对于存在边的节点对,利用节点的初始属性表示x∈rn×f信息,其中xi∈rf(i∈(1,2i,...,n)),n为节点数量,计算两节点间属性表示的欧式距离作为相似性,用于度量两节点的分歧程度,并将其作为边权,公式如下:

11、

12、其中,eij表示通过节点初始属性信息计算相似性得到的边的权重;

13、步骤2:归一化,将得到的边的权重eij使用sigmoid函数进行归一化,使得预测效果更加稳定。将邻接矩阵a∈rn×n中存在边的节点对,即aij=1,使用归一化的边权a′ij替换,得到加权邻接矩阵a′;归一化的边权a′ij公式如下:

14、

15、进一步地,所述节点初始结构表示提取,对网络中的结构信息进行学习,作为节点的初始结构信息,即根据节点的不同结构信息计算节点在链路预测时的贡献分数;使用多层感知机mlp动态地学习节点的初始结构表示,包括以下步骤:

16、步骤3:输入加权邻接矩阵a′,使用由两个mlp组成的初始结构表示生成器动态学习每个节点的初始结构表示,其作用是当节点作为待链路预测节点对的公共可达节点时,对链路预测任务的贡献分数,公式如下:

17、

18、其中,为节点i的初始结构表示,即贡献分数;fθ(·)为初始结构表示提取器;fθnode(·)、fθedge(·)表示两个mlp;n(i)表示节点i的邻居节点;a′ij的值:节点间若存在边则为权重a′ij,不存边在则为0;

19、步骤4:将得到的节点初始结构表示构造对角矩阵xstruct∈rn×n,公式如下:

20、xstruct=diag(xstruct)。

21、进一步地,所述路径感知聚合,即对网络中节点之间的路径信息进行提取,使用katz指数计算两节点间全部路径信息作为节点间的可达权重,节点i的所有可达节点的贡献分数乘以对应的可达权重作为贡献度,并聚合到n维的向量作为节点的结构表示,包括如下步骤:

22、步骤5:计算待链路预测目标节点的可达节点k的可达权重;

23、邻接矩阵a中aij看作节点i和节点j之间路径的长度为1的路径条数,延伸到更高阶an,an中看作节点对之间路径的长度为n的路径的条数;节点i和节点j之间路径数量看作两节点之间路径可达性分数,但节点对之间的短路径相较于长路径对于衡量节点对之间的可达性更具影响力,因此将每条较短长度的路径赋予较大的权重,将较长的路径赋予较小的权重;

24、长度为t的路径数量与长度为t路径的权重相乘就得到长度t的路径对于节点对间可达权重,计算所有长度路径的可达权重的总和,作为衡量节点对间的可达权重;

25、步骤6:输入加权邻接矩阵a′,通过neumann级数降低时间复杂度为o(n3),得到可达权重矩阵s∈rn×n,公式如下:

26、s=βa′+β2a′2+β3a′3+...=(i-βa′)-1-i,

27、其中,β为权重,其取值范围在λmax为加权邻接矩阵a′的最大特征值;这里保证了β<1,则β>β2>…;i表示单位矩阵,si中包含了节点i的所有可达节点的可达权重;若节点i与节点k不可达,则可达权重为sik为0;

28、步骤7:将节点的贡献分数对角矩阵xstruct乘以可达权重矩阵s聚合为节点结构表示矩阵z∈rn×n,zi为节点i的结构表示,zik为可达节点k对节点i的贡献度,节点结构表示矩阵公式如下:

29、z=gφ(sxstruct),

30、其中,gφ为一个mlp;

31、进一步地,所述属性信息的提取中,对网络中的属性信息进行学习;给定的属性图g,以及节点的初始属性表示集合矩阵x,输入到多层图神经网络gnn模型,在每层gnn中通过迭代聚合邻居节点转换后的表示来学习有意义的节点表示;选择使用图卷积神经网络gcn来学习节点属性信息。

32、gcn卷基层在第l层以邻接矩阵a和节点表示矩阵h(l)作为输入,同时使用可训练的权重矩阵,更新节点表示,得到第l层的输出h(l+1),并作为下一层的输入,gcn卷积的总体公式如下:

33、h(l+1)=gconv(a,h(l),w(l)),

34、其中,w(l)为可学习的权重矩阵、gconv为gcn卷积函数;

35、具体包括以下步骤:

36、步骤8:对于第一层,h(0)的输入为原始的属性表示x,并对w(l)权重矩阵进行随机初始化;

37、步骤9:获取归一化邻接矩阵不同gnn以不同方式归一化的邻接矩阵,gcn卷积层的归一化的邻接矩阵公式如下:

38、

39、其中,为加自环的邻接矩阵,为度矩阵,其中表示节点i与节点j之间是否存在连边,存在则为1,不存在则为0;

40、步骤10:将a替换为在最外层使用relu激活函数,获得当前层节点属性表示h(l+1),公式如下:

41、

42、其中σ为非线性激活函数relu。

43、使用的gcn层数为3,所以循环执行3次步骤11,得到最终的节点属性表示h;

44、进一步地,所述链路预测打分过程中,对于待预测链路的节点对,通过链路预测函数对两节点的表示进行打分,包括为结构表示打分与为属性表示打分。具体方法为:

45、步骤11:结构表示链路预测分数计算:

46、计算节点i和节点j结构表示的hadamard积,那么只有公共可达的节点才能计算出分数,公式如下:

47、

48、其中,p(·)表示节点的所有可达节点,sik为节点k对节点i的可达权重;

49、步骤12:计算属性表示链路预测的得分,对于待预测链路的节点对,先计算两节点表示的乘积,然后输入到mlp预测最终得分。

50、进一步地,所述融合,对于待预测链路的节点对,通过可学习的参数α对属性相似度与结构相似度加权组合,作为最终预测结果,公式如下:

51、

52、其中,表示预测值,hi表示节点i的属性表示,s(·)为mlp,来计算属性表示的节点对的得分。

53、进一步地,所述模型训练与参数更新,使用二元交叉熵函数计算损失,来拟合预测值和真实值,反向传播更新模型的参数;

54、其中分别对属性得分、结构得分以及属性结构融合的得分计算二元交叉熵,并分配不同权重联合训练模型;损失公式如下:

55、

56、其中,l为损失,wi为权重,bce(·)为二元交叉熵函数,d表示训练数据集,yij表示真实值。

57、采用上述技术方案所产生的有益效果在于:本发明提供的基于全局路径感知图神经网络模型的链路预测方法,提出了一种全局路径感知图神经网络(apoa-gnns),该模型融合网络的属性信息和结构信息,解决了浅层embedding学习无法结合节点自身的属性的问题。本发明结合了属性信息和结构信息,解决了gnn仅仅依赖于平滑的节点特征,忽略图的结构特征问题,同时解决了浅层embedding学习无法结合节点自身的属性的问题。使用欧氏距离度量连边节点间的相似度,很好的将潜在属性信息融合到结构信息提取中。使用结构表示生成器为节点进行结构初始化,解决了启发式方法的局限性。使用了基于路径感知的聚合方案,对短的路径赋予较大权重,对长的路径赋予较小的权重,改善了链路预测任务存在的简并现象,灵活计算节点对之间所有路径信息的得分。在属性网络如cora、citeseer、texas、wisconsin等开放数据集上的大量实验表明,本发明的apoa-gnns在链路预测方面整体上达到最先进的性能。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1