一种基于图卷积网络的符号网络符号的预测方法与流程

文档序号:21975285发布日期:2020-08-25 19:07阅读:503来源:国知局
一种基于图卷积网络的符号网络符号的预测方法与流程

本发明属于复杂网络领域,尤其涉及一种基于图卷积网络的符号网络。



背景技术:

真实世界中的各种关系都可以在一定程度上抽象为复杂网络,包括人与人的关系、人与物的关系以及物与物之间的关系,通过将这些相互之间的关系进行整合可以形成包含多个个体、多种关系的异质信息网络。真实世界中的个体称为网络中的节点,真实世界中个体之间的关系抽象为网络中的边。其中人与人的关系中包含了亲善,喜爱等正向关系,同时也包含了厌恶等负向关系,将这些关系抽象成网络中的边,网络中便会包含两种结构关系,包含这种正向关系和负向关系的网络被称为符号网络,符号网络是一种特殊的异质信息网络。因此,在推荐系统中,识别人与人之间的关系类型,是一项重要的任务。

随着卷积神经网络在图像处理上的广泛运用,将卷积神经网络运用到图处理方向上成为了一种新的研究思路,通过图傅里叶变换,能够将信号从时域空间转换到频域空间,而频域空间视角能够有助于信号的处理,因此图中的卷积操作有了理论依据,通过设计图滤波器,便可以生成图卷积层,进而生成图卷积网络模型。

评估符号网络之间的边得符号预测有多种方式,本质上是基于符号网络的正负边关系来进行预测学习分析,符号网络的主要性质有结构平衡理论,相似理论和节点状态理论,每一个理论都是基于节点的正负边的关系来进行分析学习的,通过理论,得到节点的正边和负边的倾向关系,例如结构平衡理论,通过分析三元组节点之间的平衡关系,来识别边的符号倾向性。



技术实现要素:

针对上述现有技术,本发明提出一种基于图卷积网络(gcn,graphconvolutionalnetwork)的符号网络符号预测方法,主要是基于gcn符号网络中节点与节点之间的边的正负关系对网络中节点的符号倾向性进行预测,根据图卷积网络的灵活运用,来输出节点的正倾向性和负倾向性的向量表示,通过预测节点的正倾向性的概率和负倾向性的概率,拼接后向量表示后取概率最大的结果,从而来预测节点与节点之间的倾向性。本发明方法不论是理论创新方面还是实验效果方面都有很大的突破。

为了解决上述技术问题,本发明提出的一种基于图卷积网络的符号网络符号的预测方法,步骤如下:

步骤一、基于图神经网络中的图卷积网络模型,结合符号网络中自身的边只分成正边和负边的两种情形,将符号网络分成两个子网络,其中一个子网络是只包含正边的正边子网络,另一个子网络是只包含负边的负边子网路,对正边子网络和负边子网络分别进行预处理,得到两个子网络的邻接矩阵和特征矩阵;

步骤二、使用构建的两层图卷积网络模型训练两个子网络的邻接矩阵和特征矩阵,得到正边子网络表示和负边子网络表示,将正边子网络表示和负边子网络表示进行拼接得到符号网络的节点表示;

步骤三、进行符号网络的符号预测,选用wiki-vote测试数据集,将该测试数据集在所述两层图卷积网络模型中进行测试,得到基于所述两层图卷积网络模型生成的节点表示,利用所生成的节点表示评估该测试数据集的边的符号倾向性,其中,在得到节点表示后,使用逻辑回归模型得到边的概率,该边的概率包括边的正向概率和边的负向概率,通过比较边的正向概率和边的负向概率的大小,从而判断该边的符号倾向性。

进一步讲,步骤一中,对正边子网络和负边子网络分别进行预处理,得到两个子网络的邻接矩阵和特征矩阵的具体过程如下:

获得符号网络用例数据,所述用例数据是wiki-vote数据集,该数据集的数据结构是:名称为wiki-vote,节点数为7118,边的数量为103747,正向边占比为78.8%,负向边占比为21.2%;读取数据集wiki-vote数据,将节点的正边和负边分离开,即将节点的边进行迭代判定,其中,所有的正边形成一个集合,所有的负边形成一个集合,基于两个边的集合,结合原数据中的节点,构建只包含正边的正边子网络的邻接矩阵和只包含负边的负边子网络的邻接矩阵;由于,数据集wiki-vote中默认的数据权重为1,因此,正边子网络的邻接矩阵和负边子网络的邻接矩阵是基于节点的度分布,根据节点的出度入度相关属性,构建并得到正边子网络的特征矩阵和负边子网络的特征矩阵。

步骤二中,构建两层图卷积网络模型,包括以下步骤:

使用下述图卷积网络的迭代公式:

式(1)中,σ代表非线性变换;h表示特征表示结果;l表示设计的图神经网络层数;w表示权重,w=1;c表示归一化因子;

将特征矩阵和邻接矩阵代入上述迭代公式中,并替代其中的特征表示结果,得到:

hl+1=σ(ahlwl)(2)

式(2)中,h表示特征矩阵,a表示邻接矩阵,w代表权重矩阵,由于输入的特征矩阵h与邻接矩阵a是带有符号倾向性,用a+和h+分别表示正边子网络的邻接矩阵和正边子网络的特征矩阵,同时,用a-和h-分别表示负边子网络的邻接矩阵和负边子网络的特征矩阵;因此,计算的结果分别表示正边子网络的特征矩阵和负边子网络的特征矩阵,将其拼接,得到最终结果是:

根据构建的两层图卷积网络模型得到原符号网络的网络表示。

本发明所述的基于图卷积网络的符号网络符号的预测方法,其中,从数据库获取用户相关数据,包含表的筛选和表中字段的筛选;数据预处理和清洗;从数据中抽象出实体和关系,以此构建符号网络。

与现有技术相比,本发明的有益效果是:

传统的符号网络符号预测方法以及图卷积网络应用方法都比较多,但是综合两者的方法,基于图卷积网络的符号网络符号预测计算方法还有很多价值并未被发掘。本发明方法主要是有以下几个有益效果:

首先,本发明方法将理论上的符号网络符号预测方法与实际应用领域的图卷积网络结合起来,理论实践相互结合,能在实践中体现理论研究的价值。

其次,本发明方法不同于大部分机器学习方法,无需对数据提前打标签,能更好地与实际生产中的数据环境相融合。

最后,本发明方法有很好的扩展性,可以在图卷积网络中添加全连接层与其他模型(诸如:transe模型,图注意力机制等),提升符号网络符号预测效果。

附图说明

图1是本发明方法的流程框图;

图2是设计的图卷积网络模型示例;

图3是结果分析示例。

具体实施方式

下面结合附图及具体实施例对本发明做进一步的说明,但下述实施例绝非对本发明有任何限制。

本发明的设计思路是,基于图神经网络中的图卷积网络(gcngraphconvolutionalnetwork)模型,结合符号网络中自身的边只分成正边和负边的两种情况,将符号网络分成两个子网络,第一个子网络只包含正边,第二个子网络只包含负边,对这两个子网络分别进行预处理,可以得到两个子网络的邻接矩阵和特征矩阵。使用设计的图卷积网络模型训练两个子网络的邻接矩阵和特征矩阵,可以得到包含正向边的网络表示和包含负向边的网络表示,将网络表示进行拼接可以得到原符号网络的节点表示。在符号网络的符号预测测试实验中,输入测试集后,能够基于符号网络的节点表示得到的网络表示中能够分别得到边的正向概率和边的负向概率,通过比较正向概率与负向概率的大小,因而判断边的符号倾向性,如果负向概率比正向概率高,则边的符号更倾向负向,反之,则更倾向于正向。

如图1所示,本发明提出的一种基于图卷积网络的符号网络符号的预测方法,其中,符号网络构建是:从数据库获取用户相关数据,包含表的筛选和表中字段的筛选;数据预处理和清洗;从数据中抽象出实体和关系,以此构建符号网络。

基于图卷积网络的符号网络符号的预测方法,包括以下步骤:

步骤一、基于图神经网络中的图卷积网络模型,结合符号网络中自身的边只分成正边和负边的两种情形,将符号网络分成两个子网络,其中一个子网络是只包含正边的正边子网络,另一个子网络是只包含负边的负边子网路,对正边子网络和负边子网络分别进行预处理,得到两个子网络的邻接矩阵和特征矩阵。

步骤二、使用构建的两层图卷积网络模型训练两个子网络的邻接矩阵和特征矩阵,得到正边子网络表示和负边子网络表示,将正边子网络表示和负边子网络表示进行拼接得到符号网络的节点表示。

步骤三、进行符号网络的符号预测,选用wiki-vote测试数据集,将该测试数据集在所述两层图卷积网络模型中进行测试,得到基于所述两层图卷积网络模型生成的节点表示,利用所生成的节点表示评估该测试数据集的边的符号倾向性,其中,在得到节点表示后,使用逻辑回归模型得到边的概率,该边的概率包括边的正向概率和边的负向概率,通过比较边的正向概率和边的负向概率的大小,从而判断该边的符号倾向性。

本发明方法的步骤一中,对正边子网络和负边子网络分别进行预处理,得到两个子网络的邻接矩阵和特征矩阵的具体过程如下:

获得符号网络用例数据,所述用例数据是wiki-vote数据集,该数据集的数据结构是:名称为wiki-vote,节点数为7118,边的数量为103747,正向边占比为78.8%,负向边占比为21.2%;

读取数据集wiki-vote数据,通过数据处理,将节点的正边和负边分离开,即将节点的边进行迭代判定,其中,所有的正边形成一个集合,所有的负边形成一个集合,基于两个边的集合,结合原数据中的节点,构建只包含正边的正边子网络的邻接矩阵和只包含负边的负边子网络的邻接矩阵;

由于,数据集wiki-vote中默认的数据权重为1,因此,正边子网络的邻接矩阵和负边子网络的邻接矩阵是基于节点的度分布,根据节点的出度入度相关属性,构建并得到正边子网络的特征矩阵和负边子网络的特征矩阵。

本发明步骤二中,构建两层图卷积网络模型,如图2所示,包括以下步骤:

使用下述图卷积网络的迭代公式:

式(1)中,σ代表非线性变换;h表示特征表示结果;l表示设计的图神经网络层数;w表示权重,w=1;c表示归一化因子;

将特征矩阵和邻接矩阵代入上述迭代公式中,并替代其中的特征表示结果,得到:

hl+1=σ(ahlwl)(2)

式(2)中,h表示特征矩阵,a表示邻接矩阵,w代表权重矩阵,由于输入的特征矩阵h与邻接矩阵a是带有符号倾向性,用a+和h+分别表示正边子网络的邻接矩阵和正边子网络的特征矩阵,同时,用a-和h-分别表示负边子网络的邻接矩阵和负边子网络的特征矩阵;因此,计算的结果分别表示正边子网络的特征矩阵和负边子网络的特征矩阵,将其拼接,得到最终结果是:

根据构建的两层图卷积网络模型得到符号网络的网络表示。

步骤三中,进行符号网络的符号预测,在测试数据实验中,使用wiki-vote测试数据进行本发明中的步骤一,得到预处理数据;

输入到训练后的两层gcn模型中,在得到表示后,使用逻辑回归模型预测边的概率,进行链路预测,具体做法如下:使用逻辑回归模型进行测试,通过比较边的正向概率和边的负向概率的大小,从而判断该边的符号倾向性。同时使用评价函数进行数据验证,使用的评价函数是f1,得到的结果如图3所示:其中f1为常用的评价函数,f1-micro为微平均值,f1-macro为宏平均值。

尽管上面结合附图对本发明进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨的情况下,还可以做出很多变形,这些均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1