一种基于多视图集成模型的可信知识图谱实体分类方法

文档序号:34010530发布日期:2023-04-29 22:17阅读:37来源:国知局
一种基于多视图集成模型的可信知识图谱实体分类方法

本发明提出一种基于多视图集成模型的可信知识图谱网络实体分类方法,主要针对知识图谱实体分类模型的对抗防御,提高知识图谱实体分类模型在对抗攻击下的鲁棒性,实现对知识图谱实体准确分类。


背景技术:

1、通过观察从各行各业复杂系统产生的数据资源,可以发现数据内容或者数据之间往往存在关联关系,挖掘和利用这些关联关系可以理解群体的行为模式、增强智能服务能力。大量的研究实践表明,图(或网络)是建模这些不同来源、不同性质数据的强大工具,它可以通过实体集合以及它们之间的关联关系非常自然地对各种数据资源进行抽象表示,从而形成了大量的图数据资源。

2、其中,在各类图数据中,知识图谱成为研究者们关注的热点。在知识图谱领域里,又包括:命名实体识别,关系抽取,三元组构建等步骤。命名实体识别作为很多下游任务中的关键前置步骤,已被广泛应用于机器翻译、问题回答、知识图谱构建等场景。然而,就同其他神经网络模型一样,实体分类模型也会遭受到攻击。由于图的离散性,连接性等特征,给图的数据安全带来了更多的挑战。

3、在开放、对抗的应用环境中,攻击者可能在知识图谱智能系统的数据输入、预处理、模型学习、数据输出等环节对模型进行恶意攻击,从而盗取训练数据、模型参数,降低系统性能甚至导致产生错误结果。尤其是在知识图谱中的相关实体分类模型而言,这些分类模型中存在大量的敏感数据,这些敏感数据与用户的隐私密切相关,涉及到用户的隐私安全,而当前开放环境下图神经网络知识图谱实体分类模型算法普遍面临着安全风险。比如,在知识图谱模型中,攻击者有可能通过恶意添加实体或链接从而使知识图谱模型识别错误。另外,在知识问答系统中,攻击者有可能根据模型输出来推断出用户身份。因此,在知识图谱中,如何防御针对图神经网络模型的对抗攻击,提高图神经网络模型的鲁棒性,实现对知识图谱中实体的正确分类是至关重要的。


技术实现思路

1、基于以上方法的思想和存在的问题,结合所存在方法的优缺点,本发明提出一种基于多视图集成模型的可信知识图谱实体分类方法,利用该方法能够充分地挖掘知识图谱实体网络中的实体信息,提高图神经知识图谱实体识别模型在对抗攻击下的鲁棒性,提升知识图谱实体数据的分类准确性。

2、本发明一种基于多视图集成模型的可信知识图谱实体分类方法,所述方法包括以下步骤:

3、获取知识图谱实体网络中的知识图谱实体数据,并生成所述知识图谱实体数据的原始视图;所述知识图谱实体数据包括知识图谱实体属性信息和知识图谱实体关联信息;

4、根据知识图谱实体属性信息计算出知识图谱实体邻接矩阵,根据知识图谱实体关联关系计算出知识图谱实体特征矩阵;

5、对所述知识图谱实体邻接矩阵构造出结构视图,对所述知识图谱实体特征矩阵构造出特征视图;

6、将所述结构视图和所述原始视图输入到结构基模型中,输出第一特征;将所述特征视图与所述原始视图输入到特征基模型中,输出第二特征;

7、将所述第一特征和所述第二特征输入到线性层中,集成输出知识图谱实体数据的类别。

8、本发明具有以下优势:

9、(1)本发明结合多种方法的模型对知识图谱实体引文数据分析,在对抗攻击情景下,知识图谱实体数据的分类识别率更高,因为本方法利用集成模型同时结合知识图谱实体的结构视图与知识图谱实体的特征视图的信息来对知识图谱引文实体进行分类,可以更加充分地挖掘知识图谱实体引文数据的隐藏信息,提高鲁棒性。

10、(2)本发明结合两种方法的模型对知识图谱实体引文数据分析,能够适用于没有特征矩阵的知识图谱实体引文数据中,由于本模型使用了结构相似度评分进行结构信息的提取,而结构相似度评分不依赖于知识图谱实体特征矩阵,在仅有知识图谱实体邻接矩阵时,仍然可以对知识图谱实体数据的高阶领域信息进行提取,能够解决在知识图谱实体特征矩阵缺失下无法使用的问题。



技术特征:

1.一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,所述知识图谱实体属性信息包括知识图谱实体身份信息、标签、知识图谱包含的单词包集合;所述知识图谱关联信息包括实体关联关系。

3.根据权利要求1所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,对所述知识图谱邻接矩阵构造出结构视图包括计算出各个知识图谱实体之间的相似度评分;根据各个知识图谱实体之间的相似度评分,确定出与当前知识图谱实体最相近的k个邻居知识图谱实体,并构造出k最邻近结构图,其中,知识图谱实体节点之间的相似度评分的计算公式表示为:

4.根据权利要求1所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,对所述知识图谱实体特征矩阵构造出特征视图包括计算出各个知识图谱实体特征向量之间的余弦相似度;根据各个知识图谱实体特征向量之间的余弦相似度,确定出与当前知识图谱实体特征向量最相近的k个邻居知识图谱实体特征向量,并构造出k最邻近结构图,其中,知识图谱实体特征向量之间的余弦相似度的计算公式表示为:

5.根据权利要求1所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,所述结构基模型利用原始视图与结构视图作为输入,利用mlp来自适应地结合原始视图与结构视图的信息,经过两层图卷积神经网络生成输出第一特征;所述特征基模型利用原始视图与特征视图作为输入,利用mlp来自适应地结合原始视图与特征视图的信息,经过两层图卷积神经网络生成输出第二特征。

6.根据权利要求1或5所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,所述结构基模型包括采用两层mlp层来学习原始视图与结构视图之间的评分系数;结合所述知识图谱实体邻接矩阵计算得到原始视图与结构视图之间的结合系数;利用线性层学习每个知识图谱实体节点加入自环的比重;利用两层gcn网络对知识图谱实体信息进行编码嵌入,对所述结合系数与所述每个知识图谱实体节点加入自环的比重进行处理,计算得到第一特征。

7.根据权利要求1或5所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,所述特征基模型包括采用两层mlp层来学习原始视图与特征视图之间的评分系数;结合所述知识图谱实体特征矩阵计算得到原始视图与特征视图之间的结合系数;利用线性层学习每个知识图谱实体节点加入自环的比重;利用两层gcn网络对知识图谱实体节点信息进行编码嵌入,对所述结合系数与所述每个知识图谱实体节点加入自环的比重进行处理,计算得到第二特征。

8.根据权利要求1所述的一种基于多视图集成模型的可信知识图谱实体分类方法,其特征在于,所述集成输出知识图谱实体数据的类别包括利用线性层来自适应地结合结构基模型输出的第一特征和特征基模型的输出的第二特征;具体包括为每个知识图谱实体节点定义一个注意力系数来自适应集成,利用知识图谱实体节点的结合系数与其对应的特征进行自适应加权,计算得到最终输出特征,并根据所述最终输出特征确定出知识图谱实体数据的类别。


技术总结
本发明提出一种基于多视图集成模型的可信知识图谱实体分类方法,所述方法包括获取知识图谱网络中的邻接矩阵和实体特征数据,生成知识图谱数据的原始视图;根据知识图谱关联信息计算出知识图谱实体邻接矩阵,根据知识图谱实体属性关系计算知识图谱实体特征矩阵;对知识图谱邻接矩阵构造出结构视图,对知识图谱实体特征矩阵构造出特征视图;将结构视图和原始视图输入到结构基模型中输出第一特征;将特征视图与原始视图输入到特征基模型中输出第二特征;将第一特征和第二特征输入到线性层中,集成输出知识图谱实体数据的类别。本方法利用集成模型结合结构视图与特征视图来对知识图谱实体进行分类,可充分地挖掘知识图谱数据的隐藏信息,提高鲁棒性。

技术研发人员:肖敏,骆俊辉,吴涛,先兴平,蒲晓,袁霖,姜丰,游小琳,张浩然
受保护的技术使用者:重庆邮电大学
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1