一种基于超复数空间对偶四元数的知识图谱嵌入方法

文档序号:34642340发布日期:2023-06-29 17:12阅读:51来源:国知局
一种基于超复数空间对偶四元数的知识图谱嵌入方法

本发明属于知识图谱嵌入表示领域,尤其涉及一种基于超复数空间对偶四元数的知识图谱嵌入方法。


背景技术:

1、知识图谱技术是以结构化的方式来表述客观世界中所存在的实体及其之间的关系,在推动人工智能学科发展和智能信息服务应用(如智能搜索、智能问答、个性化推荐等)中扮演着重要角色。它提供了一种很好的组织、管理、理解互联网海量信息的能力,将互联网中的信息表示成更易于理解的形式。目前已经出现许多大规模知识图谱,其中典型的有yago、dbpedia、wordnet、freebase等,国内外互联网公司也推出知识图谱产品,如谷歌知识图谱、微软bingsatori、百度知心以及搜狗知立方等。如今知识图谱广泛应用在知识问答、智能搜索、推荐系统和机器翻译等相关领域。

2、由于客观世界中实体关系的复杂多样性,导致大多知识图谱不能囊括所有实体及其连带关系,都存在着稀疏、不完整的问题,为了将知识图谱补充完整,知识图谱补全技术应运而生。知识图谱补全的目的是预测出缺失三元组所缺失的部分,从而使得知识图谱变得更加完整。

3、知识表示学习作为一种知识图谱补全技术方法,主要是通过在知识图谱上学习指代实体和关系的向量表示。具体来讲,对于知识图谱中的三元组(头实体,关系,尾实体),用一个n维的向量h来表示头实体,用一个同维度的向量t来表示尾实体,实体间的关系则用一个转换向量r或转换矩阵mr来表示。目前已有许多知识图谱嵌入模型应用在知识图谱补全任务中,但是,这些知识图谱表示学习模型大多是嵌入在标准平面空间或者标准复数空间内,由于空间的局限性,限制了旋转和平移操作的能力,进而限制了实体和关系的表示能力,无法很好的学习到实体和关系之间的潜在语义,因此导致对于复杂关系的建模能力不足。

4、对于在标准复数空间内无法获取到实体和关系的更多潜在的相互依赖关系,引入超复数空间中的对偶四元数来进行嵌入表示。对偶四元数是实部和虚部都是四元数的对偶数,四元数则由一个实分量和三个虚分量组成。对偶四元数能够有效的将三维空间中的旋转和平移整合到一个统一的框架中,对复杂关系模式做出了更好的表示。


技术实现思路

1、为了解决上述技术问题,本发明提供了一种基于超复数空间对偶四元数的知识图谱嵌入方法,用一个纯四元数向量表示实体,用单位对偶四元数向量表示关系,将关系建模为三维空间中对头实体的双向旋转,有效的挖掘到头实体和关系、头实体和尾实体之间的更多联系,丰富实体和关系之间的语义信息。具体来说,头尾实体和关系的嵌入向量分别用纯四元数和对偶四元数来表示,将得分函数定义为在超复数空间内用关系对头实体做正向旋转和逆向旋转,再计算出旋转后的头实体与尾实体之间的距离,最后取正向旋转和逆向旋转的平均数。

2、本发明解决其技术问题的方案是:

3、一种基于超复数空间对偶四元数的知识图谱嵌入方法,包括以下步骤:

4、步骤s1:定义知识图谱和对偶四元数的基础表示形式;

5、步骤s2:加载数据集得到可用的三元组数据,对基于超复数空间对偶四元数的知识图谱嵌入模型进行训练和调参;

6、步骤s3:用训练好的知识图谱嵌入模型对待测三元组进行预测,并计算预测结果。

7、优选的,对于知识图谱中的三元组(h,r,t),将其投影至超复数空间内,头实体h和尾实体t用纯四元数来进行向量嵌入,关系r用对偶四元数进行向量嵌入。

8、优选的,所述对偶四元数是对偶数和四元数在多维空间内的结合,定义为:δ=

9、p+∈q,其中p和q皆为四元数,∈是对偶单位。

10、优选的,步骤s2具体包括:从知识图谱中加载数据得到可用的数据集;定义知识图谱嵌入模型的得分函数;生成负样本并构建损失函数。

11、优选的,所述得到函数fr(h,t)具体如下:

12、

13、上式中,头尾实体h,t用纯四元数向量初始化,关系r用单位对偶四元数向量初始化,表示对偶四元数乘法,∈满足∈2=0。

14、优选的,所述负样本生成过程具体为:随机替换掉一个正确三元组中的头实体或者尾实体得到负样本。

15、优选的,所述损失函数表达式为:

16、

17、上式中,γ为超参数,fr(h,t)表示正样本得分,fr(h′i,t′i)表示负样本得分。

18、优选的,对嵌入模型进行训练和调参这一步骤,具体还包括:将训练集中的三元组表示为对偶四元数的形式投影到超复数空间内,利用打分函数进行预测,利用损失函数进行调参。

19、优选的,步骤s3具体步骤包括:将测试集中的待预测三元组输入至知识图谱嵌入模型,用得分函数计算出得分,预测其真实性。

20、本发明的有益效果:本发明利用纯四元数和对偶四元数对实体和关系进行编码,将关系建模为三维空间的双向旋转和平移的结合,计算增强对实体和关系的表示能力,更多的学习到它们之间的潜在语义联系。



技术特征:

1.一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,对于知识图谱中的三元组(h,r,t),将其投影至超复数空间内,头实体h和尾实体t用纯四元数来进行向量嵌入,关系r用对偶四元数进行向量嵌入。

3.根据权利要求2所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,所述对偶四元数是对偶数和四元数在多维空间内的结合,定义为:δ=p+∈q;其中p和q皆为四元数,∈是对偶单位。

4.根据权利要求1所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,步骤s2具体包括:从知识图谱中加载数据得到可用的数据集;定义知识图谱嵌入模型的得分函数;生成负样本并构建损失函数。

5.根据权利要求4所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,所述得到函数fr(h,t)具体如下:

6.根据权利要求5所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,所述负样本生成过程具体为:随机替换掉一个正确三元组中的头实体或者尾实体得到负样本。

7.根据权利要求5所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,所述损失函数表达式为:

8.根据权利要求7所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,对嵌入模型进行训练和调参这一步骤,具体还包括:将训练集中的三元组表示为对偶四元数的形式投影到超复数空间内,利用打分函数进行预测,利用损失函数进行调参。

9.根据权利要求8所述一种基于超复数空间对偶四元数的知识图谱嵌入方法,其特征在于,步骤s3具体步骤包括:将测试集中的待预测三元组输入至知识图谱嵌入模型,用得分函数计算出得分,预测其真实性。


技术总结
本发明公开了一种基于超复数空间对偶四元数的知识图谱嵌入方法。本发明用一个纯四元数向量表示实体,用单位对偶四元数向量表示关系,将关系建模为三维空间中对头实体的双向旋转。具体来说,头尾实体和关系的嵌入向量分别用纯四元数和对偶四元数来表示,将得分函数定义为在超复数空间内用关系对头实体做正向旋转和逆向旋转,再计算出旋转后的头实体与尾实体之间的距离,最后取正向旋转和逆向旋转的平均数。本发明利用纯四元数和对偶四元数对实体和关系进行编码,将关系建模为三维空间的双向旋转和平移的结合,增强对实体和关系的表示能力,能更多地学习到它们之间的潜在语义联系。

技术研发人员:杨柏林,冯艳,蒲飞
受保护的技术使用者:浙江工商大学
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1