一种基于知识图谱推理的预测方法和系统与流程

文档序号:27315320发布日期:2021-11-09 23:45阅读:335来源:国知局
一种基于知识图谱推理的预测方法和系统与流程

1.本技术涉及人工智能领域中的知识图谱嵌入技术,更具体地讲,涉及一 种基于知识图谱推理的预测方法和系统。


背景技术:

2.随着信息网络技术的快速发展,各种信息网络数据内容呈现爆炸式增长 的态势。这样的内容通常具有大规模、异质多元、组织结构松散的特点,给 人们有效获取信息和知识提出了挑战。知识图谱(kg,knowledge graph)是语 义网络的知识库,能够用可视化技术描述知识资源及其载体,并挖掘、分析、 构建、绘制和显示知识及它们之间的相互联系。
3.知识图谱作为一种特殊的图形结构,包括实体(entity)和关系(relation), 实体作为结点,关系作为有向边。在知识图谱中,每个边可被表示为具有(头 部实体,关系,尾部实体)这一形式的三元组(h,r,t),以指示两个实体h (即,头部实体)和t(即,尾部实体)通过关系r连接,例如(newyork, islocatedin,usa)可表示newyork位于usa。
4.知识图谱推理(kgr,knowledge graph reasoning)旨在利用图中已有 信息从现有事实(facts)推导未知的事实。对于一个预测事实,通常需利用 其包含的结点和关系周围的语义或结构信息进行推理。图谱中的推理任务可 分为两种,转换推理(transductive reasoning),即在已有结点范围内进行事实 推理,和归纳推理(inductive reasoning),即在训练阶段未知的结点上进行事 实推理。
5.现有技术通常采用基于关系路径的方法来进行推理,然而,路径在捕获 知识图谱中的复杂拓扑方面受到限制。此外,现有技术的知识图谱嵌入模型 通常只利用了语义信息,且对每个结点需要单独学习一个嵌入(embedding), 对于预测阶段的新结点,由于训练阶段没有学习到对应的嵌入,无法进行这 类场景下的归纳推导,同时无法对推理结构进行解释。此外,尽管有研究表 明可以利用基于关系的规则进行归纳推导(由于规则不受具体结点所限,所 以可以拓展到不同结点的预测),但由于没有利用图结构信息,丢失了原图的 重要性质,在转换推理任务上表现一般。因此,需要一种能够充分保留知识 图谱的结构信息的高效的基于知识图谱推理的预测方法。


技术实现要素:

6.根据本发明的实施例,提供了一种基于知识图谱推理的预测方法,所述 方法包括:对知识图谱进行增广以获得增广知识图谱,其中,所述知识图谱 包括结点和边,所述结点指示实体,所述边指示该边所连接的结点之间的关 系并且为有向边,所述知识图谱中长度未超过l的关系路径在所述增广知识 图谱中被增广到长度l;基于所述增广知识图谱,获取关于查询的关系有向 图的表达,其中,所述查询包括查询实体、查询关系和应答实体,所述关于 查询的关系有向图包括针对不同候选应答实体的候选关系有向图;基于所述 关系有向图的表达建立针对所述知识图谱的图网络模型的损失函数;基于所 述损失函数对所述知识图谱的图网络模型进行训练;利用训练完成的图网络 模型来预测所述查询中的应
答实体;其中,所述候选关系有向图为l层的有 向图,查询实体被设置为位于所述候选关系有向图中的第0层的源结点,对 应候选应答实体被设置为位于所述候选关系有向图中的第l层的汇聚点,所 述候选关系有向图中的所有边的方向沿从源结点指向汇聚点的方向,并且从 源结点到汇聚点的任意一条路径对应于增广知识图谱上从查询实体到对应候 选应答实体的一条长度为l的关系路径,其中,l是正整数。
7.可选地,对知识图谱进行增广的步骤可包括:对所述知识图谱中的每个 结点添加一个指向自身的关系,并对所述知识图谱中的每一条边添加一个对 应的呈现相反关系的边,使得所述知识图谱中的长度未超过长度l的关系路 径在所述增广知识图谱中被增广到长度l。
8.可选地,获取关于查询的关系有向图的表达的步骤可包括:通过将所述 增广知识图谱中的实体设置为所述查询的候选应答实体,获取针对所述查询 的至少一个候选三元组;基于所述增广知识图谱获取关于每个候选三元组的 候选关系有向图的表达。
9.可选地,获取关于每个候选三元组的候选关系有向图的表达的步骤可包 括:将候选三元组中的查询实体设置为候选关系有向图的源结点并将候选三 元组中的候选应答实体设置为候选关系有向图的汇聚点;基于所述增广知识 图谱,从第1层开始逐层提取源结点的1阶邻居结点到l阶邻居结点和对应 边,直到第l层为止;如果提取的第l层中的邻居结点不包括汇聚点,则将 关于候选三元组的候选关系有向图的表达设置为预设向量;如果提取的第l 层中的邻居结点包括汇聚点,则基于所提取的源结点的1阶邻居结点到l阶 邻居结点以及对应边,从第l层的汇聚点开始逐层提取候选关系有向图中的 各层的结点和边,直到第1层为止;基于所提取的候选关系有向图中的各层 的结点和边,建立候选三元组的候选关系有向图并通过图神经网络从候选关 系有向图的第1层到第l层逐层计算每层的结点的表达;将计算获得的第l 层的汇聚点的表达确定为关于候选三元组的候选关系有向图的最终表达。
10.可选地,获取关于查询的关系有向图的表达的步骤可包括:将所述查询 中的查询实体设置为关系有向图的源结点;基于所述增广知识图谱,从第1 层开始逐层提取源结点在每层的邻居结点及对应边,并基于所提取的每层的 邻居结点及对应边,通过图神经网络逐层计算每层的邻居结点的表达,直到 第l层为止;将第l层的邻居结点确定为所述查询的候选应答实体,并将计 算获得的第l层的邻居结点的表达分别确定为关于所述查询的针对对应候选 应答实体的候选关系有向图的表达;将针对所述增广知识图谱中除第l层的 结点以外的结点的关系有向图的表达设置为预设向量。
11.根据本发明的另一实施例,提供了一种基于知识图谱推理的预测系统, 所述系统包括:增广装置,被配置为对知识图谱进行增广以获得增广知识图 谱,其中,所述知识图谱包括结点和边,所述结点指示实体,所述边指示该 边所连接的结点之间的关系并且为有向边,所述知识图谱中长度未超过l的 关系路径在所述增广知识图谱中被增广到长度l;处理装置,被配置为基于 所述增广知识图谱,获取关于查询的关系有向图的表达,其中,所述查询包 括查询实体、查询关系和应答实体,并且所述关于查询的关系有向图包括针 对不同候选应答实体的候选关系有向图;训练装置,被配置为基于所述关系 有向图的表达建立针对所述知识图谱的图网络模型的损失函数,并基于所述 损失函数对所述知识图谱的图网络模型进行训练;预测装置,被配置为利用 训练完成的图网络模型来预测所述查询中的应
答实体,其中,所述候选关系 有向图为l层的有向图,查询实体被设置为位于所述候选关系有向图中的第 0层的源结点,对应候选应答实体被设置为位于所述候选关系有向图中的第l 层的汇聚点,所述候选关系有向图中的所有边的方向沿从源结点指向汇聚点 的方向,并且从源结点到汇聚点的任意一条路径对应于所述增广知识图谱上 从查询实体到对应候选应答实体的一条长度为l的关系路径,其中,l是正 整数。
12.可选地,增广装置可被配置为:对所述知识图谱中的每个结点添加一个 指向自身的关系,并对所述知识图谱中的每一条边添加一个对应的呈现相反 关系的边,使得所述知识图谱中的长度未超过长度l的关系路径在所述增广 知识图谱中被增广到长度l,从而获得所述增广知识图谱。
13.可选地,处理装置可被配置为通过以下操作获取关于查询的关系有向图 的表达:通过将所述增广知识图谱中的实体设置为所述查询的候选应答实体, 获取针对所述查询的至少一个候选三元组;基于所述增广知识图谱获取关于 每个候选三元组的候选关系有向图的表达。
14.可选地,处理装置可被配置为通过以下操作获取关于每个候选三元组的 候选关系有向图的表达:将候选三元组中的查询实体设置为候选关系有向图 的源结点并将候选三元组中的候选应答实体设置为候选关系有向图的汇聚点; 基于所述增广知识图谱,从第1层开始逐层提取源结点的1阶邻居结点到l 阶邻居结点和对应边,直到第l层为止;如果提取的第l层中的邻居结点不 包括汇聚点,则将关于候选三元组的候选关系有向图的表达设置为预设向量; 如果提取的第l层中的邻居结点包括汇聚点,则基于所提取的源结点的1阶 邻居结点到l阶邻居结点以及对应边,从第l层的汇聚点开始逐层提取候选 关系有向图中的各层的结点和边,直到第1层为止;基于所提取的候选关系 有向图中的各层的结点和边,建立候选三元组的候选关系有向图并通过图神 经网络从候选关系有向图的第1层到第l层逐层计算每层的结点的表达;将 计算获得的第l层的汇聚点的表达确定为关于候选三元组的候选关系有向图 的最终表达。
15.可选地,处理装置可被配置为通过以下操作获取关于查询的关系有向图 的表达:将所述查询中的查询实体设置为关系有向图的源结点;基于所述增 广知识图谱,从第1层开始逐层提取源结点在每层的邻居结点及对应边,并 基于所提取的每层的邻居结点及对应边,通过图神经网络逐层计算每层的邻 居结点的表达,直到第l层为止;将第l层的邻居结点确定为所述查询的候 选应答实体,并将计算获得的第l层的邻居结点的表达分别确定为关于所述 查询的针对对应候选应答实体的候选关系有向图的表达;将针对所述增广知 识图谱中除第l层的结点以外的结点的关系有向图的表达设置为预设向量。
16.根据本发明的另一实施例,提供了一种存储指令的计算机可读存储介质, 其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算装置 执行前述基于知识图谱推理的预测方法。
17.根据本发明的另一实施例,提供了一种包括至少一个计算装置和至少一 个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计算装置 运行时,促使所述至少一个计算装置执行前述基于知识图谱推理的预测方法。
18.有益效果
19.通过应用根据本发明的示例性实施例的基于知识图谱推理的预测方法和 系统,
entity),r
q
指查询关系(query relation),这两者为给定的已 知元素,查询中的“?”是缺失的应答实体(answer entity)。查询(e
q
,r
q
,?)的 推理任务是预测该查询中缺失的应答实体,即,(e
q
,r
q
,?)中应位于“?”处 的应答实体是增广知识图谱中的哪个实体。
32.在本发明的实施例中,由于作为推理目标的缺失应答实体可能是增广知 识图谱中的任意结点(即,增广知识图谱中的所有实体都有可能是应答实体), 因此,关于查询(e
q
,r
q
,?)的关系有向图可包括针对不同候选应答实体的一个 或更多个候选关系有向图,例如,将增广知识图谱中的结点设置为查 询(e
q
,r
q
,?)的候选应答实体之后所获得的候选三元组(e
q
,r
q
,e
a
)的对应候选 关系有向图。
33.在本发明的示例性实施例中,针对候选应答实体e
a
的候选关系有向图可 以是l层的有向图,查询实体e
q
可被设置为位于候选关系有向图中的第0层 的源结点,候选应答实体e
a
可被设置为位于候选关系有向图中的第l层的汇 聚点,候选关系有向图中的所有边的方向沿从源结点指向汇聚点的方向,并 且从源结点到汇聚点的任意一条路径对应于增广知识图谱上从查询实体e
q
到 候选应答实体e
a
的一条长度为l的关系路径。
34.图2是示出知识图谱的示例示图。图3是示出根据本发明的示例性实施 例的基于图2的知识图谱提取的示例关系有向图。
35.参照图2,以sam为查询实体,directed为查询关系为例进行解释。假设 候选应答实体为spider

2,则候选三元组可为(sam,directed,spider

2),此 外,假设关系有向图的层数l为3,则关于查询(sam,directed,?)的针 对spider

2的关系有向图可如图3中所示。
36.在图3的关系有向图中,每个参数的下标中的3指示关系 有向图的层数,每个参数或实体名称的右上角的标识为层数,并且不管右上 角的标识为多少,相同的实体名称指示知识图谱中的同一实体,例如,sam0、 sam1和sam2均指示图2中的实体sam。此外,虚线表示相反关系,相同的 实体名称之间的关系是指向自身的同一关系。
37.参照图3,是关系有向图中的第l 层的边的集合,是中的第l层的结点 的集合,l是正整数并且l=1...l。表示逐层连接运算,表示逐层连接运算,此外,在下文中,对于 给定的查询实体e
q
,使用和分别表示增广知识图谱中从e
q
开始行进l步 后可见的外出边(out

edge)的集合和实体的集合,即,e
q
的在第l层的l阶 邻居结点的集合和对应边(即,从l

1阶邻居结点指向l层的边)的集合。
38.为了利用关系有向图来推理事实(e
q
,r
q
,e
a
),在本发明的示例性实 施例中可获得关系有向图的表达(representation)。
39.换句话说,如上所述,处理装置120可通过将增广知识图谱中的各个实 体分别设置为查询的候选应答实体,获取针对查询的至少一个候选三元组, 然后,可基于增广知识图谱获取关于每个候选三元组的候选关系有向图的表 达。在本发明的示例性实施例中,可使用例如图神经网络gnn来学习关系有 向图的表达,以下将结合算法1对此进行详细解释。
40.算法1是关于单个关系有向图的编码算法,也即,算法1用于获得单个 关系有向图的向量表达。在算法1中假设使用候选应答实体
41.算法1(关于单个关系有向图的编码)
[0042][0043]
如算法1所示,可将候选三元组(e
q
,r
q
,e
a
)中的查询实体e
q
设置为对应候 选关系有向图的源结点并将候选三元组中的候选应答实体e
a
设置为对 应候选关系有向图的汇聚点进行计算。
[0044]
在步骤1,可进行初始化处理。例如,处理装置120可将源结点在第0 层的表达设置为预定向量(例如,零向量),即,此外,处理装置120可设置并设置
[0045]
之后,在步骤2至步骤4,处理装置120可基于增广知识图谱,从第1 层开始逐层提取源结点e
q
的1阶邻居结点到l阶邻居结点和对应边,直到第 l层为止。在上述算法1中,表示源结点e
q
的l阶邻居结点(即,第l层 的邻居结点)的集合,表示所述l阶邻居结点的对应边(即,从第l

1层 指向l层的外出边)的集合。
[0046]
然后,在步骤5,如果提取的第l层中的邻居结点集台中不包括汇聚 点e
a
(即,与之间的交集为0,这可指示候选关系有向图为 空),则处理装置120可将关于候选三元组(e
q
,r
q
,e
a
)的候选关系有向图的表达设置为预设向量,例如,
[0047]
而如果提取的第l层中的邻居结点集台中包括汇聚点e
a
,则在步骤6 至步骤8,处理装置120可基于所提取的源结点的1阶邻居结点到l阶邻居 结点以及对应边,反向从第l层的汇聚点开始逐层提取候选关系有向图 中的各层的结点和边,直到第1层为止。在上述算法1中,表 示候选关系有向图中第l层的结点的集合,表示候选关系有向图 中第l层中的边的集合。
[0048]
由此,在上述步骤8之后,基于所提取的候选关系有向图中的各层的结 点和边,处理装置120可建立针对候选三元组(e
q
,r
q
,e
a
)的候选关系有向图 (例如,如图3那样的关系有向图)。此时,在步骤9至步骤11,处理 装置120可通过图神经网络从该候选关系有向图的第1层到第l层逐 层计算每层的结点的表达。
[0049]
在算法1中,对于第l层中的结点其表达可表示为以下等式 (1):
[0050]
[等式1]
[0051][0052]
在等式1中,是第l

1层的结点e
s
的表达,是结点e
s
与结点 e之间的关系r在第l层的表达,是针对输入的结点关系对 (e
q
,r
q
)的消息函数,w
l
是第l层的权重矩阵。
[0053]
在步骤12,处理装置120可将计算获得的第l层的汇聚点e
a
的表达确定为关于候选三元组(e
q
,r
q
,e
a
)的候选关系有向图的最终 表达。
[0054]
如上利用算法1,可获得关于查询(e
q
,r
q
,?)的针对候选应答实体e
a
的关 系有向图的表达并且按照这种方式,可以以枚举的方式逐个获得 关于查询(e
q
,r
q
,?)的针对增广知识图谱中的其他实体的关系有向图的表达, 由此能够得到关于查询(e
q
,r
q
,?)的所有关系有向图的表达。
[0055]
然而,应该理解,算法1仅是获得关于查询(e
q
,r
q
,?)的关系有向图的表 达的方式之一,本技术不限于此,还可使用其他方式来获取关于查询(e
q
,r
q
,?) 的关系有向图的表达,以下将结合算法2对此进行详细解释。
[0056]
算法2是使用递归的方式一次性获得关于查询的所有关系有向图的表达 的方法。
[0057]
算法2(基于递归的关系有向图编码)
[0058][0059]
如算法2所示,算法2可将查询(e
q
,r
q
,?)中的查询实体设置为关系有向 图的源结点进行计算。
[0060]
在步骤1,可进行初始化处理。例如,处理装置120可将源结点在第0 层的表达设置为预定向量(例如,零向量),即,此外,处理装置120可设置
[0061]
之后,在步骤2至步骤5,处理装置120可基于增广知识图谱,从第1 层开始逐层提取源结点在每层的邻居结点及对应边,并基于所提取的每层的 邻居结点的集合及对应边的集台(步骤3),通过图神经网络逐层计算 每层的邻居结点的表达(步骤4),直到第l层为止。
[0062]
可选地,在上述步骤3,处理装置120可无需从增广知识图谱采集到所 有的边,而是可从所有边中均匀部分采样,从而提高效率。
[0063]
在算法2中,对于第l层中的结点其表达可表示为以下等式2:
[0064]
[等式2]
[0065][0066]
通过上述步骤2至步骤5的递归计算,处理装置120可获得通过步骤3 提取的各层的结点(即,属于的结点)的表达。此时,处理装置120可将 所提取的第l层中的结点(即,属于的结点)确定为针对查询(e
q
,r
q
,?)的 候选应答实体,并可将计算获得的第l层的结点的表达分别确定为关于查询 (e
q
,r
q
,?)的针对各对应候选应答实体的候选关系有向图的表达。
[0067]
在步骤6,处理装置120可将针对增广知识图谱中除第l层的结点以外 的结点(即,不属于的结点)的关系有向图的表达设置为预设向量,例如, 零向量。
[0068]
使用根据本发明的示例性实施例的算法2得到的表达与使用 算法1得到的表达相同,而算法2可以同时计算具有相同(e
q
,r
q
), 不同e
a
的预测事实,得
到从e
q
出发的所有关系有向图的表达,效率大大提高。
[0069]
图4示出基于图2的知识图谱使用算法2提取关系有向图的过程。如图 4中所示,使用算法2,由椭圆形框形成的关系有向图是并且 矩形框形成的关系有向图是也就是说,基于算法2,可同时得到 从sam出发的所有关系有向图,由此能够同时获得这些关系有向图的表达, 提高了运算效率。
[0070]
此外,在本发明的示例性实施例中,为学习关系有向图的查询依赖表达, 可使用将等式2进一步转换为以下等式3:
[0071]
[等式3]
[0072][0073]
其中,在等式3中,为了发现重要的边,在每层中可使用基于注意力的 机制,基于查询关系r
q
,计算关于每个边(e
s
,r,e
o
)的注意力权重如下:
[0074][0075]
这里,权重向量权重矩阵d是向量表达的维度, d
α
是注意力中间表达的维度,是连接运算子,σ()是sigmoid函数,输出值 在0到1之间,relu()是激活函数。
[0076]
应该理解,以上等式1至等式3的表达式仅是示例,本技术不限于此, 还可使用其他变种形式来获取关系有向图的表达。
[0077]
通过以上描述的计算,处理装置120可获得关于查询的所有关系有向图 的表达。训练装置130可基于处理装置120获得的关系有向图的表达建立针 对原给定知识图谱的图网络模型的损失函数,并基于建立的损失函数对所述 知识图谱的图网络模型进行训练。
[0078]
举例来说,训练装置130可将所述模型的评分函数f(e
q
,r
q
,e
a
)确定为
ꢀꢀ
是权重向量,并且可通过模型训练学习 获得。
[0079]
由此,训练装置130可将模型的损失函数确定为以下等式4:
[0080]
[等式4]
[0081][0082]
等式4中的第一部分是对训练集中的正样本三元组(e
q
,r
q
,e
a
)的评分, 第二部分包括针对查询(e
q
,r
q
,?)的所有三元组的评分,模型参数,?)的所有三元组的评分,模型参数被随机初始化,并在模型训练过程中通过利用诸如 随机梯
度下降使等式4最小化来进行优化。应该理解,在上述损失函数的第 二部分中,可不采用所有三元组,而是可使用与正样本三元组(e
q
,r
q
,e
a
)对应 的负样本三元组。
[0083]
在训练装置130利用上述损失函数完成模型训练之后,预测装置140可 利用训练完成的图网络模型来预测所述查询(e
q
,r
q
,?)中的应答实体。
[0084]
图5是示出根据本公开的示例性实施例的基于知识图谱推理的预测方法 500的流程图。
[0085]
如图5所示,在步骤s510,可通过增广装置110对知识图谱进行增广以 获得增广知识图谱。在本发明的示例性实施例中,增广装置110可对知识图 谱中的每个结点添加一个指向自身的关系,并对知识图谱中的每一条边添加 一个对应的呈现相反关系的边,使得知识图谱中的长度未超过长度l的关系 路径在增广知识图谱中被增广到长度l。
[0086]
在步骤s520,可由处理装置120基于增广知识图谱,获取关于查询的关 系有向图的表达。在本发明的示例性实施例中,所述查询可包括查询实体、 查询关系和应答实体,关于查询的关系有向图可包括针对不同候选应答实体 的候选关系有向图。
[0087]
之后,在步骤s530,训练装置130可基于步骤s520获得的关系有向图 的表达建立针对所述知识图谱的图网络模型的损失函数,并基于所述损失函 数对所述知识图谱的图网络模型进行训练。
[0088]
最后,在步骤s540,预测装置140可利用训练完成的图网络模型来预测 所述查询中的应答实体。
[0089]
以上已结合图1至图5详细描述了根据本公开的示例性实施例的基于知 识图谱推理的预测系统100的各个组成元件所执行的详细操作的具体过程, 因此为了简明,在此将不再赘述。
[0090]
根据本公开的示例性实施例的基于知识图谱推理的预测系统和方法可被 应用于执行关系检索、语义检索、智能检索、智能推荐、智能问答、个性化 推荐、多跳预测、结点分类、内容分发等的推理任务。
[0091]
仅作为示例,在根据本公开的示例性实施例的基于知识图谱推理的预测 方法和系统的各种应用场景之中,例如,对于检索(诸如关系检索、语义检 索、智能等),可通过输入两个关键词来检索另一实体,例如,输入(张三母 亲)可检索出另一实体“李四”(李四是张三的母亲)。
[0092]
例如,对于智能问答,输入“中国的首都是哪里?”则能准确返回“北 京”,由此可通过知识图谱真正理解了用户的意图。
[0093]
通过应用根据本发明的示例性实施例的基于知识图谱推理的预测方法和 系统,能够充分保留知识图谱的关系之间的结构信息和语义信息,并且可通 过图神经网络同时对多个事实进行推理,极大地提高了推理的运算效率和效 果。
[0094]
以上已参照图1至图5描述了根据本公开的示例性实施例的基于知识图 谱推理的预测方法和系统。然而,应理解的是:附图中示出的装置和系统可 被分别配置为执行特定功能的软件、硬件、固件或上述项的任意组合。例如, 这些系统、装置可对应于专用的集成电路,也可对应于纯粹的软件代码,还 可对应于软件与硬件相结合的模块。此外,这些系统或装置所实现的一个或 多个功能也可由物理实体设备(例如,处理器、客户端或服务器等)中的组 件来统一执行。
[0095]
此外,上述方法可通过记录在计算机可读存储介质上的指令来实现,例 如,根据本技术的示例性实施例,可提供一种存储指令的计算机可读存储介 质,其中,当所述指令被至少一个计算装置运行时,促使所述至少一个计算 装置执行以下步骤:对知识图谱进行增广以获得增广知识图谱,其中,所述 知识图谱包括结点和边,所述结点指示实体,所述边指示该边所连接的结点 之间的关系并且为有向边,所述知识图谱中长度未超过l的关系路径在所述 增广知识图谱中被增广到长度l;基于所述增广知识图谱,获取关于查询的 关系有向图的表达,其中,所述查询包括查询实体、查询关系和应答实体, 所述关于查询的关系有向图包括针对不同候选应答实体的候选关系有向图; 基于所述关系有向图的表达建立针对所述知识图谱的损失函数;基于所述损 失函数对所述知识图谱的图网络模型进行训练;利用训练完成的图网络模型 来预测所述查询中的应答实体,其中,所述候选关系有向图为l层的有向图, 查询实体被设置为位于所述候选关系有向图中的第0层的源结点,对应候选 应答实体被设置为位于所述候选关系有向图中的第l层的汇聚点,所述候选 关系有向图中的所有边的方向沿从源结点指向汇聚点的方向,并且从源结点 到汇聚点的任意一条路径对应于增广知识图谱上从查询实体到对应候选应答 实体的一条长度为l的关系路径,其中,l是正整数。
[0096]
上述计算机可读存储介质中存储的指令可在诸如客户端、主机、代理装 置、服务器等计算机设备中部署的环境中运行,应注意,所述指令还可用于 执行除了上述步骤以外的附加步骤或者在执行上述步骤时执行更为具体的处 理,这些附加步骤和进一步处理的内容已经在参照图1至图5进行相关方法 的描述过程中提及,因此这里为了避免重复将不再进行赘述。
[0097]
应注意,根据本公开的示例性实施例的基于知识图谱推理的预测系统可 完全依赖计算机程序或指令的运行来实现相应的功能,即,各个装置在计算 机程序的功能架构中与各步骤相应,使得整个系统通过专门的软件包(例如, lib库)而被调用,以实现相应的功能。
[0098]
另一方面,当图1所示的系统和装置以软件、固件、中间件或微代码实 现时,用于执行相应操作的程序代码或者代码段可以存储在诸如存储介质的 计算机可读介质中,使得至少一个处理器或至少一个计算装置可通过读取并 运行相应的程序代码或者代码段来执行相应的操作。
[0099]
例如,根据本技术示例性实施例,可提供一种包括至少一个计算装置和 至少一个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计 算装置运行时,促使所述至少一个计算装置执行下述步骤:对知识图谱进行 增广以获得增广知识图谱,其中,所述知识图谱包括结点和边,所述结点指 示实体,所述边指示该边所连接的结点之间的关系并且为有向边,所述知识 图谱中长度未超过l的关系路径在所述增广知识图谱中被增广到长度l;基 于所述增广知识图谱,获取关于查询的关系有向图的表达,其中,所述查询 包括查询实体、查询关系和应答实体,所述关于查询的关系有向图包括针对 不同候选应答实体的候选关系有向图;基于所述关系有向图的表达建立针对 所述知识图谱的损失函数;基于所述损失函数对所述知识图谱的图网络模型 进行训练;利用训练完成的图网络模型来预测所述查询中的应答实体,其中, 所述候选关系有向图为l层的有向图,查询实体被设置为位于所述候选关系 有向图中的第0层的源结点,对应候选应答实体被设置为位于所述候选
关系 有向图中的第l层的汇聚点,所述候选关系有向图中的所有边的方向沿从源 结点指向汇聚点的方向,并且从源结点到汇聚点的任意一条路径对应于增广 知识图谱上从查询实体到对应候选应答实体的一条长度为l的关系路径,其 中,l是正整数。
[0100]
具体说来,上述系统可以部署在服务器或客户端中,也可以部署在分布 式网络环境中的结点上。此外,所述系统可以是pc计算机、平板装置、个 人数字助理、智能手机、web应用或其他能够执行上述指令集合的装置。此 外,所述系统还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸 如,键盘、鼠标、触摸输入装置等)。另外,所述系统的所有组件可经由总线 和/或网络而彼此连接。
[0101]
这里,所述系统并非必须是单个系统,还可以是任何能够单独或联合执 行上述指令(或指令集)的装置或电路的集合体。所述系统还可以是集成控 制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由 无线传输)以接口互联的便携式电子装置。
[0102]
在所述系统中,所述至少一个计算装置可包括中央处理器(cpu)、图形 处理器(gpu)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。 作为示例而非限制,所述至少一个计算装置还可包括模拟处理器、数字处理 器、微处理器、多核处理器、处理器阵列、网络处理器等。计算装置可运行 存储在存储装置之一中的指令或代码,其中,所述存储装置还可以存储数据。 指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,所述网 络接口装置可采用任何已知的传输协议。
[0103]
存储装置可与计算装置集成为一体,例如,将ram或闪存布置在集成 电路微处理器等之内。此外,存储装置可包括独立的装置,诸如,外部盘驱 动、存储阵列或任何数据库系统可使用的其他存储装置。存储装置和计算装 置可在操作上进行耦合,或者可例如通过i/o端口、网络连接等互相通信, 使得计算装置能够读取存储在存储装置中的指令。
[0104]
以上描述了本技术的各示例性实施例,应理解,上述描述仅是示例性的, 并非穷尽性的,本技术不限于所披露的各示例性实施例。在不偏离本技术的 范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更 都是显而易见的。因此,本技术的保护范围应该以权利要求的范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1