关系预测及问答方法、装置、电子设备及计算机存储介质与流程

文档序号:26911019发布日期:2021-10-09 15:05阅读:74来源:国知局
关系预测及问答方法、装置、电子设备及计算机存储介质与流程

1.本发明实施例涉及计算机技术领域,尤其涉及一种关系预测方法、装置、电子设备及计算机存储介质,以及,一种问答方法、装置、电子设备及计算机存储介质。


背景技术:

2.基于知识图谱的问答系统(简称kbqa系统)是一种给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案的系统。
3.在kbqa系统中,对实体间的关系进行预测是非常重要的一环。现有的kbqa系统中,通过神经网络模型对实体间的关系进行预测,该神经网络模型基于给定的基于知识图谱的知识库中的语料进行训练获得。但在实际应用中,用户的问题各种各样,所以经常出现因用户的问题与kbqa系统的训练语料不同,导致kbqa系统无法进行准确的实体间关系预测进而给出答案的情况。针对这种情况,当前的主要处理手段是增加相关语料重新对进行关系预测的神经网络模型进行训练。然而,这种方式下,新的问题不断出现就需要频繁地对该神经网络模型进行更新训练。
4.由此,导致关系预测模型的预测能力有限,预测成本高。而对于采用该关系预测模型的kbqa系统,则导致其整体的问答处理能力受限、且问答处理成本高。


技术实现要素:

5.有鉴于此,本发明实施例提供一种关系预测方案及问答方案,以至少部分解决上述问题。
6.根据本发明实施例的第一方面,提供了一种关系预测方法,包括:获取输入的问题数据及所述问题数据对应的图节点数据;基于所述图节点数据,通过关系预测模型的第一关系预测分支和第二关系预测分支分别对所述问题数据中的实体数据之间的关系进行预测,获得对应的第一关系预测结果和第二关系预测结果,其中,所述第一关系预测结果为词级别的预测结果,所述第二关系预测结果为关系级别的预测结果;根据所述第一关系预测结果和所述第二关系预测结果,确定所述问题数据对应的实体关系。
7.根据本发明实施例的第二方面,提供了一种问答方法,包括:获取输入的问题数据,并对所述问题数据进行图节点数据抽取,获得对应的图节点数据,其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据;根据所述问题数据和所述图节点数据,进行针对所述问题数据的实体关系预测,其中,所述实体关系预测通过如第一方面所述的关系预测方法实现;根据所述实体关系预测的预测结果,确定所述问题数据对应的答案数据。
8.根据本发明实施例的第三方面,提供了一种关系预测装置,包括:第一获取模块,用于获取输入的问题数据及所述问题数据对应的图节点数据;第二获取模块,用于基于所述图节点数据,通过关系预测模型的第一关系预测分支和第二关系预测分支分别对所述问题数据中的实体数据之间的关系进行预测,获得对应的第一关系预测结果和第二关系预测
结果,其中,所述第一关系预测结果为词级别的预测结果,所述第二关系预测结果为关系级别的预测结果;确定模块,用于根据所述第一关系预测结果和所述第二关系预测结果,确定所述问题数据对应的实体关系。
9.根据本发明实施例的第四方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的关系预测方法对应的操作;或者,所述可执行指令使所述处理器执行如第二方面所述的问答方法对应的操作。
10.根据本发明实施例的第五方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的关系预测方法;或者,该程序被处理器执行时实现如第二方面所述的问答方法。
11.根据本发明实施例提供的关系预测方案,在原有的关系预测模型的单关系预测分支的基础上增加了另一关系预测分支,即第二关系预测分支。其中,该第二关系预测分支的预测结果为关系级别的预测结果,也即,通过第二关系预测分支可直接获得实体数据间的关系,而原第一关系预测分支的预测结果则为词级别的预测结果。这两部分预测结果可被映射至同一向量空间,并以其为依据实现最终的实体关系确定。基于此,对于问题数据对应的图节点数据,一方面,若关系预测模型已基于知识图谱中该类型的图节点数据进行过训练,则可在原第一关系预测分支快速预测的基础上,还可通过第二关系预测分支的预测结果辅助,以获得更为精准的预测结果;另一方面,若知识图谱中不存在该类型的图节点数据,也即关系预测模型之前训练过程中未进行过该类型图节点数据的训练,则可直接通过第二关系预测分支对其进行关系级别的预测,即直接预测出图节点数据对应的实体数据之间的关系,再以第一关系预测分支的预测结果为辅助,即可获得较为准确的预测结果。由此,在关系预测模型训练完成后,对于出现的未遇到过的新问题数据,可主要依据第二预测分支进行实体关系预测获得的预测结果,使得关系预测模型对新问题数据具有较高的兼容性,而无需再对关系预测模型重新进行训练,提高了关系预测模型的预测能力,节省了预测成本。进一步地,对于采用该关系预测模型的问答系统如kbqa系统,则提高了kbqa系统整体的问答处理能力、且降低了kbaq系统的问答处理成本。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
13.图1a为根据本发明实施例一的一种关系预测方法的步骤流程图;图1b为图1a所示实施例中的一种场景示例的示意图;图2a为根据本发明实施例二的一种关系预测方法的步骤流程图;图2b为图2a所示实施例中的一种关系预测模型的结构示意图;图3为根据本发明实施例三的一种问答方法的步骤流程图;图4为根据本发明实施例四的一种关系预测装置的结构框图;
图5为根据本发明实施例五的一种电子设备的结构示意图。
具体实施方式
14.为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
15.下面结合本发明实施例附图进一步说明本发明实施例具体实现。
16.实施例一参照图1a,示出了根据本发明实施例一的一种关系预测方法的步骤流程图。
17.本实施例的关系预测方法包括以下步骤:步骤s102:获取输入的问题数据及所述问题数据对应的图节点数据。
18.其中,所述问题数据通常可以为文本问题数据,该文本问题数据可以由用户输入的语音问题转换而来,也可以是直接以文字形式输入的数据。
19.所述图节点数据用于指示符合知识图谱中的节点的数据结构的数据。对于一条条知识来说,其可以简化表示为一个三元组,例如,可以简化表示为{实体entity,实体关系relation,实体entity}的形式。进一步地,如果将其中的实体看作是节点,将其中的实体关系看作是一条边,那么包含了大量三元组的知识库就形成了一个知识图,也即知识图谱。其中,对于一个节点来说,其除了包括实体数据(如人名、地名、技术名词等命名实体)外,还可以包括用于指示该实体数据的属性的属性数据(如类别、主题等),在某些情况下还可能包括用于对所述实体数据和/或所述属性数据进行约束的约束条件数据(如年龄约束、类别约束等)。
20.以问题数据“家里只有我和我爷爷这种情况能享受个税扣除吗”为例,对其进行解析、数据提取和转换后,获得对应的图节点数据中包括:实体数据“个人所得税”(对应于“个税”)、属性数据“扣除标准”(对应于“扣除”)、约束条件数据“扣除对象”及其值“赡养老人”(对应于“我和我爷爷”)。
21.这些图节点数据中包含有大量的与实体有关的信息,可以为后续进行实体关系预测提供充分的依据和参考。
22.步骤s104:基于所述图节点数据,通过关系预测模型的第一关系预测分支和第二关系预测分支分别对问题数据中的实体数据之间的关系进行预测,获得对应的第一关系预测结果和第二关系预测结果。
23.其中,所述第一关系预测结果为词级别的预测结果,所述第二关系预测结果为关系级别的预测结果。
24.传统的关系预测模型采用单分支关系预测结构,即本实施例中的第一关系预测分支,其结果也与训练阶段使用的知识图谱数据相匹配,为词级别的预测结果。也即,需要通过单个词之间的组合来表达预测结果。
25.而本实施例中,在传统的关系预测结果的基础上,增加了第二关系预测分支,且该分支的预测结果为关系级别的预测结果。
26.例如,“a和b是发小”,则第一关系预测分支的预测结果为“朋”“友”,而第二关系预
测分支将直接预测出“朋友”。而在某些情况下,可能第一关系预测分支因类似训练语料的缺失导致无法预测或者无法预测出准确结果,则可根据第二关系预测分支预测出的“朋友”确定该语句中的实体关系。
27.其中,第一关系预测分支可采用kbqa系统中的常规关系预测模型结构实现,如采用lstm(长短期记忆网络)或bi

lstm(双向长短期记忆网络)的结构,而第二关系预测分支可采用任意适当的、可根据图节点数据预测出实体关系的模型结构实现,包括但不限于:卷积神经网络cnn结构、lstm结构或bi

lstm结构等。
28.步骤s106:根据所述第一关系预测结果和所述第二关系预测结果,确定所述问题数据对应的实体关系。
29.第一关系结果和第二关系预测结果被映射(mapping)至同一语义向量空间,二者相互辅助、相互补充,从而实现对最终的实体关系的确定。
30.以下,以一个具体使用场景为示例,对上述过程进行示例性说明,如图1b所示。
31.仍以问题数据“家里只有我和我爷爷这种情况能享受个税扣除吗”为示例,对其进行图节点数据提取和转换处理后,其对应的图节点数据包括:实体数据“个人所得税”、属性数据“扣除标准”、约束条件数据“扣除对象”及其值“赡养老人”。将这些图节点数据输入关系预测模型,通过第一关系预测分支获得第一关系预测结果,如“财”、“税”;通过第二关系预测分支获得第二关系预测结果,如“财税类型”。第一关系预测结果和第二关系预测结果将被映射至相同的语义向量空间。基于此,综合第一关系预测结果和第二关系预测结果,可以确定问题数据对应的实体关系为“财税类型”。在一种可行方案中,可以基于此得到一个三元组{个人所得税,财税类型,减免税}。当然,以上仅为示例性说明,在实际应用中得到的实体关系及三元组可能与上述示例不同。
32.可见,通过本实施例,在原有的关系预测模型的单关系预测分支的基础上增加了另一关系预测分支,即第二关系预测分支,其中,该第二关系预测分支的预测结果为关系级别的预测结果,也即,通过第二关系预测分支可直接获得实体数据间的关系,而原第一关系预测分支的预测结果则为词级别的预测结果。这两部分预测结果可被映射至同一向量空间,并以其为依据实现最终的实体关系确定。基于此,对于问题数据对应的图节点数据,一方面,若关系预测模型已基于知识图谱中该类型的图节点数据进行过训练,则可在原第一关系预测分支快速预测的基础上,还可通过第二关系预测分支的预测结果辅助,以获得更为精准的预测结果;另一方面,若知识图谱中不存在该类型的图节点数据,也即关系预测模型之前训练过程中未进行过该类型图节点数据的训练,则可直接通过第二关系预测分支对其进行关系级别的预测,即直接预测出图节点数据对应的实体数据之间的关系,再以第一关系预测分支的预测结果为辅助,即可获得较为准确的预测结果。由此,在关系预测模型训练完成后,对于出现的未遇到过的新问题数据,可主要依据第二预测分支进行实体关系预测获得的预测结果,使得关系预测模型对新问题数据具有较高的兼容性,而无需再对关系预测模型重新进行训练,提高了关系预测模型的预测能力,节省了预测成本。进一步地,对于采用该关系预测模型的问答系统如kbqa系统,则提高了kbqa系统整体的问答处理能力、且降低了kbaq系统的问答处理成本。
33.本实施例的关系预测方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等。
34.实施例二参照图2a,示出了根据本发明实施例二的一种关系预测方法的步骤流程图。
35.本实施例中,首先使用基于知识图谱的训练语料对关系预测模型进行训练,再使用训练完成的关系预测模型进行实体关系预测。以下,结合图2b所示的一种关系预测模型的结构示例,对本实施例的关系预测方法进行说明。
36.本实施例的关系预测方法包括以下步骤:步骤s202:获取基于知识图谱的kbqa系统的训练语料。
37.本实施例中的训练语料基于知识图谱,也可以认为这些训练语料是满足知识图谱的数据结构或数据标准要求的语料数据。本实施例中,所述训练语料中至少包括:语料实体、所述语料实体对应的属性数据、和所述语料实体对应的约束条件数据。但不限于此,在实际应用中,本领域技术人员还可以根据实际的训练需求获得包含不同内容或者具有不同数据结构的训练语料。在一种可选方式中,训练语料还可以包括对应的问题数据。
38.在一种可行方式中,训练语料可以通过预先构建的知识图谱获得。因构建完成的知识图谱已形成了一个完整体系,以其中的数据为训练语料,一方面,提高了训练语料获取的效率;另一方面,也可以大大节约对训练语料进行标注的数据处理成本。
39.训练语料可以作为训练样本,对关系预测模型进行训练。
40.步骤s204:通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练。
41.为便于对本实施例中的关系预测模型的训练进行说明,以下首先对图2b中所示的示例性模型结构进行说明如下。
42.如图2b所示,本实施例的关系预测模型中的第一关系预测分支主要包括由中间的bi

lstm部分构成的分支,而第二关系预测分支则主要包括由左侧的adapter部分构成的分支。其中,bi

lstm部分的具体结构及其预测过程均可参照现有技术实现,在此不再赘述。而adapter部分的结构和预测过程实现则可由本领域技术人员根据实际需求采用任意适当的、可基于图节点数据进行实体关系预测的模型结构实现,包括但不限于cnn结构、lstm结构等等。除此之外,图2b中所示的关系预测模型还包括用于将问题数据编码为向量的问题网络部分,即图2b中最右侧的bi

lstm部分。
43.在一种可行方式中,本步骤可以实现为:使用所述训练语料,按照所述第一关系预测分支训练在先,所述第二关系预测分支训练在后的顺序,对所述第一关系预测分支和所述第二关系预测分支交替进行迭代训练。仍以图2b所示结构为示例,则在该种方式中,先对bi

lstm部分进行一次训练,再对adapter部分进行一次训练,然后再对bi

lstm部分进行一次训练,再对adapter部分进行一次训练,
……
依次迭代。以对关系预测模型的训练有50次为简单示例,则bi

lstm部分和adapter部分各占25次,第1次bi

lstm部分,第2次adapter部分,第3次bi

lstm部分,第4次adapter部分,
……
依次类推,直至完成第50次训练。当然,在实际的训练中,次数可能以万次计,则根据上述逻辑对第一关系预测分支和第二关系预测分支交替进行训练即可。此外,需要说明的是,对bi

lstm部分的训练不仅影响各个bi

lstm的参数,同样会对adapter参数产生影响。通过交替迭代训练的方式,一方面,可以使得adapter部分可以很好地学习到bi

lstm部分的参数;另一方面,针对adapter部分的训练又可以使得其在后续使用中,基于已训练获得的模型参数,可将知识图谱中动态新增的实体
数据的属性数据映射到知识图谱的已有训练语料的属性空间中,从而保证新增属性数据也能够被准确地识别并用于预测,进而保证了预测的准确度。
44.具体地,对第一关系预测分支和第二关系预测分支的训练包括:(1)基于所述训练语料中的所述属性数据和所述约束条件数据,分别通过所述第一关系预测分支和所述第二关系预测分支,进行针对所述训练语料中的语料实体的实体关系预测,获得对应的第一子样本预测结果和第二子样本预测结果;将所述第一子样本预测结果和所述第二子样本预测结果进行合并,获得第一合并预测结果;根据所述第一合并预测结果与所述训练语料对应的训练问题样本向量的差异,对所述第一关系预测分支和所述第二关系预测分支进行训练。
45.在如图2b所示的示例中,问题数据为q:“家里只有我和我爷爷这种情况能享受个税扣除吗”,问题数据对应的图节点数据包括:实体数据entity为“个人所得税”、属性数据pro为“扣除标准”、约束条件数据con为“扣除对象”及其值value“赡养老人”。
46.从图2b中可见,属性数据pro和约束条件数据con及其值value分别被输入第一关系预测分支和第二关系预测分支进行处理,分别获得的第一子样本预测结果(图2b中标示为

的部分)和第二子样本预测结果(图2b中标示为

的部分)。进而,将第一子样本预测结果和第二子样本预测结果进行合并(如图2b中“concate”所示),获得第一合并预测结果(图2b中标示为“v
c1”)。根据预设的第一损失函数(图2b中示意为“ir loss”),确定第一合并预测结果与通过问题网络部分输入的训练问题样本向量(图2b中标示为“v
q”)之间的差异即第一损失值,再根据该第一损失值进行第一关系预测分支和第二关系预测分支的训练。其中,所述第一损失函数可以为任意适当的函数,包括但不限于欧氏距离函数、余弦函数、mse(均方误差)函数等,本发明实施例对此不作限制。可见,通过该第一损失函数,可以有效度量问题数据q,与,属性数据pro和约束条件数据con的相关度匹配损失(q<
‑‑‑
>pro+con)。
47.(2)基于所述训练语料中的所述属性数据和所述约束条件数据,通过所述第二关系预测分支进行针对所述训练语料中的语料实体的实体关系预测,获得对应的第三子样本预测结果;将所述第三子样本预测结果与所述语料实体对应的实体向量进行合并,获得第二合并预测结果;根据所述第二合并预测结果与所述训练语料对应的训练问题样本向量的差异,对所述第一关系预测分支和所述第二关系预测分支进行训练。
48.仍如图2b所示的示例中,属性数据pro和约束条件数据con及其值value分别被输入第一关系预测分支和第二关系预测分支进行处理,但本次重点关注第二关系预测分支的处理部分。为与前述(1)中第二关系预测分支的处理结果相区别,将本次第二关系预测分支的输入记为第三子样本预测结果。但因该第三子样本预测结果与(1)中的第二子样本预测结果本质上相同,因此在图2b中仍使用

标示。
49.在获得第三子样本预测结果后,可将其与语料实体对应的实体向量(图2b中标示为

的部分,实际应用中可使用词向量表示)进行合并,如图2b中“+”号所示,由此获得第二合并预测结果(图2b中标示为“v
c2”);根据预设的第二损失函数(图2b中示意为“kge loss”),确定第二合并预测结果与通过问题网络部分输入的训练问题样本向量(图2b中标示为“v
q”)之间的差异即第二损失值,再根据该第二损失值进行第一关系预测分支和第二关系预测分支的训练。其中,所述第二损失函数可以为任意适当的函数,包括但不限于欧氏距离函数、余弦函数、mse(均方误差)函数等,本发明实施例对此不作限制。可见,通过该损
失函数,可以有效度量问题数据q,与,实体数据entity、属性数据pro和约束条件数据con的相关度匹配损失(q<
‑‑‑
>entity+pro+con)。或者,也可以认为是head entity + relation = tail entity的损失。
50.(3)使用所述训练语料,进行针对所述训练语料中的语料实体的实体关系预测,获得样本预测结果;根据所述样本预测结果与预先获取的所述训练语料对应的样本实体关系之间的差异,对所述第二关系预测分支进行训练。
51.仍如图2b所示的示例中,属性数据pro和约束条件数据con及其值value分别被输入第一关系预测分支和第二关系预测分支进行处理,但本次仍然重点关注第二关系预测分支的处理部分。
52.如图2b中所示,属性数据pro和约束条件数据con及其值value经第二关系预测分支处理后,获得样本预测结果(图2b中标示为

的部分)。根据预设的第三损失函数(图2b中示意为“ada loss”),确定该样本预测结果与预设的样本实体关系之间的差异即第三损失值,进而根据该第三损失值对第二关系预测分支进行训练,如训练adapter中的模型参数。其中,所述损失函数可以为任意适当的函数,包括但不限于欧氏距离函数、余弦函数、mse(均方误差)函数等,本发明实施例对此不作限制。所述预先获取的样本实体关系可来自于与图节点数据相同的知识图谱,以实现对第二关系预测分支的有效监督训练。但不限于此,在实际应用中,该样本实体关系也可来自于其它数据源或由本领域技术人员人工设置,本发明实施例对此亦不作限制。
53.在实际的训练过程中,上述(1)、(2)和(3)通常是联合使用,以对第一关系预测分支和第二关系预测分支交替迭代训练。如图2b所示,问题数据为q、实体数据entity、属性数据pro和约束条件数据con及其值value均输入关系预测模型中,在第一次训练中,通过前述第一损失函数和第二损失函数分别获得前述第一损失值和第二损失值,进而基于该第一损失值和第二损失值对bi

lstm部分和adapter部分进行训练。在第二次训练中,通过前述第三损失函数获得第三损失值,进而基于该第三损失值对adapter部分进行训练。在第三次训练中,重复执行第一次训练的过程,基于该第一损失值和第二损失值对bi

lstm部分和adapter部分进行训练。在第四次训练中,重复执行第二次训练的过程,基于该第三损失值对adapter部分进行训练。依次类推,直至达到预设的训练终止条件,如达到预设的训练次数,或者,各个损失值均满足预设标准等。
54.通过上述训练过程,可获得较为完善的、可进行实体关系预测的关系预测模型。该模型完成训练后可长期使用,即使遇到新的问题数据或者新增的属性数据等情况,也无需像现有技术那样进行重新训练。
55.基于训练完成的关系预测模型,可继续进行如下所述的后续的应用阶段的操作。
56.步骤s206:获取输入的问题数据及所述问题数据对应的图节点数据。
57.其中,所述图节点数据用于指示符合知识图谱节点的数据结构的数据。
58.在一种可行方式中,本步骤可以实现为:获取输入的问题数据,并根据所述知识图谱的节点的数据结构,对所述问题数据进行节点数据提取,获得所述图节点数据,其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据。
59.其中,所述节点数据提取的具体实现可由本领域技术人员根据实际需求参照相关
技术中的手段实现,本发明实施例对此不作限制。
60.步骤s208:基于所述图节点数据,通过关系预测模型的第一关系预测分支和第二关系预测分支分别对所述问题数据中的实体数据之间的关系进行预测,获得对应的第一关系预测结果和第二关系预测结果。
61.其中,所述第一关系预测结果为词级别的预测结果,所述第二关系预测结果为关系级别的预测结果。如前所述,因采用的监督条件的不同(第一关系预测分支的监督条件为词级别的,第二关系预测分支的监督条件为关系级别的),因此获得的预测结果的级别也不同。
62.步骤s210:根据所述第一关系预测结果和所述第二关系预测结果,确定所述问题数据对应的实体关系。
63.例如,对于问题数据“家里只有我和我爷爷这种情况能享受个税扣除吗”,第一关系预测结果和第二关系预测结果将被映射(mapping)到同一语义向量空间,基于该语义向量空间的向量进行最终的实体关系的确定。
64.可见,通过本实施例,在原有的关系预测模型的单关系预测分支的基础上增加了另一关系预测分支,即第二关系预测分支。其中,该第二关系预测分支的预测结果为关系级别的预测结果,也即,通过第二关系预测分支可直接获得实体数据间的关系,而原第一关系预测分支的预测结果则为词级别的预测结果。这两部分预测结果可被映射至同一向量空间,并以其为依据实现最终的实体关系确定。基于此,对于问题数据对应的图节点数据,一方面,若关系预测模型已基于知识图谱中该类型的图节点数据进行过训练,则可在原第一关系预测分支快速预测的基础上,还可通过第二关系预测分支的预测结果辅助,以获得更为精准的预测结果;另一方面,若知识图谱中不存在该类型的图节点数据,也即关系预测模型之前训练过程中未进行过该类型图节点数据的训练,则可直接通过第二关系预测分支对其进行关系级别的预测,即直接预测出图节点数据对应的实体数据之间的关系,再以第一关系预测分支的预测结果为辅助,即可获得较为准确的预测结果。由此,在关系预测模型训练完成后,对于出现的未遇到过的新问题数据,可主要依据第二预测分支进行实体关系预测获得的预测结果,使得关系预测模型对新问题数据具有较高的兼容性,而无需再对关系预测模型重新进行训练,提高了关系预测模型的预测能力,节省了预测成本。进一步地,对于采用该关系预测模型的问答系统如kbqa系统,则提高了kbqa系统整体的问答处理能力、且降低了kbaq系统的问答处理成本。
65.本实施例的关系预测方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等。
66.实施例三参照图3,示出了根据本发明实施例三的一种问答方法的步骤流程图。
67.本实施例基于如实施例一或二中所述的关系预测模型,实现相应的问答方法。本实施例的问答方法包括以下步骤:步骤s302:获取输入的问题数据,并对所述问题数据进行图节点数据抽取,获得对应的图节点数据。
68.其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据。
69.步骤s304:根据所述问题数据和所述图节点数据,进行针对所述问题数据的实体关系预测。
70.其中,所述实体关系预测通过如实施例一或二中所述的关系预测方法实现,在此不再赘述。
71.步骤s306:根据所述实体关系预测的预测结果,确定所述问题数据对应的答案数据。
72.例如,问题数据“家里只有我和我爷爷这种情况能享受个税扣除吗”,对其进行图节点数据提取和处理后,其对应的图节点数据包括:实体数据“个人所得税”、属性数据“扣除标准”、约束条件数据“扣除对象”及其值“赡养老人”。将这些图节点数据输入关系预测模型,获得问题数据对应的实体关系为“财税类型”。进一步地,得到一个三元组{个人所得税,财税类型,减免税}。基于此,查询知识图谱得到相应的问题答案,如“独生子女按照每月2000元的标准定额扣除,非独生子女按照每月1000元的标准定额扣除”。
73.通过本实施例,基于训练完成的关系预测模型,可以实现对各种问题数据的准确的实体关系预测,进而获得更为有效和准确的问题答案,提升用户使用体验。
74.本实施例的问答方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、pad等)和pc机等。
75.实施例四参照图4,示出了根据本发明实施例四的一种关系预测装置的结构框图。
76.本实施例的关系预测装置包括:第一获取模块402,用于获取输入的问题数据及所述问题数据对应的图节点数据,其中,所述图节点数据用于指示符合知识图谱节点的数据结构的数据;第二获取模块404,用于基于所述图节点数据,通过关系预测模型的第一关系预测分支和第二关系预测分支分别对问题数据中的实体数据之间的关系进行预测,获得对应的第一关系预测结果和第二关系预测结果,其中,所述第一关系预测结果为词级别的预测结果,所述第二关系预测结果为关系级别的预测结果;确定模块406,用于根据所述第一关系预测结果和所述第二关系预测结果,确定所述问题数据对应的实体关系。
77.可选地,本实施例的关系预测装置还包括:训练模块408,用于在所述第一获取模块402获取输入的问题数据及所述问题数据对应的图节点数据之前,获取基于知识图谱的kbqa系统的训练语料,所述训练语料中至少包括:语料实体、所述语料实体对应的属性数据、和所述语料实体对应的约束条件数据;通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练。
78.可选地,训练模块408在通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练时:使用所述训练语料,按照所述第一关系预测分支训练在先,所述第二关系预测分支训练在后的顺序,对所述第一关系预测分支和所述第二关系预测分支交替进行迭代训练。
79.可选地,训练模块408在对所述第二关系预测分支的训练时:使用所述训练语料,进行针对所述训练语料中的语料实体的实体关系预测,获得样本预测结果;根据所述样本预测结果与预先获取的所述训练语料对应的样本实体关系之间的差异,对所述第二关系预测分支进行训练。
80.可选地,训练模块408在通过所述训练语料对所述关系预测模型中的所述第一关
系预测分支和所述第二关系预测分支进行训练时:基于所述训练语料中的所述属性数据和所述约束条件数据,分别通过所述第一关系预测分支和所述第二关系预测分支,进行针对所述训练语料中的语料实体的实体关系预测,获得对应的第一子样本预测结果和第二子样本预测结果;将所述第一子样本预测结果和所述第二子样本预测结果进行合并,获得第一合并预测结果;根据所述第一合并预测结果与所述训练语料对应的训练问题样本向量的差异,对所述第一关系预测分支和所述第二关系预测分支进行训练。
81.可选地,训练模块408在通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练时:基于所述训练语料中的所述属性数据和所述约束条件数据,通过所述第二关系预测分支进行针对所述训练语料中的语料实体的实体关系预测,获得对应的第三子样本预测结果;将所述第三子样本预测结果与所述语料实体对应的实体向量进行合并,获得第二合并预测结果;根据所述第二合并预测结果与所述训练语料对应的训练问题样本向量的差异,对所述第一关系预测分支和所述第二关系预测分支进行训练。
82.可选地,所述训练语料通过预先构建的知识图谱获得。
83.可选地,第一获取模块402,用于获取输入的问题数据,并根据所述知识图谱的节点的数据结构,对所述问题数据进行节点数据提取,获得所述图节点数据,其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据。
84.本实施例的关系预测装置用于实现前述多个方法实施例中相应的关系预测方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的关系预测装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
85.在本发明的另一个实施例中,还提供了一种问答装置,该问答装置包括前述的关系预测装置,该问答装置用于:获取输入的问题数据,并对所述问题数据进行图节点数据抽取,获得对应的图节点数据,其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据;根据所述问题数据和所述图节点数据,进行针对所述问题数据的实体关系预测,其中,所述实体关系预测通过所述关系预测装置实现;根据所述实体关系预测的预测结果,确定所述问题数据对应的答案数据。
86.本实施例的问答装置用于实现前述多个方法实施例中相应的问答方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的问答装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
87.实施例五参照图5,示出了根据本发明实施例五的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
88.如图5所示,该电子设备可以包括:处理器(processor)502、通信接口(communications interface)504、存储器(memory)506、以及通信总线508。
89.其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
90.通信接口504,用于与其它电子设备或服务器进行通信。
91.处理器502,用于执行程序510,具体可以执行上述关系预测方法实施例或问答方法实施例中的相关步骤。
92.具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
93.处理器502可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
94.存储器506,用于存放程序510。存储器506可能包含高速ram存储器,也可能还包括非易失性存储器(non

volatile memory),例如至少一个磁盘存储器。
95.在第一实施方式中:程序510具体可以用于使得处理器502执行以下操作:获取输入的问题数据及所述问题数据对应的图节点数据,其中,所述图节点数据用于指示符合知识图谱节点的数据结构的数据;基于所述图节点数据,通过关系预测模型的第一关系预测分支和第二关系预测分支分别对所述问题数据中的实体数据之间的关系进行预测,获得对应的第一关系预测结果和第二关系预测结果,其中,所述第一关系预测结果为词级别的预测结果,所述第二关系预测结果为关系级别的预测结果;根据所述第一关系预测结果和所述第二关系预测结果,确定所述问题数据对应的实体关系。
96.在一种可选的实施方式中,程序510还用于使得处理器502在获取输入的问题数据及所述问题数据对应的图节点数据之前,获取基于知识图谱的kbqa系统的训练语料,所述训练语料中至少包括:语料实体、所述语料实体对应的属性数据、和所述语料实体对应的约束条件数据;通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练。
97.在一种可选的实施方式中,程序510还用于使得处理器502在通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练时:使用所述训练语料,按照所述第一关系预测分支训练在先,所述第二关系预测分支训练在后的顺序,对所述第一关系预测分支和所述第二关系预测分支交替进行迭代训练。
98.在一种可选的实施方式中,程序510还用于使得处理器502在对所述第二关系预测分支的训练时:使用所述训练语料,进行针对所述训练语料中的语料实体的实体关系预测,获得样本预测结果;根据所述样本预测结果与预先获取的所述训练语料对应的样本实体关系之间的差异,对所述第二关系预测分支进行训练。
99.在一种可选的实施方式中,程序510还用于使得处理器502在通过所述训练语料对所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练时:基于所述训练语料中的所述属性数据和所述约束条件数据,分别通过所述第一关系预测分支和所述第二关系预测分支,进行针对所述训练语料中的语料实体的实体关系预测,获得对应的第一子样本预测结果和第二子样本预测结果;将所述第一子样本预测结果和所述第二子样本预测结果进行合并,获得第一合并预测结果;根据所述第一合并预测结果与所述训练语料对应的训练问题样本向量的差异,对所述第一关系预测分支和所述第二关系预测分支进行训练。
100.在一种可选的实施方式中,程序510还用于使得处理器502在通过所述训练语料对
所述关系预测模型中的所述第一关系预测分支和所述第二关系预测分支进行训练时:基于所述训练语料中的所述属性数据和所述约束条件数据,通过所述第二关系预测分支进行针对所述训练语料中的语料实体的实体关系预测,获得对应的第三子样本预测结果;将所述第三子样本预测结果与所述语料实体对应的实体向量进行合并,获得第二合并预测结果;根据所述第二合并预测结果与所述训练语料对应的训练问题样本向量的差异,对所述第一关系预测分支和所述第二关系预测分支进行训练。
101.在一种可选的实施方式中,训练语料通过预先构建的知识图谱获得。
102.在一种可选的实施方式中,程序510还用于使得处理器502在获取输入的问题数据及所述问题数据对应的图节点数据时:获取输入的问题数据,并根据所述知识图谱的节点的数据结构,对所述问题数据进行节点数据提取,获得所述图节点数据,其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据。
103.在第二实施方式中:程序510具体可以用于使得处理器502执行以下操作:获取输入的问题数据,并对所述问题数据进行图节点数据抽取,获得对应的图节点数据,其中,所述图节点数据包括:所述问题数据中的实体数据、所述实体数据对应的属性数据、和所述实体数据对应的约束条件数据;根据所述问题数据和所述图节点数据,进行针对所述问题数据的实体关系预测,其中,所述实体关系预测通过如第一实施方式所述的方案实现;根据所述实体关系预测的预测结果,确定所述问题数据对应的答案数据。
104.程序510中各步骤的具体实现可以参见上述关系预测方法实施例或问答方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
105.通过本实施例的电子设备,在原有的关系预测模型的单关系预测分支的基础上增加了另一关系预测分支,即第二关系预测分支。其中,该第二关系预测分支的预测结果为关系级别的预测结果,也即,通过第二关系预测分支可直接获得实体数据间的关系,而原第一关系预测分支的预测结果则为词级别的预测结果。这两部分预测结果可被映射至同一向量空间,并以其为依据实现最终的实体关系确定。基于此,对于问题数据对应的图节点数据,一方面,若关系预测模型已基于知识图谱中该类型的图节点数据进行过训练,则可在原第一关系预测分支快速预测的基础上,还可通过第二关系预测分支的预测结果辅助,以获得更为精准的预测结果;另一方面,若知识图谱中不存在该类型的图节点数据,也即关系预测模型之前训练过程中未进行过该类型图节点数据的训练,则可直接通过第二关系预测分支对其进行关系级别的预测,即直接预测出图节点数据对应的实体数据之间的关系,再以第一关系预测分支的预测结果为辅助,即可获得较为准确的预测结果。由此,在关系预测模型训练完成后,对于出现的未遇到过的新问题数据,可主要依据第二预测分支进行实体关系预测获得的预测结果,使得关系预测模型对新问题数据具有较高的兼容性,而无需再对关系预测模型重新进行训练,提高了关系预测模型的预测能力,节省了预测成本。进一步地,对于采用该关系预测模型的问答系统如kbqa系统,则提高了kbqa系统整体的问答处理能力、且降低了kbaq系统的问答处理成本。
106.需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
107.上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如cd rom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,ram、rom、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的关系预测方法或问答方法。此外,当通用计算机访问用于实现在此示出的关系预测方法或问答方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的关系预测方法或问答方法的专用计算机。
108.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
109.以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1