一种基于时空语义约束的知识问答方法、装置和产品与流程

文档序号:36641226发布日期:2024-01-06 23:26阅读:25来源:国知局
一种基于时空语义约束的知识问答方法、装置和产品与流程

本技术涉及知识问答,特别是一种基于时空语义约束的知识问答方法、装置和产品。


背景技术:

1、知识图谱是一种通过“节点-关系-节点”组成的知识管理架构,用于对领域实体关系数据进行有效管理。在一些特定领域,知识图谱中会涵盖各类复杂语义的文本信息,实体和关系会在时空维度上动态变化,需要面向领域应用的时空知识图谱模型来实现这种时空动态变化数据的存储、管理和计算。

2、然而,在通过知识图谱执行知识问答的过程中,相关技术往往难以处理复杂时空语义约束下的知识问答问题,即,当问句中存在语义较为复杂的时空限制条件时,往往难以在知识图谱中直接查询得到相应的答案,问答正确率较低。

3、因此,有必要开发一种基于时空语义约束的知识问答方法、装置和产品,以提高知识问答准确率。


技术实现思路

1、鉴于上述问题,本技术实施例提供了一种基于时空语义约束的知识问答方法、装置和产品,以便克服上述问题或者至少部分地解决上述问题。

2、本技术实施例的第一方面,提供了一种基于时空语义约束的知识问答方法,包括:

3、对自然语言问句进行信息抽取,得到抽取结果,所述抽取结果包括实体、谓词、查询对象、显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束;

4、定义通用查询路径,将所述抽取结果进行组合编排,生成多个候选查询路径;

5、在目标时空知识图谱中执行每一个所述候选查询路径,将搜索得到的查询结果与标准答案进行对比,根据对比结果,从所述多个候选查询路径中确定正确查询路径;

6、利用所述正确查询路径和所述自然语言问句,进行模型训练,得到查询路径生成模型;

7、将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案。

8、在一种可能的实施方式中,所述对自然语言问句进行信息抽取,得到抽取结果,包括:

9、通过ac自动机、es引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果;

10、通过向量引擎,依据语义相似度对所述自然语言问句进行向量召回,生成向量召回结果;

11、对所述关键词召回结果和所述向量召回结果进行加权融合,得到所述抽取结果。

12、在一种可能的实施方式中,所述通过ac自动机、es引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果,包括:

13、通过所述ac自动机,对所述自然语言问句进行关键词召回,得到第一关键词召回结果;

14、通过所述es引擎,对所述自然语言问句进行关键词召回,将召回的第一个五元组作为第二关键词召回结果;

15、通过所述嵌入语言模型,对所述自然语言问句进行关键词召回,基于得到的多个五元组中的前n个五元组,统计实体出现次数,将出现次数最多的k个实体作为第三关键词召回结果,其中k和n分别为大于1的正整数;

16、将所述第二关键词召回结果和所述第三关键词召回结果进行加权融合,得到候选实体集;

17、将所述候选实体集和所述第一关键词召回结果进行结合,得到所述关键词召回结果。

18、在一种可能的实施方式中,所述候选查询路径包括以下一项或多项:

19、次序约束信息,表示所述自然语言问句是否按照时间顺序取查询结果的第一个、最后一个、或全部;

20、显式时间约束信息,表示在所述自然语言问句中直接存在的时间约束信息,包括:时间约束的粒度、时间约束的方向、时间值;

21、隐式时间约束信息,表示不在所述自然语言问句中直接存在,但包含在语义中的时间约束信息,包括:时间约束的粒度、时间约束的方向和通过三元组查询获取的隐式时间值;

22、显式地点约束信息,表示在所述自然语言问句中直接存在的位置约束信息,包括:地点约束的粒度、地点约束的方向、地点值;

23、隐式地点约束信息,表示不在所述自然语言问句中直接存在,但包含在语义中的位置约束信息,包括:地点约束的粒度、地点约束的方向和通过三元组查询获取的隐式地点值;

24、主查询信息,表示所述自然语言问句中查询目标的信息,包括查询目标和通过三元组查询获取的隐式查询信息。

25、在一种可能的实施方式中,在执行每一个所述候选查询路径之前,所述方法还包括:

26、对所述多个候选查询路径中违背预设规则的错误查询路径进行剪枝;

27、根据所述候选查询路径所对应的实体或谓词在所述抽取结果中的优先级,对剪枝后的候选查询路径进行优先级排序;

28、所述从所述多个候选查询路径中确定正确查询路径,包括:

29、在从所述多个候选查询路径中确定出多个正确的候选查询路径的情况下,将所述多个正确的候选查询路径中优先级最高的候选查询路径确定为所述正确查询路径。

30、在一种可能的实施方式中,所述查询路径生成模型包括t5模型和bert模型,所述利用所述正确查询路径和所述自然语言问句,进行模型训练包括:

31、以所述自然语言问句为输入的训练样本,以对应的所述正确查询路径为标签,对所述t5模型进行训练;

32、以所述自然语言问句和对应的所述候选查询路径为输入的训练样本,以所述候选查询路径是否为所述正确查询路径为标签,对所述bert模型进行训练。

33、在一种可能的实施方式中,所述将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案,包括:

34、将所述用户的目标问句输入所述t5模型,得到第一目标查询路径;

35、将所述用户的目标问句和所述目标问句的候选查询路径输入所述bert模型,得到第二目标查询路径;

36、在所述目标时空图谱中分别执行所述第一目标查询路径和所述第二目标查询路径,得到多个候选目标答案;

37、将所述多个候选目标答案融合,得到所述目标答案。

38、本技术实施例第二方面还提供了一种基于时空语义约束的知识问答装置,所述装置包括:

39、信息抽取模块,用于对自然语言问句进行信息抽取,得到抽取结果,所述抽取结果包括实体、谓词、查询对象、显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束;

40、候选查询路径生成模块,用于定义通用查询路径,将所述抽取结果进行组合编排,生成多个候选查询路径;

41、正确查询路径确定模块,用于在目标时空知识图谱中执行每一个所述候选查询路径,将搜索得到的查询结果与标准答案进行对比,根据对比结果,从所述多个候选查询路径中确定正确查询路径;

42、训练模块,用于利用所述正确查询路径和所述自然语言问句,进行模型训练,得到查询路径生成模型;

43、知识问答模块,用于将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案。

44、在一种可能的实施方式中,所述信息抽取模块包括:

45、关键词召回子模块,用于通过ac自动机、es引擎和嵌入语言模型,对所述自然语言问句进行关键词召回,生成关键词召回结果;

46、向量召回子模块,用于通过向量引擎,依据语义相似度对所述自然语言问句进行向量召回,生成向量召回结果;

47、召回结果融合子模块,用于对所述关键词召回结果和所述向量召回结果进行加权融合,得到所述抽取结果。

48、在一种可能的实施方式中,所述关键词召回子模块,包括:

49、第一关键词召回单元,用于通过所述ac自动机,对所述自然语言问句进行关键词召回,得到第一关键词召回结果;

50、第二关键词召回单元,用于通过所述es引擎,对所述自然语言问句进行关键词召回,将召回的第一个五元组作为第二关键词召回结果;

51、第三关键词召回单元,用于通过所述嵌入语言模型,对所述自然语言问句进行关键词召回,基于得到的多个五元组中的前n个五元组,统计实体出现次数,将出现次数最多的k个实体作为第三关键词召回结果,其中k和n分别为大于1的正整数;

52、关键词召回融合单元,用于将所述第二关键词召回结果和所述第三关键词召回结果进行加权融合,得到候选实体集;

53、召回结果结合单元,用于将所述候选实体集和所述第一关键词召回结果进行结合,得到所述关键词召回结果。

54、在一种可能的实施方式中,所述候选查询路径包括以下一项或多项:

55、次序约束信息,表示所述自然语言问句是否按照时间顺序取查询结果的第一个、最后一个、或全部;

56、显式时间约束信息,表示在所述自然语言问句中直接存在的时间约束信息,包括:时间约束的粒度、时间约束的方向、时间值;

57、隐式时间约束信息,表示不在所述自然语言问句中直接存在,但包含在语义中的时间约束信息,包括:时间约束的粒度、时间约束的方向和通过三元组查询获取的隐式时间值;

58、显式地点约束信息,表示在所述自然语言问句中直接存在的位置约束信息,包括:地点约束的粒度、地点约束的方向、地点值;

59、隐式地点约束信息,表示不在所述自然语言问句中直接存在,但包含在语义中的位置约束信息,包括:地点约束的粒度、地点约束的方向和通过三元组查询获取的隐式地点值;

60、主查询信息,表示所述自然语言问句中查询目标的信息,包括查询目标和通过三元组查询获取的隐式查询信息。

61、在一种可能的实施方式中,所述装置还包括:

62、剪枝模块,用于在执行每一个所述候选查询路径之前,对所述多个候选查询路径中违背预设规则的错误查询路径进行剪枝;

63、优先级排序模块,用于根据所述候选查询路径所对应的实体或谓词在所述抽取结果中的优先级,对剪枝后的候选查询路径进行优先级排序;

64、所述正确查询路径确定模块,包括:

65、正确查询路径确定子模块,用于在从所述多个候选查询路径中确定出多个正确的候选查询路径的情况下,将所述多个正确的候选查询路径中优先级最高的候选查询路径确定为所述正确查询路径。

66、在一种可能的实施方式中,所述查询路径生成模型包括t5模型和bert模型,所述训练模块包括:

67、t5模型训练子模块,用于以所述自然语言问句为输入的训练样本,以对应的所述正确查询路径为标签,对所述t5模型进行训练;

68、bert模型训练子模块,用于以所述自然语言问句和对应的所述候选查询路径为输入的训练样本,以所述候选查询路径是否为所述正确查询路径为标签,对所述bert模型进行训练。

69、在一种可能的实施方式中,所述知识问答模块包括:

70、第一知识问答子模块,用于将所述用户的目标问句输入所述t5模型,得到第一目标查询路径;

71、第二知识问答子模块,用于将所述用户的目标问句和所述目标问句的候选查询路径输入所述bert模型,得到第二目标查询路径;

72、查询路径执行子模块,用于在所述目标时空图谱中分别执行所述第一目标查询路径和所述第二目标查询路径,得到多个候选目标答案;

73、答案融合子模块,用于将所述多个候选目标答案融合,得到所述目标答案。

74、本技术实施例第三方面还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上的计算机程序,所述处理器执行所述计算机程序以实现本技术实施例第一方面所述的基于时空语义约束的知识问答方法中的步骤。

75、本技术实施例第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本技术实施例第一方面所述的基于时空语义约束的知识问答方法中的步骤。

76、本技术实施例第五方面还提供了一种计算机程序产品,所述计算机程序产品在电子设备上运行时,使处理器执行时实现如本技术实施例第一方面所述的基于时空语义约束的知识问答方法中的步骤。

77、本技术实施例提供的一种基于时空语义约束的知识问答方法,包括:对自然语言问句进行信息抽取,得到抽取结果,所述抽取结果包括实体、谓词、查询对象、显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束;定义通用查询路径,将所述抽取结果进行组合编排,生成多个候选查询路径;在目标时空知识图谱中执行每一个所述候选查询路径,将搜索得到的查询结果与标准答案进行对比,根据对比结果,从所述多个候选查询路径中确定正确查询路径;利用所述正确查询路径和所述自然语言问句,进行模型训练,得到查询路径生成模型;将用户的目标问句输入所述查询路径生成模型,得到目标查询路径,在所述目标时空知识图谱中执行所述目标查询路径,得到目标答案。

78、本技术通过从自然语言问句中抽取得到多粒度的时空信息(显式时间约束、显式地点约束、次序约束、隐式时间约束、隐式地点约束),从而实现对问句的复杂语义进行解析,召回得到更为准确的实体和谓词,有利于提高最终答案查询的准确率;并且,本技术通过定义通用查询路径形式化语言,简化了自然语言问句与答案之间的对应关系,具有普遍通用性,适用于各领域的文本知识问答应用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1