基于知识库的问答方法、装置、计算机设备及存储介质与流程

文档序号:37292463发布日期:2024-03-13 20:40阅读:11来源:国知局
基于知识库的问答方法、装置、计算机设备及存储介质与流程

本申请实施例涉及人工智能,特别涉及一种基于知识库的问答方法、装置、计算机设备及存储介质。


背景技术:

1、随着人工智能技术的发展,ai对话也变得越来越智能化和个性化。现有的基于知识库进行信息查询时方案,通常采取多级分类、逐级下钻的方式,或者是文本搜索的方式进行信息查找。

2、然而,上述基于知识库进行信息查询的查询方式对知识库的构建者及查询者都有一定的知识或经验要求,一方面构建者需要了解知识是如何划分分级的,如果分类分级不合理,就会影响到查询效率,另一方面查询者一般需要通过关键字来进行全文检索或模糊匹配,如果输入的关键字不合理会出现查询失败或者匹配到的文本过多的情况,使得查询效率较低,查询精度较差。


技术实现思路

1、本申请实施例提供了一种基于知识库的问答方法、装置、计算机设备及存储介质,可以提高基于知识库进行内容查询的查询效率以及用户体验。该技术方案如下:

2、一方面,提供了一种基于知识库的问答方法,所述方法包括:

3、对知识库中的原始文本进行文本拆分处理,得到所述原始文本的至少两个拆分段落;

4、对所述至少两个拆分段落分别进行关键信息提取,得到与每个所述拆分段落具有映射关系的关键信息;

5、对各个拆分段落的关键信息进行向量化处理,得到所述关键信息对应的向量信息,并将各个拆分段落的关键信息的元数据与对应的向量信息关联存储到向量数据库中;

6、在接收到查询语句时,基于所述查询语句的向量化结果在所述向量数据库中进行向量查询,得到目标向量信息;

7、基于所述目标向量信息,生成所述查询语句对应的回复文本。

8、另一方面,提供了一种基于知识库的问答装置,所述装置包括:

9、文本拆分模块,用于对知识库中的原始文本进行文本拆分处理,得到所述原始文本的至少两个拆分段落;

10、信息提取模块,用于对所述至少两个拆分段落分别进行关键信息提取,得到与每个所述拆分段落具有映射关系的关键信息;

11、向量化模块,用于对各个拆分段落的关键信息进行向量化处理,得到所述关键信息对应的向量信息,并将各个拆分段落的关键信息的元数据与对应的向量信息关联存储到向量数据库中;

12、查询模块,用于在接收到查询语句时,基于所述查询语句的向量化结果在所述向量数据库中进行向量查询,得到目标向量信息;

13、回复文本生成模块,用于基于所述目标向量信息,生成所述查询语句对应的回复文本。

14、在一种可能的实现方式中,所述拆分段落的关键信息包括以下至少之一:段落摘要信息,多个拆分句子信息以及问答对信息。

15、在一种可能的实现方式中,所述信息提取模块,用于,

16、将基于输入拆分段落构建的关键信息提取指令输入到内容生成模型中,得到所述内容生成模型输出的所述输入拆分段落的关键信息;

17、其中,所述输入拆分段落为所述至少两个拆分段落中任意一个或多个拆分段落,所述输入拆分段落的文本长度小于内容生成模型的最大输入长度。

18、在一种可能的实现方式中,所述向量化模块,用于,

19、在所述关键信息包括所述问答对信息的情况下,对所述拆分段落的问答对信息中的问题信息进行向量化处理,得到问题信息对应的向量信息;

20、将所述问答对信息的元数据与问题信息对应的向量信息关联存储到所述向量数据库中;所述问答对信息的元数据包括问题信息的元数据以及回答信息的元数据。

21、在一种可能的实现方式中,所述回复文本生成模块,用于,

22、在所述目标向量信息为段落摘要信息对应的向量信息或任一拆分句子信息对应的向量信息的情况下,获取与所述目标向量信息关联的目标关键信息的元数据;

23、基于所述目标关键信息的元数据进行信息提取,得到与所述目标关键信息具有映射关系的目标拆分段落;

24、通过内容生成模型基于所述查询语句以及所述目标拆分段落,生成对应于所述查询语句的回复文本。

25、在一种可能的实现方式中,所述回复文本生成模块,用于,

26、在所述目标向量信息为问答对信息对应的向量信息的情况下,获取与所述目标向量信息关联的目标问答对信息的元数据;

27、基于所述目标问答对信息的元数据进行信息提取,得到所述目标问答对信息中的目标回答信息;

28、将所述目标回答信息获取为所述查询语句对应的回复文本。

29、在一种可能的实现方式中,所述查询模块,用于,

30、对所述查询语句的向量化结果与所述向量数据库中的各个向量信息进行向量相似度计算,得到各个向量信息对应的向量相似度;

31、基于各个向量信息对应的向量相似度,确定所述目标向量信息。

32、另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现上述的基于知识库的问答方法。

33、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述的基于知识库的问答方法。

34、另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述各种可选实现方式中提供的基于知识库的问答方法。

35、本申请提供的技术方案可以包括以下有益效果:

36、本申请实施例提供的基于知识库的问答方法,通过对知识库中的原始文本进行文本拆分处理,再对得到的至少两个拆分段落分别进行关键信息提取,得到与每个拆分段落具有映射关系的关键信息,实现对知识库中原始文档的多级分类;对各个拆分段落的关键信息进行向量化处理,得到关键信息对应的向量信息,结合向量数据库建立多级索引结构,使得同一文本内容可以对应到多个不同的向量索引,在接收到查询语句时,通过向量信息的查询,可以更加准确且高效的查找到对应的内容,以生成更加准确的回复文本,从而提高基于知识库进行内容查询的查询效率以及用户体验。

37、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。



技术特征:

1.一种基于知识库的问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述拆分段落的关键信息包括以下至少之一:段落摘要信息,多个拆分句子信息以及问答对信息。

3.根据权利要求2所述的方法,其特征在于,所述对所述至少两个拆分段落分别进行关键信息提取,得到与每个拆分段落具有映射关系的关键信息,包括:

4.根据权利要求2所述的方法,其特征在于,在所述关键信息包括问答对信息的情况下,所述对各个拆分段落的关键信息进行向量化处理,得到所述关键信息对应的向量信息,并将各个拆分段落的关键信息的元数据与对应的向量信息关联存储到向量数据库中,包括:

5.根据权利要求2所述的方法,其特征在于,在所述目标向量信息为段落摘要信息对应的向量信息或任一拆分句子信息对应的向量信息的情况下,所述基于所述目标向量信息,生成所述查询语句对应的回复文本,包括:

6.根据权利要求2所述的方法,其特征在于,在所述目标向量信息为问答对信息对应的向量信息的情况下,所述基于所述目标向量信息,生成所述查询语句对应的回复文本,包括:

7.根据权利要求1所述的方法,其特征在于,所述基于所述查询语句的向量化结果在所述向量数据库中进行向量查询,得到目标向量信息,包括:

8.一种基于知识库的问答装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至7任一所述的基于知识库的问答方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至7任一所述的基于知识库的问答方法。


技术总结
本申请涉及一种基于知识库的问答方法、装置、计算机设备及存储介质,涉及人工智能技术领域。该方法包括:对知识库中的原始文本进行文本拆分处理,得到原始文本的至少两个拆分段落;对至少两个拆分段落分别进行关键信息提取,得到与每个拆分段落具有映射关系的关键信息;对各个拆分段落的关键信息进行向量化处理,得到关键信息的向量信息,并将各个拆分段落的关键信息的元数据与对应的向量信息关联存储到向量数据库中;在接收到查询语句时,基于查询语句的向量化结果在向量数据库中进行向量查询,得到目标向量信息;基于目标向量信息,生成查询语句对应的回复文本。通过上述方法,可以提高基于知识库进行内容查询的查询效率以及用户体验。

技术研发人员:杜江洋
受保护的技术使用者:微梦创科网络科技(中国)有限公司
技术研发日:
技术公布日:2024/3/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1