本发明涉及人工智能,尤其涉及一种知识检索方法、设备、存储介质及装置。
背景技术:
1、大语言模型一个常见的应用方向是用于问答系统,用户提出的自然语言问题。大语言模型可以根据输入的问题,从预先准备的知识库中检索和生成答案,以满足用户的信息需求。然而在使用大语言模型进行问题解析时,由于问题分析维度单一,导致准确率低。
技术实现思路
1、本发明的主要目的在于提供一种知识检索方法、设备、存储介质及装置,旨在解决针对使用大语言模型进行问题解析时,由于问题分析维度单一,导致准确率低的技术问题。
2、为实现上述目的,本发明提供一种知识检索方法,所述知识检索方法包括以下步骤:
3、对预设知识库中的知识文档进行分割,获得多个知识片段;
4、基于预设大语言模型对用户输入的问题信息进行答案解析,获得候选答案;
5、基于预设bert模型对所述问题信息、所述知识片段以及所述候选答案进行相似度分析,获得综合相似度;
6、基于所述预设大语言模型以及所述综合相似度确定目标答案。
7、可选地,所述基于预设bert模型对所述问题信息、所述知识片段以及所述候选答案进行相似度分析,获得综合相似度的步骤,包括:
8、基于预设bert模型对所述候选答案以及所述问题信息进行相似度计算,获得第一相似度;
9、基于所述预设bert模型对知识片段信息以及所述问题信息进行相似度计算,获得第二相似度;
10、基于所述预设bert模型对所述候选答案以及所述知识片段信息进行相似度计算,获得第三相似度;
11、根据所述第一相似度、所述第二相似度以及所述第三相似度确定综合相似度。
12、可选地,所述基于预设bert模型对所述候选答案以及所述问题信息进行相似度计算,获得第一相似度的步骤,包括:
13、将所述候选答案以及所述问题信息输入至预设bret模型中,将所述候选答案转换为高维向量,获得第一嵌入向量;
14、将所述问题信息转换为高维向量,获得第二嵌入向量;
15、对所述第一嵌入向量以及所述第二嵌入向量进行余弦相似度计算,获得余弦相似度;
16、根据所述余弦相似度确定第一相似度;
17、其中,所述余弦相似度=(a·b)/(||a||*||b||);
18、其中,a·b是a向量和b向量的点积,||a||和||b||分别是a向量和b向量的模。
19、可选地,所述基于所述预设大语言模型以及所述综合相似度确定目标答案的步骤,包括:
20、根据所述第一相似度与预设阈值进行对比,根据对比结果确定相似度判断值;
21、根据预设召回片段数量、所述相似度判断值、所述第二相似度和所述第三相似度对所述知识片段进行排序,获得目标知识片段并构建知识片段筛选集;
22、将所述知识片段筛选集和所述用户输入的问题信息输入至预设大语言模型中,生成目标答案。
23、可选地,所述根据所述第一相似度与预设阈值进行对比,根据对比结果确定相似度判断值步骤,包括:
24、根据所述第一相似度与预设阈值进行对比,获得对比结果;
25、若所述对比结果为不大于预设阈值,则将相似度判断值设置为第一数值;
26、若所述对比结果为大于所述预设阈值,则将相似度判断值设置为第二数值。
27、可选地,所述根据预设召回片段数量、所述相似度判断值、所述第二相似度和所述第三相似度对所述知识片段进行排序,获得目标知识片段并构建知识片段筛选集的步骤,包括:
28、若所述相似度判断值设置为所述第一数值时,根据所述第二相似度对所述知识片段进行排序,并根据预设召回片段数据从排序后的知识片段中选取目标知识片段并构建知识片段筛选集;
29、若所述相似度判断值设置为所述第二数值时,根据所述第三相似度对所述知识片段进行排序,并根据所述预设召回片段数量从排序后的知识片段中选取目标知识片段构建预设数量的知识片段集合,并根据所述预设数量的知识片段集合的交集作为知识片段筛选集。
30、可选地,所述对预设知识库中的知识文档进行分割,获得多个知识片段的步骤,包括:
31、根据预设字符长度对预设知识库中的知识文档进行分割,获得多个知识片段。
32、此外,为实现上述目的,本发明还提出一种知识检索设备,所述知识检索设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的知识检索程序,所述知识检索程序配置为实现如上文所述的知识检索的步骤。
33、此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有知识检索程序,所述知识检索程序被处理器执行时实现如上文所述的知识检索方法的步骤。
34、此外,为实现上述目的,本发明还提出一种知识检索装置,所述知识检索装置包括:
35、文档分割模块,用于对预设知识库中的知识文档进行分割,获得多个知识片段;
36、答案解析模块,用于基于预设大语言模型对用户输入的问题信息进行答案解析,获得候选答案;
37、相似度计算模块,用于基于预设bert模型对所述问题信息、所述知识片段以及所述候选答案进行相似度分析,获得综合相似度;
38、答案确定模块,用于基于所述预设大语言模型以及所述综合相似度确定目标答案。
39、本发明通过对预设知识库中的知识文档进行分割,获得多个知识片段;基于预设大语言模型对用户输入的问题信息进行答案解析,获得候选答案;基于预设bert模型对所述问题信息、所述知识片段以及所述候选答案进行相似度分析,获得综合相似度;基于所述预设大语言模型以及所述综合相似度确定目标答案,相较于针对使用大语言模型进行问题解析时,由于问题分析维度单一,导致准确率低,本发明使用大语言模型将用户提问进行候选答案生成后,对问题、候选答案和知识片段进行综合相似度计算,可以更准确地衡量问题、答案和知识片段之间的相似度,从而筛选出最精准的目标答案。
1.一种知识检索方法,其特征在于,所述知识检索方法包括以下步骤:
2.如权利要求1所述的知识检索方法,其特征在于,所述基于预设bert模型对所述问题信息、所述知识片段以及所述候选答案进行相似度分析,获得综合相似度的步骤,包括:
3.如权利要求2所述的知识检索方法,其特征在于,所述基于预设bert模型对所述候选答案以及所述问题信息进行相似度计算,获得第一相似度的步骤,包括:
4.如权利要求3所述的知识检索方法,其特征在于,所述基于所述预设大语言模型以及所述综合相似度确定目标答案的步骤,包括:
5.如权利要求4所述的知识检索方法,其特征在于,所述根据所述第一相似度与预设阈值进行对比,根据对比结果确定相似度判断值步骤,包括:
6.如权利要求5所述的知识检索方法,其特征在于,所述根据预设召回片段数量、所述相似度判断值、所述第二相似度和所述第三相似度对所述知识片段进行排序,获得目标知识片段并构建知识片段筛选集的步骤,包括:
7.如权利要求1所述的知识检索方法,其特征在于,所述对预设知识库中的知识文档进行分割,获得多个知识片段的步骤,包括:
8.一种知识检索设备,其特征在于,所述知识检索设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的知识检索程序,所述知识检索程序被所述处理器执行时实现如权利要求1至7中任一项所述的知识检索方法。
9.一种存储介质,其特征在于,所述存储介质上存储有知识检索程序,所述知识检索程序被处理器执行时实现如权利要求1至7中任一项所述的知识检索方法。
10.一种知识检索装置,其特征在于,所述知识检索装置包括: