答案生成方法、装置、设备及可读存储介质与流程

文档序号:41583673发布日期:2025-04-11 17:33阅读:49来源:国知局

本技术涉及数据处理,更具体地说,涉及一种答案生成方法、装置、设备及可读存储介质。


背景技术:

1、在当今时代,信息呈现出爆炸式增长,其繁复程度日益加剧。在此背景下,越来越多的人倾向于借助知识问题系统来查找各类问题的答案。

2、现有技术中,知识问题系统将用户提问逐一与对应知识库中存储的每一个问题进行相似度比较,选取与用户提问相似度最高的问题的答案,作为用户提问的最契合答案,并提供给用户。

3、然而,这种处理方式存在明显的弊端。由于需要将用户提问和知识库内的所有问题都进行相似度比较,当知识库中的问题数量不断增多时,整个比较过程所耗费的时长也会随之增加。如此一来,用户常常需要经历较长时间的等待,才能获取到问题的解答结果。这种延迟情况导致无法及时对用户的提问做出回复,极大地影响了用户在使用该知识问题系统过程中的体验感。


技术实现思路

1、有鉴于此,本技术提供了一种答案生成方法、装置、设备及可读存储介质,用于解决现有技术中答案生成时长较长的缺点。

2、为了实现上述目的,现提出的方案如下:

3、一种答案生成方法,包括:

4、响应用户的提问操作,确定提问信息;

5、从问答知识库中获取各个标准问及每个标准问的所有同类问,各个标准问基于问答知识库中经过聚类的各个问题生成,每个标准问与对应同类问间的相似度满足预设相似范围,每个标准问对应有标准答案;

6、计算所述提问信息与每个标准问间的标准相似度,以及所述提问信息与每个同类问间的同类相似度;

7、基于标准问对提问语义的表征程度,确定第一权重,并基于同类问对提问语义的表征程度,确定第二权重;

8、基于对应于同一标准问的标准相似度及第一权重,和,同类相似度及第二权重,计算对应标准问的总体相似度;

9、若存在任一总体相似度超过相似阈值,将总体相似度最高的标准问所对应的标准答案作为所述提问信息的目标答案。

10、可选的,在基于对应于同一标准问的标准相似度及第一权重,和,同类相似度及第二权重,计算对应标准问的总体相似度之后,还包括:

11、若所有总体相似度皆低于相似阈值,则确定所述提问信息无法查找答案,将所述提问信息作为无解问题写入问答知识库。

12、可选的,所述从问答知识库中获取各个标准问及每个标准问的所有同类问,包括:

13、对所述问答知识库中的各个问题进行聚类,生成多个聚类子集,其中,每个聚类子集中包含有多个问题;

14、选取每个聚类子集的中心问题;

15、对每个聚类子集的中心问题进行优化,形成对应聚类子集的标准问;

16、生成每个标准问对应的多个待选同类问,选取与对应标准问区分度满足预设区分阈值且相似程度满足预设相似条件的所有待选同类问作为对应标准问的各个同类问。

17、可选的,所述选取每个聚类子集的中心问题,包括:

18、针对每一聚类子集,计算所述聚类子集中每个问题与所述聚类子集中其他问题的相似度之和;选取相似度之和最大的问题作为中心问题。

19、可选的,所述对每个聚类子集的中心问题进行优化,形成对应聚类子集的标准问,包括:

20、获取问题处理模型,所述问题处理模型以简化输入问题为目标训练得到;

21、利用所述问题处理模型,对每个聚类子集的中心问题进行简化,得到对应聚类子集的标准问。

22、可选的,所述生成每个标准问对应的多个待选同类问,包括:

23、针对每一聚类子集,计算所述聚类子集对应的标准问与所述聚类子集中除中心问题外其他问题的区分度,将区分度超过预设区分阈值的其他问题作为待选同类问;

24、获取经过训练的问题生成模型;

25、利用所述问题生成模型,结合每个标准问,生成每个标准问对应的多个待选同类问。

26、可选的,所述获取经过训练的问题生成模型,包括:

27、获取初始大语言模型及多个训练样本,每个训练样本中包含标注有多个同类提问数据的训练问题,每个训练问题与其对应的任一同类提问数据间的区分度满足所述区分阈值且相似程度满足预设相似条件;

28、依次利用每个训练样本,对所述初始大语言模型进行训练,直至连续多次初始大语言模型的生成问题与对应训练问题间的区分度满足所述区分阈值且相似程度满足预设相似条件为止,将最终得到的初始大语言模型作为所述经过训练的问题生成模型。

29、一种答案生成装置,包括:

30、确定模块,用于响应用户的提问操作,确定提问信息;

31、获取模块,用于从问答知识库中获取各个标准问及每个标准问的所有同类问,各个标准问基于问答知识库中经过聚类的各个问题生成,每个标准问与对应同类问间的相似度满足预设相似范围,每个标准问对应有标准答案;

32、计算模块,用于计算所述提问信息与每个标准问间的标准相似度,以及所述提问信息与每个同类问间的同类相似度;

33、表征模块,用于基于标准问对提问语义的表征程度,确定第一权重,并基于同类问对提问语义的表征程度,确定第二权重;

34、相加模块,用于基于对应于同一标准问的标准相似度及第一权重,和,同类相似度及第二权重,计算对应标准问的总体相似度;

35、生成模块,用于若存在任一总体相似度超过相似阈值,将总体相似度最高的标准问所对应的标准答案作为所述提问信息的目标答案。

36、一种答案生成设备,包括存储器和处理器;

37、所述存储器,用于存储程序;

38、所述处理器,用于执行所述程序,实现上述的答案生成方法的各个步骤。

39、一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的答案生成方法的各个步骤。

40、从上述的技术方案可以看出,本技术提供的答案生成方法,该方法可以响应用户的提问操作,确定提问信息;基于此,本技术可以捕捉用户需求,生成提问信息;随后,可以从问答知识库中获取各个标准问及每个标准问的所有同类问,各个标准问基于问答知识库中经过聚类的各个问题生成,每个标准问与对应同类问间的相似度满足预设相似范围,每个标准问对应有标准答案;计算所述提问信息与每个标准问间的标准相似度,以及所述提问信息与每个同类问间的同类相似度;基于标准问对提问语义的表征程度,确定第一权重,并基于同类问对提问语义的表征程度,确定第二权重;基于对应于同一标准问的标准相似度及第一权重,和,同类相似度及第二权重,计算对应标准问的总体相似度;基于此,本技术将提问信息与问答知识库中每一问题的比对过程转换为了提问信息与不同类型的标准问及同类问间的比对过程,进一步减少了相似度的计算过程,从而加快答案生成速度;同时,在此过程中,本技术通过结合同类问的相似度,以及分配标准问及同类问所对应的权重,避免单一相似度导致的片面性;利用每个标准问的同类问可以扩充语义覆盖范围,优化语义理解的灵活性及实用性,进一步保证总体相似度所表征的提问信息与对应标准问间的语义相似程度的可靠性;最后,若存在任一总体相似度超过相似阈值,将总体相似度最高的标准问所对应的标准答案作为所述提问信息的目标答案;基于此,本技术可以通过总体相似度的计算,保证选取的标准问与提问信息的语义相似度及匹配度,从而,保证目标答案与提问信息的相似度及匹配度。可见,本技术可以在加快答案生成速度的同时,保证生成答案的可靠性,进一步减少用户的答案等待时间,提高用户的使用体验感。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!