本申请涉及人工智能和大语言模型,尤其涉及一种基于人工智能的问答处理方法、装置、设备及存储介质。
背景技术:
1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如包括自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
2、其中,智能问答服务是人工智能技术的典型应用,智能问答服务是以一问一答的形式,精准的定位用户所需要的提问知识,为用户提供个性化的信息服务。然而,基于大语言模型的问答系统由于模型架构、训练语料、优化参数细节的差异,导致它们在不同问答任务上的表现往往不尽相同,并且,随着越来越多细分领域大语言模型的推出,不同大语言模型在不同领域问答任务上的性能也差异较大,导致最终的回答效果不佳。
技术实现思路
1、本申请实施例提供一种基于人工智能的问答处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够以资源集约的方式提高智能问答服务的回答效果。
2、本申请实施例的技术方案是这样实现的:
3、本申请实施例提供一种基于人工智能的问答处理方法,包括:
4、接收被输入的问题文本;
5、获取多个问答模型针对所述问题文本分别输出的回答文本;
6、对所述问题文本以及多个所述回答文本分别进行编码,对应得到所述问题文本的特征向量、以及每个所述回答文本的特征向量;
7、将所述问题文本的特征向量分别与每个所述回答文本的特征向量进行融合,对应得到多个融合向量;
8、确定所述多个融合向量的重心;
9、将与所述重心距离最近的融合向量对应的回答文本,作为最终输出的回答文本。
10、本申请实施例提供一种基于人工智能的问答处理装置,包括:
11、接收模块,用于接收被输入的问题文本;
12、获取模块,用于获取多个问答模型针对所述问题文本分别输出的回答文本;
13、编码模块,用于对所述问题文本以及多个所述回答文本分别进行编码,对应得到所述问题文本的特征向量、以及每个所述回答文本的特征向量;
14、融合模块,用于将所述问题文本的特征向量分别与每个所述回答文本的特征向量进行融合,对应得到多个融合向量;
15、确定模块,用于确定所述多个融合向量的重心;
16、所述确定模块,还用于将与所述重心距离最近的融合向量对应的回答文本,作为最终输出的回答文本。
17、上述方案中,所述编码模块,还用于通过编码器对所述问题文本进行编码,得到所述问题文本的特征向量,以及用于通过所述编码器对多个所述回答文本分别进行编码,对应得到每个所述回答文本的特征向量。
18、上述方案中,所述编码模块,还用于调用所述编码器执行以下处理:对所述问题文本进行特征提取,得到所述问题文本的词向量以及所述问题文本的位置向量;对所述问题文本的词向量以及所述问题文本的位置向量进行融合,得到所述问题文本的特征向量。
19、上述方案中,所述编码模块,还用于对所述问题文本进行词编码,得到所述问题文本的词向量,以及对所述问题文本中各词语的位置进行位置编码,得到所述问题文本的位置向量。
20、上述方案中,所述编码模块,还用于将所述问题文本的词向量和所述问题文本的位置向量进行拼接,得到所述问题文本的特征向量;或者,用于将所述问题文本的词向量和所述问题文本的位置向量进行相加,得到所述问题文本的特征向量。
21、上述方案中,所述编码模块,还用于针对每个所述回答文本,调用所述编码器执行以下处理:对所述回答文本进行特征提取,得到所述回答文本的词向量以及所述回答文本的位置向量;对所述回答文本的词向量以及所述回答文本的位置向量进行融合,得到所述回答文本的特征向量。
22、上述方案中,所述编码模块,还用于对所述回答文本进行词编码,得到所述回答文本的词向量,以及对所述回答文本中各词语的位置进行位置编码,得到所述回答文本的位置向量。
23、上述方案中,所述编码模块,还用于将所述回答文本的词向量和所述回答文本的位置向量进行拼接,得到所述回答文本的特征向量;或者,用于将所述回答文本的词向量和所述回答文本的位置向量进行相加,得到所述回答文本的特征向量。
24、上述方案中,所述融合模块,还用于将所述问题文本的特征向量分别与每个所述回答文本的特征向量进行拼接,对应得到多个融合向量;或者,用于将所述问题文本的特征向量分别与每个所述回答文本的特征向量进行相加,对应得到多个融合向量。
25、上述方案中,所述确定模块,还用于从所述多个融合向量所在的向量空间中选取一个初始重心,并基于所述初始重心构建损失函数;迭代执行以下处理,直至所述损失函数收敛至预设值:分别确定每个所述融合向量与所述初始重心之间的距离,并对多个所述距离进行相加,得到总距离;当所述总距离大于所述预设值时,从所述向量空间中重新选取一个初始重心;将所述损失函数收敛时对应的初始重心,作为所述多个融合向量的重心。
26、上述方案中,所述确定模块,还用于针对所述多个融合向量,分别确定每个所述融合向量与所述重心之间的距离;确定所述多个融合向量中与所述重心距离最近的目标融合向量,并将所述目标融合向量对应的回答文本,作为最终输出的回答文本。
27、上述方案中,所述多个问答模型包括不同领域的多个语言模型,且不同的所述语言模型的模型架构、训练语料、以及参数细节至少之一存在差异。
28、本申请实施例提供一种电子设备,包括:
29、存储器,用于存储可执行指令;
30、处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的基于人工智能的问答处理方法。
31、本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,用于被处理器执行时,实现本申请实施例提供的基于人工智能的问答处理方法。
32、本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,用于被处理器执行时,实现本申请实施例提供的基于人工智能的问答处理方法。
33、本申请实施例具有以下有益效果:
34、通过将多个问答模型分别输出的回答文本连同问题文本一起进行编码,使得这些特征向量之间两两可以进行比较,降低了计算复杂度,此外,本申请实施例是从多个问题模型分别输出的多个回答文本中筛选出最平均的回答文本,而非重新生成回答文本,保证了最终筛选出的回答文本在大多数场景下可用的程度,提高了智能问答服务的回答效果,并且,本申请实施例提供的技术方案不涉及对问答模型的微调以及修改,并且可以扩展至任意数量的问答模型进行集成,从而能够实现灵活部署。
1.一种基于人工智能的问答处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述问题文本以及多个所述回答文本分别进行编码,对应得到所述问题文本的特征向量、以及每个所述回答文本的特征向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过编码器对所述问题文本进行编码,得到所述问题文本的特征向量,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述问题文本进行特征提取,得到所述问题文本的词向量以及所述问题文本的位置向量,包括:
5.根据权利要求3所述的方法,其特征在于,所述对所述问题文本的词向量以及所述问题文本的位置向量进行融合,得到所述问题文本的特征向量,包括:
6.根据权利要求2所述的方法,其特征在于,所述通过所述编码器对多个所述回答文本分别进行编码,对应得到每个所述回答文本的特征向量,包括:
7.根据权利要求6所述的方法,其特征在于,所述对所述回答文本进行特征提取,得到所述回答文本的词向量以及所述回答文本的位置向量,包括:
8.根据权利要求6所述的方法,其特征在于,所述对所述回答文本的词向量以及所述回答文本的位置向量进行融合,得到所述回答文本的特征向量,包括:
9.根据权利要求1所述的方法,其特征在于,所述将所述问题文本的特征向量分别与每个所述回答文本的特征向量进行融合,对应得到多个融合向量,包括:
10.根据权利要求1所述的方法,其特征在于,所述确定所述多个融合向量的重心,包括:
11.根据权利要求1所述的方法,其特征在于,所述将与所述重心距离最近的融合向量对应的回答文本,作为最终输出的回答文本,包括:
12.根据权利要求1所述的方法,其特征在于,所述多个问答模型包括不同领域的多个语言模型,且不同的所述语言模型的模型架构、训练语料、以及参数细节至少之一存在差异。
13.一种基于人工智能的问答处理装置,其特征在于,所述装置包括:
14.一种电子设备,其特征在于,包括:
15.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时,实现权利要求1至12任一项所述的基于人工智能的问答处理方法。
16.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时,实现权利要求1至12任一项所述的基于人工智能的问答处理方法。