本技术实施例涉及人工智能,特别涉及一种大模型修正结果确定方法、装置、计算机设备及存储介质。
背景技术:
1、随着人工智能技术的发展,人工智能可以像“人”一样与使用者进行对话,在对话过程中完成撰写邮件、创作文案、翻译甚至编程等多项任务。这种人工智能技术的原理是,构建一个“大模型”,这个“大模型”可以简化理解为是将人类的各种知识“浓缩”到一个数据文件里,人在和人工智能对话时,本质上是将人所提的问题的文本发送到“大模型”所在的服务器,服务器将人提问的文本交给“大模型”数据文件进行计算(计算的过程可以称为“推理”,以下用“推理”这个词来描述),然后推理的结果是生成一段回答的文字,服务器将这段文字发回给提问者。大模型推理结果的准确性取决于模型训练的准确性。
2、大模型的训练过程中,需要准备大量的训练样本进行反复迭代训练以提高大模型的准确性,在大模型的推理结果有误时,为了减少重复训练造成的较多的时间消耗,可以通过定位大模型数据文件中存储指示的位置,然后对其进行修改,以纠正大模型的输出错误。
3、然而,由于大模型数据文件是对知识的浓缩,大模型数据文件中的每个神经元节点可能不止存储一个知识,若对一个神经元节点进行修改,可能会对该神经元节点中的其他数据产生负面影响,因此,确定模型修正是否会对大模型的整体推理能力造成影响的问题亟待解决。
技术实现思路
1、本技术实施例提供了一种大模型修正结果确定方法、装置、计算机设备及存储介质,可以在通过对大模型的大模型数据文件进行修改以对大模型进行修正时,对大模型数据文件的修改时对大模型的整体推理能力是否造成影响进行评估,从而确定是否将修正后的大模型进行应用,以保证大模型整体推理能力的准确性,该技术方案如下。
2、一方面,提供了一种大模型修正结果确定方法,所述方法包括:
3、通过校验测试集对目标大模型进行测评,获得所述目标大模型的第一测评分数;所述目标大模型用于基于输入的问题内容输出对应的回答内容;所述校验测试集涉及至少两个领域;
4、在通过所述目标大模型基于输入的目标推理样本推理得到的预测结果有误时,对所述目标大模型中的大模型数据文件进行修改,得到修改后的目标大模型;
5、通过所述校验测试集对修改后的目标大模型进行测评,获得所述目标大模型的第二测评分数;
6、在所述第一测评分数与所述第二测评分数之间的差值小于差值阈值时,确定所述目标大模型修正成功。
7、另一方面,提供了一种大模型修正结果确定装置,所述装置包括:
8、测评模块,通过校验测试集对目标大模型进行测评,获得所述目标大模型的第一测评分数;所述目标大模型用于基于输入的问题内容输出对应的回答内容;
9、修正模块,用于在通过所述目标大模型基于输入的目标推理样本推理得到的预测结果有误时,对所述目标大模型中的大模型数据文件的权重进行修改,得到修改后的目标大模型;
10、所述测评模块,还用于通过所述校验测试集对修改后的目标大模型进行测评,获得所述目标大模型的第二测评分数;
11、修正结果确定模块,用于在所述第一测评分数与所述第二测评分数之间的差值小于差值阈值时,确定所述模型修正成功。
12、在一种可能的实现方式中,所述目标推理样本具有对应的标准推理结果;
13、所述修正模块,包括:
14、第一推理子模块,用于通过所述目标大模型基于输入的目标推理样本进行n次推理,得到n个第一预测结果;n为正整数;
15、位置定位子模块,用于在n个所述第一预测结果中存在与所述标准推理结果不匹配的目标预测结果的情况下,定位所述目标预测结果在所述大模型数据文件中的存储位置;
16、修改子模块,用于对所述目标预测结果在所述大模型数据文件中的存储位置的权重数据进行修改,得到修改后的目标大模型。
17、在一种可能的实现方式中,所述测评模块,用于在通过修改后的目标大模型基于所述目标推理样本再次进行推理得到的预测结果无误时,通过所述校验测试集对修改后的目标大模型进行测评,获得所述目标大模型的第二测评分数。
18、在一种可能的实现方式中,所述测评模块,包括:
19、第二推理子模块,用于通过修改后的目标大模型基于所述目标推理样本再次进行m次推理,得到m个第二预测结果;m为正整数;
20、测评子模块,用于在所述m个预测结果均与所述标准推理结果相匹配的情况下,通过所述校验测试集对修改后的目标大模型进行测评,获得所述目标大模型的第二测评分数。
21、在一种可能的实现方式中,所述校验测试集包括至少两道测评题目,每个测评题目具有对应的测评分值;所述至少两道测评题目来源于不同的领域;
22、所述测评模块,用于通过所述目标大模型获取所述至少两道测评题目的测试答案;
23、基于所述测试答案的正确性以及每个测评题目对应的测评分值,获得所述目标大模型的测评分数。
24、在一种可能的实现方式中,所述装置还包括:
25、训练模块,用于在所述第一测评分数与所述第二测评分数之间的差值大于或等于所述差值阈值时,重新对所述目标大模型进行模型训练。
26、在一种可能的实现方式中,所述训练模块,用于,
27、获取训练样本集,所述训练样本集中包含问答样本,所述问答样本中包含样本问题内容以及所述样本问题内容对应的推理结果标签;
28、将所述样本问题内容输入到所述目标大模型中,获得所述目标大模型输出的预测结果;
29、基于所述预测结果与所述推理结果标签之间的差异,对所述目标大模型进行参数更新,以对所述目标大模型进行模型训练。
30、另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现上述的大模型修正结果确定方法。
31、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述的大模型修正结果确定方法。
32、另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述各种可选实现方式中提供的大模型修正结果确定方法。
33、本技术提供的技术方案可以包括以下有益效果:
34、本技术实施例提供的大模型修正结果确定方法,在对目标大模型修正之前,通过涉及多个领域的校验测试集对目标大模型的整体推理能力进行测评,获得第一测评分数;在目标大模型基于目标推理样本推理得到的预测结果有误时,对该目标大模型的大模型数据文件进行修改,通过该校验测试集对修改后的目标大模型进行测评,得到第二测评分数,在第一测评分数与第二测评分数之间的差值小于差值阈值时,确定目标大模型修正成功;通过上述方法,可以在通过对大模型的大模型数据文件进行修改以对大模型进行修正时,能够对大模型数据文件的修改是否对大模型的整体推理能力造成影响进行评估,从而确定是否应用修正后的大模型,以保证大模型整体推理能力的准确性。
35、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。