一种数据处理方法、装置、电子设备及存储介质与流程

文档序号:37280123发布日期:2024-03-12 21:18阅读:18来源:国知局
一种数据处理方法、装置、电子设备及存储介质与流程

本发明涉及人工智能领域,特别涉及一种数据处理方法、装置、电子设备及存储介质。


背景技术:

1、随着深度学习技术的不断发展,用于处理自然语言的大语言模型(l ar g elanguage model,llm)得到了越来越广泛的应用,然而随着大语言模型规模的不断增大,微调的成本变得越来越高,对于不断增加的大规模的参数,仅依靠传统微调技术已经很难对模型起到有效的迁移,且越来越大的参数量使得梯度的反向传播的代价也急剧增加。在这样的背景下,提示学习应运而生。提示学习通过改造下游任务、增加专家知识等形式,使得目标任务的输入输出更加贴合原始语言模型训练时的数据。

2、思维链(chain-of-thought,cot)的是一种改进的提示策略,用于提高大语言在复杂推理任务中的性能,cot的核心思想是将推理过程分解为一系列中间推理步骤,每个步骤都建立在前一个步骤的基础上。这种层层递进的推理链类似于思维中的逻辑连续性,帮助模型更好地理解问题并生成更有说服力的答案。大型语言模型在各种推理任务中受益于“思维链”提示,拥有了一定的处理复杂的问题的能力,特别使其具有了完成数理任务上的潜力。

3、然而,虽然引入了思维链,但是大型语言模型在解决各种数理问题时依然有较高概率出现中间步骤的错误,或者没有找到正确的推理方向,导致无法得到正确结果。一方面,大型语言模型在推理过程中对中间推理步骤的强调可能会无意中引入幻觉和累积错误,而且语言模型难以自动识别并纠错;另一方面,不同类型的数理问题可能适合不同的推理方式,而思维链的模式相对单一。


技术实现思路

1、为此,本发明提供了一种基于大语言模型的数据处理方法、装置、电子设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。

2、根据本发明的一个方面,提供一种基于大语言模型的数据处理方法,适于在电子设备中执行,所述方法包括:

3、获取待处理问题;根据第一思维推理方式对所述待处理问题进行推理,获得第一思维推理结果;根据第二思维推理方式对所述待处理问题进行推理,获得第二思维推理结果,所述第二思维方式是与第一思维推理方式不同的思维方式;根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果。

4、在一个示例中,所述待处理问题的目标推理结果为所述第一思维推理结果和第二思维推理结果中的一个。

5、进一步地,所述根据第一思维推理方式对所述待处理问题进行推理,获得第一思维推理结果,包括:获取第一思维推理提示词。根据第一思维推理提示词对所述待处理问题进行逐步推理,生成每一步的第一局部推理结果。在生成每一步的第一局部推理结果后,对该步的第一局部推理结果进行第一检验处理,获得所述该步的第一检验结果;其中,若所述该步的第一检验结果为未通过,则删除所述该步的第一局部推理结果,并重新生成所述该步的第一局部推理结果;否则,继续下一步推理,直至推理结束,获得第一思维推理结果。

6、在一个示例中,所述在生成每一步的第一局部推理结果后,对该步的第一局部推理结果进行第一检验处理,获得所述该步的第一检验结果,包括:获取第一检验提示词。获取第一检验对象,其中所述第一检验对象包括该步的第一局部推理结果。根据所述第一检验提示词对所述第一检验对象进行该步的第一检验处理,获得该步的第一检验对象检验结果;其中,若所述第一检验对象检验结果为未通过,则删除所述第一检验对象,重新获取新的所述第一检验对象,对新的所述第一检验对象进行第一检验处理,以获得新的所述第一检验对象检验结果;若所述第一检验对象检验结果仍为不通过,则重复前述步骤直至该步的所述第一检验对象检验结果为通过;若该步的所述第一检验对象检验结果连续为未通过的次数达到第一预定值,则将该步的所述第一检验对象检验结果设置为通过,并选择其中最近一次的第一局部推理结果作为该步的第一局部推理结果。

7、在一个示例中,所述根据第二思维推理方式对所述待处理问题进行推理,获得第二思维推理结果,包括:获取第二思维推理提示词。根据第二思维推理提示词对所述待处理问题进行逐步推理,生成每一步的第二局部推理结果。在生成每一步的第二局部推理结果后,对该步的第二局部推理结果进行第二检验处理,获得所述该步的第二检验结果;其中,若所述该步的第二检验结果为未通过,则删除所述该步的第二局部推理结果,并重新生成所述该步的第二局部推理结果;否则,继续下一步推理,直至推理结束,获得第二思维推理结果。

8、在一个示例中,所述在生成每一步的第二局部推理结果后,对该步的第二局部推理结果进行第二检验处理,获得所述该步的第二检验结果,包括:获取第二检验提示词。获取第二检验对象,其中所述第二检验对象包括该步的第二局部推理结果。根据所述第二检验提示词对所述第二检验对象进行该步的第二检验处理,获得该步的第二检验对象检验结果;其中,若所述第二检验对象检验结果为未通过,则删除所述第二检验对象,重新获取新的所述第二检验对象,对新的所述第二检验对象进行第二检验处理,以获得新的所述第二检验对象检验结果;若所述第二检验对象检验结果仍为不通过,则重复前述步骤直至该步的所述第二检验对象检验结果为通过;若该步的所述第二检验对象检验结果连续为未通过的次数达到第二预定值,则将该步的所述第二检验对象检验结果设置为通过,并选择其中最近一次的第二局部推理结果作为该步的第二局部推理结果。

9、在一个示例中,所述第一检验处理包括事实检查、逻辑检查和数据计算检查,其中,所述事实检查是指对当前推理步骤中引用的证据是否符合事实进行检验,所述逻辑检查是指对当前推理步骤使用的逻辑是否正确进行检验,所述计算检查是指对当前推理步骤的计算结果是否正确进行检验;当且仅当所述事实检查、所述逻辑检查和所述数据计算检查均为通过时,所述第一检验结果为通过,否则所述第一检验结果为未通过。

10、在另一个示例中,所述第二检验处理包括事实检查、逻辑检查和数据计算检查,其中,所述事实检查是指对当前推理步骤中引用的证据是否符合事实进行检验,所述逻辑检查是指对当前推理步骤使用的逻辑是否正确进行检验,所述计算检查是指对当前推理步骤的计算结果是否正确进行检验;当且仅当所述事实检查、所述逻辑检查和所述数据计算检查均为通过时,所述第二检验结果为通过,否则所述第二检验结果为未通过。

11、在一个示例中,所述根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果,包括:获取目标结果选择提示词。根据所述目标结果选择提示词、所述第一思维推理结果、所述第二思维推理结果获得所述目标推理结果。进一步地,所述根据第一思维推理方式对所述待处理问题进行推理,以及所述根据第二思维推理方式对所述待处理问题进行推理,均系基于大语言模型执行。

12、在一个示例中,所述待处理问题为数理问题。在一个示例中,所述第一思维推理方式为正向推理,所述第二思维推理方式为逆向推理。

13、根据本发明的又一个方面,提供一种数据处理装置,所述装置包括:

14、数据获取模块,用于获取待处理问题。第一数据推理模块,根据第一思维推理方式对所述待处理问题进行推理,获得第一思维推理结果。第二数据推理模块,根据第二思维推理方式对所述待处理问题进行推理,获得第二思维推理结果。目标数据推理模块,根据所述第一思维推理结果和第二思维推理结果生成所述待处理问题的目标推理结果。

15、根据本发明的又一个方面,提供一种电子设备,包括:至少一个处理器;以及存储器,存储有程序指令,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执行如上的任一项方法的指令。

16、根据本发明的又一方面,提供一种存储有程序指令的可读存储介质,当程序指令被计算设备读取并执行时,使得计算设备执行如上的任一项所述的方法。

17、根据本发明的基于大模型的数据处理方法,将待处理问题根据两种思维推理方式进行推理,分别获得第一思维推理结果和第二思维推理结果,最终根据两个推理结果综合判断获得最终的目标推理结果,从而,有效避免了现有思维链单一推理方式对复杂问题的输出出现幻觉、不精准、以偏概全等问题,尤其避免了在数理问题推理中,找不到正确的推理方向、无法给出正确答案的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1