本发明实施例涉及计算机技术,尤其涉及一种问题处理方法、装置、设备和存储介质。
背景技术:
1、随着计算机技术的快速发展,越来越多的语言模型推理框架被研发,用于解决业务中存在的问题。例如,利用思维树(tree of thoughts,tot)框架可以基于推理的思维方式逐步解决问题。
2、然而,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
3、在利用思维树逐步处理问题时,每个步骤都是选择较优的处理结果,直接舍弃较差的处理结果,从而导致在后续步骤中还会再次产生之前较差的处理结果,进而增加了不必要的计算量以及增加了重复的错误处理链路的产生,降低了问题处理效率。
技术实现思路
1、本发明实施例提供了一种问题处理方法、装置、设备和存储介质,以降低不必要的计算量,减少重复的错误处理链路的产生,从而提高了问题处理效率。
2、第一方面,本发明实施例提供了一种问题处理方法,包括:
3、获取待处理的目标问题描述信息和用于处理目标问题的思维树中的每个处理层对应的处理步骤描述信息;
4、基于预训练语言模型、所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理,确定当前处理层对应的多个当前处理结果;
5、基于所述预训练语言模型对每个当前处理结果进行评估,确定每个当前处理结果对应的当前评估结果;
6、基于当前处理结果对应的当前评估结果,确定当前处理层对应的正例处理结果和负例处理结果;
7、若当前处理层满足预设迭代停止条件,则停止处理层的迭代处理,并基于当前处理层对应的正例处理结果,确定所述目标问题对应的目标答案。
8、第二方面,本发明实施例还提供了一种问题处理装置,包括:
9、描述信息获取模块,用于获取待处理的目标问题描述信息和用于处理目标问题的思维树中的每个处理层对应的处理步骤描述信息;
10、步骤处理模块,用于基于预训练语言模型、所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理,确定当前处理层对应的多个当前处理结果;
11、处理结果评估模块,用于基于所述预训练语言模型对每个当前处理结果进行评估,确定每个当前处理结果对应的当前评估结果;
12、正负例结果确定模块,用于基于当前处理结果对应的当前评估结果,确定当前处理层对应的正例处理结果和负例处理结果;
13、目标答案确定模块,用于若当前处理层满足预设迭代停止条件,则停止处理层的迭代处理,并基于当前处理层对应的正例处理结果,确定所述目标问题对应的目标答案。
14、第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
15、一个或多个处理器;
16、存储器,用于存储一个或多个程序;
17、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的问题处理方法。
18、第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的问题处理方法。
19、上述发明中的一个实施例具有如下优点或有益效果:
20、通过基于预训练语言模型、待处理的目标问题描述信息、思维树中的当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理,确定当前处理层对应的多个当前处理结果;基于预训练语言模型对每个当前处理结果进行评估,确定每个当前处理结果对应的当前评估结果;基于当前处理结果对应的当前评估结果,确定当前处理层对应的正例处理结果和负例处理结果,在当前处理层满足预设迭代停止条件时,停止处理层的迭代处理,并基于当前处理层对应的正例处理结果确定目标问题对应的目标答案。通过保留历史处理层对应的负例处理结果,并在当前处理层的步骤处理过程中考虑到了历史处理层已经产生的负例处理结果,从而可以避免在当前处理结果中产生之前的负例处理结果,进而降低了不必要的计算量,减少了重复的错误处理链路的产生,提高了问题处理效率。
1.一种问题处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于预训练语言模型、所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理,确定当前处理层对应的多个当前处理结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的每个正例处理结果链路和历史处理层对应的负例处理结果,生成每个正例处理结果链路对应的第一提示信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述对历史处理层对应的负例处理结果进行采样,确定历史处理层对应的每个正例处理结果链路下的预设负例数量的负例处理结果,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述预训练语言模型对每个当前处理结果进行评估,确定每个当前处理结果对应的当前评估结果,包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述预训练语言模型和每个当前处理结果对应的第二提示信息进行评估,确定每个当前处理结果对应的当前评估结果,包括:
7.根据权利要求1所述的方法,其特征在于,所述基于当前处理结果对应的当前评估结果,确定当前处理层对应的正例处理结果和负例处理结果,包括:
8.一种问题处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的问题处理方法。