一种问题处理方法、装置、设备和存储介质与流程

文档序号：37544390发布日期：2024-04-08 13:46阅读：12来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明实施例涉及计算机技术，尤其涉及一种问题处理方法、装置、设备和存储介质。

背景技术：

1、随着计算机技术的快速发展，越来越多的语言模型推理框架被研发，用于解决业务中存在的问题。例如，利用思维树(tree of thoughts，tot)框架可以基于推理的思维方式逐步解决问题。

2、然而，在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

3、在利用思维树逐步处理问题时，每个步骤都是选择较优的处理结果，直接舍弃较差的处理结果，从而导致在后续步骤中还会再次产生之前较差的处理结果，进而增加了不必要的计算量以及增加了重复的错误处理链路的产生，降低了问题处理效率。

技术实现思路

1、本发明实施例提供了一种问题处理方法、装置、设备和存储介质，以降低不必要的计算量，减少重复的错误处理链路的产生，从而提高了问题处理效率。

2、第一方面，本发明实施例提供了一种问题处理方法，包括：

3、获取待处理的目标问题描述信息和用于处理目标问题的思维树中的每个处理层对应的处理步骤描述信息；

4、基于预训练语言模型、所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理，确定当前处理层对应的多个当前处理结果；

5、基于所述预训练语言模型对每个当前处理结果进行评估，确定每个当前处理结果对应的当前评估结果；

6、基于当前处理结果对应的当前评估结果，确定当前处理层对应的正例处理结果和负例处理结果；

7、若当前处理层满足预设迭代停止条件，则停止处理层的迭代处理，并基于当前处理层对应的正例处理结果，确定所述目标问题对应的目标答案。

8、第二方面，本发明实施例还提供了一种问题处理装置，包括：

9、描述信息获取模块，用于获取待处理的目标问题描述信息和用于处理目标问题的思维树中的每个处理层对应的处理步骤描述信息；

10、步骤处理模块，用于基于预训练语言模型、所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理，确定当前处理层对应的多个当前处理结果；

11、处理结果评估模块，用于基于所述预训练语言模型对每个当前处理结果进行评估，确定每个当前处理结果对应的当前评估结果；

12、正负例结果确定模块，用于基于当前处理结果对应的当前评估结果，确定当前处理层对应的正例处理结果和负例处理结果；

13、目标答案确定模块，用于若当前处理层满足预设迭代停止条件，则停止处理层的迭代处理，并基于当前处理层对应的正例处理结果，确定所述目标问题对应的目标答案。

14、第三方面，本发明实施例还提供了一种电子设备，所述电子设备包括：

15、一个或多个处理器；

16、存储器，用于存储一个或多个程序；

17、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任意实施例所提供的问题处理方法。

18、第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的问题处理方法。

19、上述发明中的一个实施例具有如下优点或有益效果：

20、通过基于预训练语言模型、待处理的目标问题描述信息、思维树中的当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理，确定当前处理层对应的多个当前处理结果；基于预训练语言模型对每个当前处理结果进行评估，确定每个当前处理结果对应的当前评估结果；基于当前处理结果对应的当前评估结果，确定当前处理层对应的正例处理结果和负例处理结果，在当前处理层满足预设迭代停止条件时，停止处理层的迭代处理，并基于当前处理层对应的正例处理结果确定目标问题对应的目标答案。通过保留历史处理层对应的负例处理结果，并在当前处理层的步骤处理过程中考虑到了历史处理层已经产生的负例处理结果，从而可以避免在当前处理结果中产生之前的负例处理结果，进而降低了不必要的计算量，减少了重复的错误处理链路的产生，提高了问题处理效率。

技术特征：

1.一种问题处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预训练语言模型、所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的正例处理结果链路和历史处理层对应的负例处理结果进行当前处理层的步骤处理，确定当前处理层对应的多个当前处理结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述目标问题描述信息、当前处理层对应的当前处理步骤描述信息、历史处理层对应的每个正例处理结果链路和历史处理层对应的负例处理结果，生成每个正例处理结果链路对应的第一提示信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述对历史处理层对应的负例处理结果进行采样，确定历史处理层对应的每个正例处理结果链路下的预设负例数量的负例处理结果，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述预训练语言模型对每个当前处理结果进行评估，确定每个当前处理结果对应的当前评估结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述预训练语言模型和每个当前处理结果对应的第二提示信息进行评估，确定每个当前处理结果对应的当前评估结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于当前处理结果对应的当前评估结果，确定当前处理层对应的正例处理结果和负例处理结果，包括：

8.一种问题处理装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的问题处理方法。

技术总结
本发明实施例公开了一种问题处理方法、装置、设备和存储介质。该方法包括：获取目标问题描述信息和每个处理层对应的处理步骤描述信息；基于预训练语言模型、目标问题描述信息、当前处理步骤描述信息、历史处理层对应的正例处理结果链路和负例处理结果进行当前处理层的步骤处理，确定当前处理结果；基于预训练语言模型确定当前处理结果对应的当前评估结果；基于当前评估结果确定当前处理层对应的正例处理结果和负例处理结果；若当前处理层满足预设迭代停止条件，则停止迭代处理，并基于当前处理层对应的正例处理结果确定目标答案。通过本发明实施例的技术方案，可以降低不必要的计算量，减少重复的错误处理链路的产生，提高问题处理效率。

技术研发人员：赵宇明,宋阳,何晓冬,陈蒙
受保护的技术使用者：京东城市（北京）数字科技有限公司
技术研发日：
技术公布日：2024/4/7

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵宇明,宋阳,何晓冬,陈蒙
技术所有人：京东城市（北京）数字科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。