prompt获取方法、基于大模型的任务执行方法和装置与流程

文档序号：37422190发布日期：2024-03-25 19:09阅读：21来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及数据处理领域，尤其涉及自然语言处理和深度学习等人工智能领域，适用于大模型。

背景技术：

1、随着技术的发展，人们可以通过大语言模型实现自然语言处理任务的执行，在大语言模型执行自然语言处理任务的过程中，需要获取任务对应的提示信息(prompt)，以使得大模型可以输出任务的准确执行结果。

2、相关技术中，可以通过用户自行对待执行任务进行任务执行要求的分析，并根据分析结果通过用户自身的语言组织能力为待执行任务构建对应的prompt。

3、在该场景下，prompt的构建对于用户的语言组织能力存在一定程度的依赖性，实用性和适用性欠佳。

技术实现思路

1、本公开提出了一种prompt获取方法、基于大模型的任务执行方法和装置。

2、根据本公开的第一方面，提出了一种prompt获取方法，方法包括：获取大模型待执行的目标任务，并获取所述目标任务的目标任务信息；获取预设置的prompt模板，并根据所述目标任务信息和所述prompt模板构建所述目标任务的候选prompt；通过所述大模型对所述候选prompt进行测试，得到所述候选prompt的prompt测试结果；响应于所述prompt测试结果指示所述候选prompt不存在异常，确定所述候选prompt为所述目标任务的目标prompt。

3、根据本公开的第二方面，提出了一种基于大模型的任务执行方法，方法包括：获取大模型待执行的目标任务和所述目标任务的目标prompt，其中，所述目标prompt通过上述第一方面提出的prompt获取方法得到；获取所述目标任务的目标任务数据，并将所述目标任务数据和所述目标prompt输入所述大模型，得到所述大模型输出的所述目标任务的目标任务执行结果。

4、根据本公开的第三方面，提出了一种prompt获取装置，装置包括：第一获取模块，用于获取大模型待执行的目标任务，并获取所述目标任务的目标任务信息；构建模块，用于获取预设置的prompt模板，并根据所述目标任务信息和所述prompt模板构建所述目标任务的候选prompt；测试模块，用于通过所述大模型对所述候选prompt进行测试，得到所述候选prompt的prompt测试结果；确定模块，用于响应于所述prompt测试结果指示所述候选prompt不存在异常，确定所述候选prompt为所述目标任务的目标prompt。

5、根据本公开的第四方面，提出了一种基于大模型的任务执行装置，装置包括：第二获取模块，用于获取大模型待执行的目标任务和所述目标任务的目标prompt，其中，所述目标prompt通过上述第三方面提出的prompt获取装置得到；执行模块，用于获取所述目标任务的目标任务数据，并将所述目标任务数据和所述目标prompt输入所述大模型，得到所述大模型输出的所述目标任务的目标任务执行结果。

6、根据本公开的第五方面，提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的prompt获取方法和/或第二方面提出的基于大模型的任务执行方法。

7、根据本公开的第六方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述第一方面提出的prompt获取方法和/或第二方面提出的基于大模型的任务执行方法。

8、根据本公开的第七方面，提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面提出的prompt获取方法和/或第二方面提出的基于大模型的任务执行方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种prompt获取方法，其中，所述方法包括：

2.根据权利要求1所述的方法，其中，所述通过所述大模型对所述候选prompt进行测试，得到所述候选prompt的prompt测试结果，包括：

3.根据权利要求2所述的方法，其中，所述根据所述任务测试结果，识别所述候选prompt是否存在异常，以得到所述候选prompt的prompt测试结果，包括：

4.根据权利要求3所述的方法，其中，所述响应于识别到所述任务测试结果存在异常，确定所述候选prompt存在异常，并将异常作为所述候选prompt的所述prompt测试结果之后，包括：

5.根据权利要求4所述的方法，其中，所述获取所述任务测试结果中的异常信息，并根据所述异常信息对所述候选prompt进行修改，得到修改后的候选prompt，包括：

6.根据权利要求1所述的方法，其中，所述根据所述目标任务信息构建所述目标任务的候选prompt，包括：

7.根据权利要求6所述的方法，其中，所述空白prompt模板中的所述空白项，至少包括所述目标任务的任务总结文本，所述大模型的输出结果的输出格式，所述目标任务的分解操作步骤的步骤数量，所述分解操作步骤的步骤操作要求，所述分解操作步骤的步骤操作内容，所述目标任务的历史参考任务信息，以及所述大模型输出结果的参考条件。

8.一种大模型的任务执行方法，其中，所述方法包括：

9.一种prompt获取装置，其中，所述装置包括：

10.根据权利要求9所述的装置，其中，所述测试模块，还用于：

11.根据权利要求10所述的装置，其中，所述测试模块，还用于：

12.根据权利要求11所述的装置，其中，所述测试模块，还用于：

13.根据权利要求12所述的装置，其中，所述测试模块，还用于：

14.根据权利要求9所述的装置，其中，所述构建模块，还用于：

15.根据权利要求14所述的装置，其中，所述空白prompt模板中的所述空白项，至少包括所述目标任务的任务总结文本，所述大模型的输出结果的输出格式，所述目标任务的分解操作步骤的步骤数量，所述分解操作步骤的步骤操作要求，所述分解操作步骤的步骤操作内容，所述目标任务的历史参考任务信息，以及所述大模型输出结果的参考条件。

16.一种大模型的任务执行装置，其中，所述装置包括：

17.一种电子设备，包括：

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7和/或权利要求8中任一项所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7和/或权利要求8中任一项所述的方法。

技术总结
本公开提出了一种prompt获取方法、基于大模型的任务执行方法和装置，涉及自然语言处理和深度学习等人工智能领域，适用于大模型，包括：获取大模型待执行的目标任务，并获取所述目标任务的目标任务信息；获取预设置的prompt模板，并根据所述目标任务信息和所述prompt模板构建所述目标任务的候选prompt；通过所述大模型对所述候选prompt进行测试，得到所述候选prompt的prompt测试结果；响应于所述prompt测试结果指示所述候选prompt不存在异常，确定所述候选prompt为所述目标任务的目标prompt。

技术研发人员：王欢
受保护的技术使用者：百度（中国）有限公司
技术研发日：
技术公布日：2024/3/24

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王欢
技术所有人：百度（中国）有限公司
我是此专利的发明人

上一篇：货箱结构和车辆的制作方法
上一篇：一种用于地理测绘的户外测绘仪的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。