任务处理方法、计算设备及计算机可读存储介质与流程

文档序号：37186214发布日期：2024-03-01 12:50阅读：11来源：国知局

本说明书实施例涉及深度学习，特别涉及一种任务处理方法。

背景技术：

1、随着深度学习技术的发展，大规模的神经网络模型在多个应用领域的开发、训练和应用得到了极大的提升。

2、目前通过分布式策略实现神经网络模型的数据并行(data parallel)处理，极大提升了神经网络模型的训练和应用的效率。

3、然而，由于神经网络模型是在不同模型框架下开发，不同框架下开发的神经网络模型具有不同的模型框架、不同的模型结构和不同的计算访存特征，对应有不同的分布式策略。针对这样的模型差异，需要以人工分析和标注的方式，确定最适应于神经网络模型的目标分布式策略来分布式部署在多个节点设备上实现数据并行处理，存在通用性不足、扩展性不足和效率不足的问题。因此，亟需一种高通用性、高可扩展性和高效率的任务处理方法。

技术实现思路

1、有鉴于此，本说明书实施例提供了任务处理方法。本说明书一个或者多个实施例同时涉及任务处理装置，计算设备，计算机可读存储介质以及计算机程序，以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面，提供了一种任务处理方法，包括：

3、获取待处理任务对应的任务模型，其中，任务模型包括多个算子，算子携带标签执行结果；

4、采用预设划分策略，对第一算子的输入数据进行划分，得到多个输入数据组，其中，第一算子为多个算子中的任一个；

5、调用第一算子对任一输入数据组进行处理，得到任一输入数据组对应的输出数据；

6、采用预设合并策略，对多个输出数据进行合并，获得预测执行结果；

7、在预测执行结果与第一算子携带的标签执行结果一致情况下，基于预设划分策略与预设合并策略，确定第一算子的目标分布式策略，其中，第一算子的目标分布式策略为将第一算子分布式部署在多个节点设备上执行待处理任务的优化策略。

8、根据本说明书实施例的第二方面，提供了另一种任务处理方法，包括：

9、获取待处理任务；

10、调用预先训练的任务模型执行待处理任务，获得任务执行结果，其中，任务模型采用各算子的目标分布式策略进行分布式训练得到，各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略，各算子的目标分布式策略基于预测结果和标签结果的一致性确定，预测结果根据预设划分策略和预设合并策略得到。

11、根据本说明书实施例的第三方面，提供了再一种任务处理方法，应用于云侧设备，包括：

12、接收前端发送的目标推理任务；

13、调用预先训练的任务模型执行目标推理任务，获得推理结果，其中，任务模型采用各算子的目标分布式策略进行分布式训练得到，各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略，各算子的目标分布式策略基于预测结果和标签结果的一致性确定，预测结果根据预设划分策略和预设合并策略得到；

14、将推理结果反馈至前端。

15、根据本说明书实施例的第四方面，提供了一种任务处理装置，包括：

16、第一获取模块，被配置为获取待处理任务对应的任务模型，其中，任务模型包括多个算子，算子携带标签执行结果；

17、第一划分模块，被配置为采用预设划分策略，对第一算子的输入数据进行划分，得到多个输入数据组，其中，第一算子为多个算子中的任一个；

18、第一处理模块，被配置为调用第一算子对任一输入数据组进行处理，得到任一输入数据组对应的输出数据；

19、第一合并模块，被配置为采用预设合并策略，对多个输出数据进行合并，获得预测执行结果；

20、第一确定模块，被配置为在预测执行结果与第一算子携带的标签执行结果一致情况下，基于预设划分策略与预设合并策略，确定第一算子的目标分布式策略，其中，第一算子的目标分布式策略为将第一算子分布式部署在多个节点设备上执行待处理任务的优化策略。

21、根据本说明书实施例的第五方面，提供了另一种任务处理装置，包括：

22、第二获取模块，被配置为获取待处理任务；

23、第二执行模块，被配置为调用预先训练的任务模型执行待处理任务，获得任务执行结果，其中，任务模型采用各算子的目标分布式策略进行分布式训练得到，各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略，各算子的目标分布式策略基于预测结果和标签结果的一致性确定，预测结果根据预设划分策略和预设合并策略得到。

24、根据本说明书实施例的第六方面，提供了再一种任务处理装置，应用于云侧设备，包括：

25、第三接收模块，被配置为接收前端发送的目标推理任务；

26、第三执行模块，被配置为调用预先训练的任务模型执行目标推理任务，获得推理结果，其中，任务模型采用各算子的目标分布式策略进行分布式训练得到，各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略，各算子的目标分布式策略基于预测结果和标签结果的一致性确定，预测结果根据预设划分策略和预设合并策略得到；

27、第三反馈模块，被配置为将推理结果反馈至前端。

28、根据本说明书实施例的第七方面，提供了一种计算设备，包括：

29、存储器和处理器；

30、所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述方法的步骤。

31、根据本说明书实施例的第八方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现上述方法的步骤。

32、根据本说明书实施例的第九方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述方法的步骤。

33、本说明书一个或多个实施例中，获取待处理任务对应的任务模型，其中，任务模型包括多个算子，算子携带标签执行结果；采用预设划分策略，对第一算子的输入数据进行划分，得到多个输入数据组，其中，第一算子为多个算子中的任一个；调用第一算子对任一输入数据组进行处理，得到任一输入数据组对应的输出数据；采用预设合并策略，对多个输出数据进行合并，获得预测执行结果；在预测执行结果与第一算子携带的标签执行结果一致情况下，基于预设划分策略与预设合并策略，确定第一算子的目标分布式策略，其中，第一算子的目标分布式策略为将第一算子分布式部署在多个节点设备上执行待处理任务的优化策略。在任务模型的算子层级上进行了各算子的分布式策略探索，通过一致性匹配检测的方式，摆脱了对特定模型的分布式策略的依赖，无需进行人工分析和标注，就可以自动确定最适应于优化目标的各算子目标分布式策略，来将各算子分布式部署在多个节点设备上，实现数据并行的优化处理，提升了任务处理的通用性、可扩展性和效率。

技术特征：

1.一种任务处理方法，包括：

2.根据权利要求1所述的方法，在所述获得所述任务模型中各算子的目标分布式策略之后，还包括：

3.根据权利要求2所述的方法，所述任务模型为目标模型框架下的神经网络模型；

4.根据权利要求1-3任一项所述的方法，所述采用预设划分策略，对第一算子的输入数据进行划分，得到多个输入数据组，包括：

5.根据权利要求4所述的方法，所述基于所述至少一个预设划分策略与所述至少一个预设合并策略，确定目标划分策略和目标合并策略，包括：

6.根据权利要求5所述的方法，所述基于所述至少一个预设划分策略与所述至少一个预设合并策略，进行线性规划，确定目标划分策略和目标合并策略，包括：

7.根据权利要求4所述的方法，所述基于所述至少一个预设划分策略与所述至少一个预设合并策略，确定目标划分策略和目标合并策略，包括：

8.根据权利要求2所述的方法，所述待处理任务为模型训练任务；

9.根据权利要求2所述的方法，所述待处理任务为推理任务；

10.一种任务处理方法，包括：

11.一种任务处理方法，应用于云侧设备，包括：

12.根据权利要求11所述的方法，在所述将所述推理结果反馈至所述前端之后，还包括：

13.一种计算设备，包括：

14.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。

技术总结
本说明书实施例提供任务处理方法、计算设备及计算机可读存储介质，其中所述任务处理方法包括：获取待处理任务对应的任务模型；采用预设划分策略，对第一算子的输入数据进行划分，得到多个输入数据组；调用第一算子对任一输入数据组进行处理，得到任一输入数据组对应的输出数据；采用预设合并策略，对多个输出数据进行合并，获得预测执行结果；在预测执行结果与第一算子携带的标签执行结果一致情况下，基于预设划分策略与预设合并策略，确定第一算子的目标分布式策略。在算子层级上进行了分布式策略探索，自动确定最适应于优化目标的各算子目标分布式策略，用于实现数据并行的优化处理，提升了任务处理的通用性、可扩展性和效率。

技术研发人员：程盛淦,刁岚松,林伟
受保护的技术使用者：杭州阿里云飞天信息技术有限公司
技术研发日：
技术公布日：2024/2/29

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程盛淦,刁岚松,林伟
技术所有人：杭州阿里云飞天信息技术有限公司
我是此专利的发明人

上一篇：一种电解制氢用气液分离器及其系统的制作方法
上一篇：一种空调器的控制方法和空调器与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。