本说明书实施例涉及深度学习,特别涉及一种任务处理方法。
背景技术:
1、随着深度学习技术的发展,大规模的神经网络模型在多个应用领域的开发、训练和应用得到了极大的提升。
2、目前通过分布式策略实现神经网络模型的数据并行(data parallel)处理,极大提升了神经网络模型的训练和应用的效率。
3、然而,由于神经网络模型是在不同模型框架下开发,不同框架下开发的神经网络模型具有不同的模型框架、不同的模型结构和不同的计算访存特征,对应有不同的分布式策略。针对这样的模型差异,需要以人工分析和标注的方式,确定最适应于神经网络模型的目标分布式策略来分布式部署在多个节点设备上实现数据并行处理,存在通用性不足、扩展性不足和效率不足的问题。因此,亟需一种高通用性、高可扩展性和高效率的任务处理方法。
技术实现思路
1、有鉴于此,本说明书实施例提供了任务处理方法。本说明书一个或者多个实施例同时涉及任务处理装置,计算设备,计算机可读存储介质以及计算机程序,以解决现有技术中存在的技术缺陷。
2、根据本说明书实施例的第一方面,提供了一种任务处理方法,包括:
3、获取待处理任务对应的任务模型,其中,任务模型包括多个算子,算子携带标签执行结果;
4、采用预设划分策略,对第一算子的输入数据进行划分,得到多个输入数据组,其中,第一算子为多个算子中的任一个;
5、调用第一算子对任一输入数据组进行处理,得到任一输入数据组对应的输出数据;
6、采用预设合并策略,对多个输出数据进行合并,获得预测执行结果;
7、在预测执行结果与第一算子携带的标签执行结果一致情况下,基于预设划分策略与预设合并策略,确定第一算子的目标分布式策略,其中,第一算子的目标分布式策略为将第一算子分布式部署在多个节点设备上执行待处理任务的优化策略。
8、根据本说明书实施例的第二方面,提供了另一种任务处理方法,包括:
9、获取待处理任务;
10、调用预先训练的任务模型执行待处理任务,获得任务执行结果,其中,任务模型采用各算子的目标分布式策略进行分布式训练得到,各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略,各算子的目标分布式策略基于预测结果和标签结果的一致性确定,预测结果根据预设划分策略和预设合并策略得到。
11、根据本说明书实施例的第三方面,提供了再一种任务处理方法,应用于云侧设备,包括:
12、接收前端发送的目标推理任务;
13、调用预先训练的任务模型执行目标推理任务,获得推理结果,其中,任务模型采用各算子的目标分布式策略进行分布式训练得到,各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略,各算子的目标分布式策略基于预测结果和标签结果的一致性确定,预测结果根据预设划分策略和预设合并策略得到;
14、将推理结果反馈至前端。
15、根据本说明书实施例的第四方面,提供了一种任务处理装置,包括:
16、第一获取模块,被配置为获取待处理任务对应的任务模型,其中,任务模型包括多个算子,算子携带标签执行结果;
17、第一划分模块,被配置为采用预设划分策略,对第一算子的输入数据进行划分,得到多个输入数据组,其中,第一算子为多个算子中的任一个;
18、第一处理模块,被配置为调用第一算子对任一输入数据组进行处理,得到任一输入数据组对应的输出数据;
19、第一合并模块,被配置为采用预设合并策略,对多个输出数据进行合并,获得预测执行结果;
20、第一确定模块,被配置为在预测执行结果与第一算子携带的标签执行结果一致情况下,基于预设划分策略与预设合并策略,确定第一算子的目标分布式策略,其中,第一算子的目标分布式策略为将第一算子分布式部署在多个节点设备上执行待处理任务的优化策略。
21、根据本说明书实施例的第五方面,提供了另一种任务处理装置,包括:
22、第二获取模块,被配置为获取待处理任务;
23、第二执行模块,被配置为调用预先训练的任务模型执行待处理任务,获得任务执行结果,其中,任务模型采用各算子的目标分布式策略进行分布式训练得到,各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略,各算子的目标分布式策略基于预测结果和标签结果的一致性确定,预测结果根据预设划分策略和预设合并策略得到。
24、根据本说明书实施例的第六方面,提供了再一种任务处理装置,应用于云侧设备,包括:
25、第三接收模块,被配置为接收前端发送的目标推理任务;
26、第三执行模块,被配置为调用预先训练的任务模型执行目标推理任务,获得推理结果,其中,任务模型采用各算子的目标分布式策略进行分布式训练得到,各算子的目标分布式策略为将各算子分布式部署在多个节点设备上执行训练的优化训练策略,各算子的目标分布式策略基于预测结果和标签结果的一致性确定,预测结果根据预设划分策略和预设合并策略得到;
27、第三反馈模块,被配置为将推理结果反馈至前端。
28、根据本说明书实施例的第七方面,提供了一种计算设备,包括:
29、存储器和处理器;
30、所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
31、根据本说明书实施例的第八方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述方法的步骤。
32、根据本说明书实施例的第九方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述方法的步骤。
33、本说明书一个或多个实施例中,获取待处理任务对应的任务模型,其中,任务模型包括多个算子,算子携带标签执行结果;采用预设划分策略,对第一算子的输入数据进行划分,得到多个输入数据组,其中,第一算子为多个算子中的任一个;调用第一算子对任一输入数据组进行处理,得到任一输入数据组对应的输出数据;采用预设合并策略,对多个输出数据进行合并,获得预测执行结果;在预测执行结果与第一算子携带的标签执行结果一致情况下,基于预设划分策略与预设合并策略,确定第一算子的目标分布式策略,其中,第一算子的目标分布式策略为将第一算子分布式部署在多个节点设备上执行待处理任务的优化策略。在任务模型的算子层级上进行了各算子的分布式策略探索,通过一致性匹配检测的方式,摆脱了对特定模型的分布式策略的依赖,无需进行人工分析和标注,就可以自动确定最适应于优化目标的各算子目标分布式策略,来将各算子分布式部署在多个节点设备上,实现数据并行的优化处理,提升了任务处理的通用性、可扩展性和效率。
1.一种任务处理方法,包括:
2.根据权利要求1所述的方法,在所述获得所述任务模型中各算子的目标分布式策略之后,还包括:
3.根据权利要求2所述的方法,所述任务模型为目标模型框架下的神经网络模型;
4.根据权利要求1-3任一项所述的方法,所述采用预设划分策略,对第一算子的输入数据进行划分,得到多个输入数据组,包括:
5.根据权利要求4所述的方法,所述基于所述至少一个预设划分策略与所述至少一个预设合并策略,确定目标划分策略和目标合并策略,包括:
6.根据权利要求5所述的方法,所述基于所述至少一个预设划分策略与所述至少一个预设合并策略,进行线性规划,确定目标划分策略和目标合并策略,包括:
7.根据权利要求4所述的方法,所述基于所述至少一个预设划分策略与所述至少一个预设合并策略,确定目标划分策略和目标合并策略,包括:
8.根据权利要求2所述的方法,所述待处理任务为模型训练任务;
9.根据权利要求2所述的方法,所述待处理任务为推理任务;
10.一种任务处理方法,包括:
11.一种任务处理方法,应用于云侧设备,包括:
12.根据权利要求11所述的方法,在所述将所述推理结果反馈至所述前端之后,还包括:
13.一种计算设备,包括:
14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。