任务的调度方法和装置与流程

文档序号:31861010发布日期:2022-10-19 04:53阅读:101来源:国知局
任务的调度方法和装置与流程

1.本公开涉及计算机技术领域,具体涉及信息流、云计算、任务调度领域,尤其涉及任务的调度方法和装置。


背景技术:

2.任务调度是指系统为了自动完成特定任务,在约定的特定时刻去执行任务的过程。有了任务调度即可解放更多的人力,而是由系统自动去执行任务。任务调度设计是系统的骨架,它是决定系统能否最大化利用硬件性能的因素之一。
3.在相关技术中,可以对需要调度的各个任务,确定执行的优先级,并按照优先级对应的执行顺序,执行各个任务。


技术实现要素:

4.提供了一种任务的调度方法、装置、电子设备以及存储介质。
5.根据第一方面,提供了一种任务的调度方法,包括:获取待调度的任务,其中,待调度的任务存在任务评价参数,任务评价参数包括以下至少两项:任务属性、任务血缘关系、任务资源信息;确定待调度的任务的每个任务评价参数的得分;对于每个待调度的任务,根据该任务的任务评价参数的得分和权重,确定该任务的总得分;按照总得分,对待调度的任务确定执行优先级,根据执行优先级对待调度的任务进行调度。
6.根据第二方面,提供了一种任务的调度装置,包括:获取单元,被配置成获取待调度的任务,其中,待调度的任务存在任务评价参数,任务评价参数包括以下至少两项:任务属性、任务血缘关系、任务资源信息;确定单元,被配置成确定待调度的任务的每个任务评价参数的得分;评分单元,被配置成对于每个待调度的任务,根据该任务的任务评价参数的得分和权重,确定该任务的总得分;调度单元,被配置成按照总得分,对待调度的任务确定执行优先级,根据执行优先级对待调度的任务进行调度。
7.根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行任务的调度方法中任一实施例的方法。
8.根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行根据任务的调度方法中任一实施例的方法。
9.根据第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据任务的调度方法中任一实施例的方法。
10.根据本公开的方案,可以通过各种任务评价参数,对任务进行较为全面的评价,从而对任务的优先级进行准确判断,有助于提高任务的调度准确性。
附图说明
11.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它
特征、目的和优点将会变得更明显:
12.图1是本公开一些实施例可以应用于其中的示例性系统架构图;
13.图2是根据本公开的任务的调度方法的一个实施例的流程图;
14.图3是根据本公开的任务的调度方法的又一个实施例的流程图;
15.图4是根据本公开的任务的调度装置的一个实施例的结构示意图;
16.图5是用来实现本公开实施例的任务的调度方法的电子设备的框图。
具体实施方式
17.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
18.本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
19.需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
20.图1示出了可以应用本公开的任务的调度方法或任务的调度装置的实施例的示例性系统架构100。
21.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
22.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
23.这里的终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
24.服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的待调度的任务等数据进行分析等处理,并将处理结果(例如待调度的任务的执行优先级或调度结果)反馈给终端设备。
25.需要说明的是,本公开实施例所提供的任务的调度方法可以由服务器105或者终端设备101、102、103执行,相应地,任务的调度装置可以设置于服务器105或者终端设备101、102、103中。
26.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
27.继续参考图2,示出了根据本公开的任务的调度方法的一个实施例的流程200。该任务的调度方法,包括以下步骤:
28.步骤201,获取待调度的任务,其中,待调度的任务存在任务评价参数,其中,任务评价参数包括以下至少两项:任务属性、任务血缘关系、任务资源信息。
29.在本实施例中,任务的调度方法运行于其上的执行主体(例如图1所示的服务器或终端设备)可以获取待调度的任务。具体地,该任务可以是各种任务,比如图像处理任务、文字处理任务、表格处理任务等等。不同种的任务可以存在调度优先级的差异,比如在执行时可以对初始优先级进行调整。
30.在任务调度的顺序不同时,调度时设备的内存占用和设备运行资源占用存在差异。
31.每个任务评价参数可以对应任务的一个标签。任务评价参数用于评价任务的得分,进而评价任务的调度优先级。
32.任务属性可以包括以下至少一项:任务类型、执行队列、执行引擎、执行周期、运行规则。其中,任务类型比如可以包括标准任务类型和工作流任务类型。执行引擎可以包括任意的计算引擎(比如hive引擎、spark引擎、mapreduce引擎、flink引擎和python引擎等)。
33.任务血缘关系指任务之间的关联。具体地,任务血缘关系可以包括以下至少一项:上下游任务数量、任务业务等级、任务的服务级别(sla,service-level agreement)。
34.资源信息指与任务执行时所占用的资源相关的信息。比如,资源信息可以包括以下至少一项:任务执行日志、资源申请量(设定的内存占用量)、任务每次执行所消耗的内存量。
35.步骤202,确定待调度的任务的每个任务评价参数的得分。
36.在本实施例中,任务存在至少两个任务评价参数。上述执行主体可以确定待调度的任务的每项任务评价参数的得分。上述执行主体可以采用各种方式确定得分。比如,上述执行主体可以将该任务的任务评价参数的值(velue)输入指定模型,并得到从该指定模型输出的得分。该指定模型可以利用任务评价参数的值,预测任务评价参数的得分。
37.步骤203,对于每个待调度的任务,根据该任务的任务评价参数的得分和权重,确定该任务的总得分。
38.在本实施例中,任务的每个任务评价参数,都确定出了得分。这样,可以对于该任务的各个任务评价参数的得分和权重进行加权,将加权结果作为各个任务评价参数的总得分,也即该任务的总得分。
39.或者,上述执行主体也可以在加权后,对于加权结果进行预设处理,比如乘以预设系数或者输入预设模型,并将预设处理结果作为总得分。
40.在实践中,上述执行主体可以采用预设模型,确定总得分。比如,该预设模型可以是网页级别pagerank模型。
41.步骤204,按照总得分,对待调度的任务确定执行优先级,根据执行优先级对待调度的任务进行调度。
42.在本实施例中,上述执行主体可以采用各种方式按照总得分,对待调度的任务确定执行优先级。比如,上述执行主体可以直接将总得分确定为执行优先级。或者,上述执行主体可以获取总得分与执行优先级之间的对应关系(比如对应关系表或预置模型)。该对应关系指示总得分高的任务优先级高。之后,上述执行主体可以获取所确定的总得分对应的优先级。
43.本公开的上述实施例提供的方法通过各种任务评价参数,对任务进行较为全面的评价,从而对任务的优先级进行准确判断,有助于提高任务的调度准确性。
44.在本公开任一实施例的一些可选的实现方式中,任务资源信息包括资源占用趋势;资源占用趋势的确定步骤包括:获取待调度的任务的资源趋势相关信息,其中,资源趋势相关信息包括任务的资源申请量、任务的历史资源占用量;将资源趋势相关信息输入资源趋势确定模型,得到待调度的任务的资源占用趋势,其中,资源趋势确定模型为自回归滑动平均模型。
45.在这些可选的实现方式中,上述执行主体或者其它执行主体可以执行资源占用趋势的确定步骤。以上述执行主体为例,上述执行主体可以获取待调度的任务的资源趋势相关信息。资源趋势相关信息是与任务对内存资源进行占用的趋势相关的信息。具体地,资源趋势相关信息可以包括资源申请量。此外,资源趋势相关信息还可以包括任务的历史资源占用量,比如任务在过去每次执行所占用的内存量、或者任务在从当前开始的、过去的历史时长内每次执行所占用的内存量。
46.上述执行主体可以采用自回归滑动平均模型(arma模型,auto-regressive and moving average model)作为资源趋势确定模型,预测资源占用趋势。该自回归滑动平均模型可以由自回归模型(简称ar模型)与滑动平均模型(简称ma模型)组成。此外,上述执行主体还可以采用其它模型预测资源占用趋势,比如聚类模型。
47.这些实现方式可以通过自回归滑动平均模型,准确地确定出任务的资源占用趋势,有助于提高任务调度的准确度。
48.进一步参考图3,其示出了任务的调度方法的又一个实施例的流程300。该流程300,包括以下步骤:
49.步骤301,获取待调度的任务,其中,待调度的任务存在任务评价参数,任务评价参数包括以下至少两项:任务属性、任务血缘关系、任务资源信息。
50.步骤302,确定待调度的任务的每个任务评价参数的得分。
51.步骤303,对于每个待调度的任务,根据该任务的任务评价参数的得分和权重,确定该任务的总得分。
52.步骤304,对于待调度的任务,确定总得分对应的初始优先级,根据执行优先级对待调度的任务进行调度,其中,若第一任务的总得分高于第二任务的总得分,则第一任务的初始优先级高于或等于第二任务的初始优先级。
53.在本实施例中,任务的调度方法运行于其上的执行主体(例如图1所示的服务器或终端设备)可以确定总得分对应的初始优先级。总得分与初始优先级之间可以存在对应关系。上述执行主体可以根据该对应关系,确定总得分对应的初始优先级。总得分与初始优先级之间可以存在正比关系。
54.步骤305,响应于待调度的任务的执行等级为预设高执行等级,提高初始优先级,得到待调度的任务的执行优先级。
55.在本实施例中,上述执行主体可以在任务的执行等级是高执行等级时,提高初始优先级,这样,提高后所得到的执行优先级高于初始优先级。
56.提高的规则可以是各种各样的。比如等级越高,则优先级的提高幅度可以越大。再比如,在执行等级为预设的高执行等级时,可以直接将该任务的执行优先级确定为最高级。
load,etl)工具、数据接口比如javaapi、消息对列(比如java消息服务,java message service,jms)、数据转移比如采用sqoop工具、文件采集比如采用flume、数据抽取如采用kafka、网络爬虫如nutch等采集方式将各业务系统数据抽取到数据仓库。采集过程中经过数据清洗、标准化处理最终落入分布式文件系统比如hadoop的分布式文件系统hdfs。同时还有经过网络爬虫所爬取的外部数据一并进入仓库。etl工具常规应用于离线数据的抽取,通过使用数据库直连方式,采用t+1方式每日抽取上一天的业务数据。流式数据则采用flume、kafka等实时技术对实时日志binlog信息进行解析,获取业务系统实时资源管理器比如yarn(yet another resource negotiator)的消费数据。该层级可以进行各种信息的获取,比如该信息可以包括任务池中待调度的任务、任务类型、任务执行日志等等。
73.数据存储层承接数据采集层,数据存储层一般有大数据存储比如hdfs和关系型数据库两者。hadoop集群是一个分布式系统基础架构。hdfs则是该框架最核心的设计。hdfs为海量的数据提供了存储。mapreduce作为hadoop的核心计算引擎,则为海量的数据提供了计算。所获取的信息可以在数据存储层进行存储。
74.数据计算层包括离线计算和实时计算。其中,离线计算不仅可以包括mapreduce等算法,还有大数据平台的flink、spark等技术或作为算法的计算引擎,支撑算法模型层中算法的加工和计算。
75.算法模型层可以包括资源预测模型和任务评分模型。算法模型层包括资源预测模型和任务评分模型,资源预测模型又包含资源趋势预测模型、资源占用模型。其中,资源占用模型可以是逆向神经网络比如bp(back propagation)神经网络,资源占用模型用来判断任务未来资源走势。任务评分模型包含链路评估模型、随机森林模型等。链路评估模型是二分网络。随机森林是根据任务血缘的树状网络识别关键路径,作为资源趋势预测的依据。基于以上模型实现对调度任务的动态调度。如上任务标签包含任务的属性信息、血缘信息和资源信息。各任务间血缘关系,如上下游依赖层级,父子任务数量,任务sla等,这些信息可以通过底层任务系统中调取,利用树状网络评估模型,该模型通过采集血缘网络中链路的节点数据,最终得到树状拓扑结构图。
76.调度任务层的主要职能是通过调度接口服务,接收算法模型结果,并提交到资源管理器也即资源安全审计接口yarn来获得任务的动态调度执行。其次,调度任务层还包含工作流调度接口比如oozie及服务协调接口比如zookeeper。
77.本实施例可以通过各个处理层级,执行任务的调度流程,确保任务的精准调度。
78.进一步参考图4,作为对上述各图所示方法的实现,本公开提供了一种任务的调度装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,除下面所记载的特征外,该装置实施例还可以包括与图2所示的方法实施例相同或相应的特征或效果。该装置具体可以应用于各种电子设备中。
79.如图4所示,本实施例的任务的调度装置400包括:获取单元401、确定单元402、评分单元403和调度单元404。其中,获取单元401,被配置成获取待调度的任务,其中,待调度的任务存在任务评价参数,任务评价参数包括以下至少两项:任务属性、任务血缘关系、任务资源信息;确定单元402,被配置成确定待调度的任务的每个任务评价参数的得分;评分单元403,被配置成对于每个待调度的任务,根据该任务的任务评价参数的得分和权重,确定该任务的总得分;调度单元404,被配置成按照总得分,对待调度的任务确定执行优先级,
根据执行优先级对待调度的任务进行调度。
80.在本实施例中,任务的调度装置400的获取单元401、确定单元402、评分单元403和调度单元404的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202、步骤203和步骤204的相关说明,在此不再赘述。
81.在本实施例的一些可选的实现方式中,任务资源信息包括资源占用趋势;资源占用趋势的确定步骤包括:获取待调度的任务的资源趋势相关信息,其中,资源趋势相关信息包括任务的资源申请量、任务的历史资源占用量;将资源趋势相关信息输入资源趋势确定模型,得到待调度的任务的资源占用趋势,其中,资源趋势确定模型为自回归滑动平均模型。
82.在本实施例的一些可选的实现方式中,任务血缘关系包括树状拓扑结构图;任务血缘关系的确定步骤包括:利用待调度的任务之间的任务关系信息,生成以任务为节点的树状拓扑结构图,其中,任务关系信息包括以下至少一项:父子任务数量、任务的服务级别,待调度的任务的等级越高,则待调度的任务的任务血缘关系的得分越高。
83.在本实施例的一些可选的实现方式中,每个任务在多个任务执行等级中存在对应的一个执行等级,任务关系信息还包括上下游依赖任务的数量、上下游依赖任务的等级;待调度的任务的上下游依赖任务的数量越少,则待调度的任务的任务血缘关系的得分越高;待调度的任务的上下游依赖任务的等级越高,则待调度的任务的任务血缘关系的得分越高。
84.在本实施例的一些可选的实现方式中,调度单元,进一步被配置成按照如下方式执行按照总得分,对待调度的任务确定执行优先级:对于待调度的任务,确定总得分对应的初始优先级,其中,若第一任务的总得分高于第二任务的总得分,则第一任务的初始优先级高于或等于第二任务的初始优先级;响应于待调度的任务的执行等级为预设高执行等级,提高初始优先级,得到待调度的任务的执行优先级。
85.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
86.图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
87.如图5所示,设备500包括计算单元501,其可以根据存储在只读存储器(rom)502中的计算机程序或者从存储单元508加载到随机访问存储器(ram)503中的计算机程序,来执行各种适当的动作和处理。在ram 503中,还可存储设备500操作所需的各种程序和数据。计算单元501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
88.设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如
因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
89.计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如任务的调度方法。例如,在一些实施例中,任务的调度方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到ram 503并由计算单元501执行时,可以执行上文描述的任务的调度方法的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行任务的调度方法。
90.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
91.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
92.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
93.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
94.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据
服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
95.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
96.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
97.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1