任务处理方法、系统、装置、设备及计算机可读存储介质与流程

文档序号：32407115发布日期：2022-12-02 20:43阅读：37来源：国知局

1.本技术涉及资源调度技术领域，特别涉及一种任务处理方法、系统、装置、设备及计算机可读存储介质。

背景技术：

2.边缘计算作为一种近年来新兴的计算范式，通过在移动网络边缘处为终端用户提供算力、存储、缓存等各类服务，从而有效减少网络延迟。由于边缘计算节点的类型多样，如运营商基站中的服务器、智能家居中的个人计算机等设备，因此，边缘网络中的计算资源节点具有异构特性，各节点的性能差异较大。
3.异构计算是一种由使用不同类型的指令集和体系结构的计算单元所组成的计算系统，异构计算中的计算资源包括cpu、gpu、fpga以及asic等多种类型，这些计算资源各自具有明显的功能特性，在计算能力、功耗等方面具有不同的特点，能够适应不同类型的计算任务。在边缘计算中，不同的边缘节点之间具有异构特性，而这些异构边缘节点内部的计算资源往往也具有异构特性，在一个节点内部，会同时包括多种异构计算资源。
4.现有边缘网络资源分配的研究和方法，主要以资源利用效率和用户体验质量等作为衡量资源分配策略优劣的主要指标，进而确定资源分配的最优方案。然而，其主要不足在于，并未考虑边缘网络中计算节点拥有者对收益的需求，在实际场景中，各个边缘节点通常隶属于不同的拥有者，其共享自身计算资源的目的，主要在于利用空闲计算资源来获得相应的收益，实现双赢；同时，现有工作对拥有多种异构计算资源的边缘节点资源分配问题关注较少，对基于异构资源协同处理计算任务的研究还不够充分。
5.因此，如何为计算任务进行更为合理的资源分配，实现任务请求者和资源提供者的双赢是本领域技术人员亟待解决的问题。

技术实现要素：

6.本技术的目的是提供一种任务处理方法，该任务处理方法可以为计算任务进行更为合理的资源分配，实现任务请求者和资源提供者的双赢；本技术的另一目的是提供另一种任务处理方法、任务处理装置及设备、计算机可读存储介质，均具有上述有益效果。
7.第一方面，本技术提供了一种任务处理方法，应用于边缘网络中的计算节点，每一所述计算节点设置有一种或多种异构资源，所述方法包括：接收所述边缘网络下发的资源分配策略；所述资源分配策略包括每一种所述异构资源被分配的关于目标任务的处理量；将所述资源分配策略和本地资源信息输入至预设策略学习模型进行处理，获得资源共享策略；所述资源共享策略包括各所述异构资源的可提供资源，所述预设策略学习模型以所述计算节点的任务处理价值为优化目标训练获得；利用所述资源共享策略执行所述目标任务。
8.可选地，所述利用所述资源共享策略执行所述目标任务之后，还包括：
获取所述目标任务的执行结果；将所述执行结果上报至所述边缘网络。
9.可选地，所述异构资源包括cpu资源、gpu资源、fpga资源。
10.可选地，所述任务处理方法还包括：对所述本地资源信息进行实时监控；当所述本地资源信息满足预设条件时，将所述本地资源信息发布至所述边缘网络。
11.可选地，所述当所述本地资源信息满足预设条件时，将所述本地资源信息发布至所述边缘网络，包括：根据所述本地资源信息确定可用资源；当所述可用资源的资源占比达到预设阈值时，将所述本地资源信息发布至所述边缘网络。
12.可选地，所述本地资源信息包括可用资源和资源提供时间，所述可用资源包括各所述异构资源的当前可用资源。
13.第二方面，本技术提供了另一种任务处理方法，应用于边缘网络，所述边缘网络中的每一计算节点设置有一种或多种异构资源，所述方法包括：根据目标任务的任务信息和各所述计算节点的本地资源信息，确定目标计算节点和资源分配策略；所述资源分配策略包括每一种所述异构资源被分配的关于所述目标任务的处理量；将所述资源分配策略发送至各所述目标计算节点，以使各所述目标计算节点利用预设策略学习模型对所述资源分配策略和所述本地资源信息进行处理，获得资源共享策略，并利用所述资源共享策略执行所述目标任务；所述资源共享策略包括各所述异构资源的可提供资源，所述预设策略学习模型以所述计算节点的任务处理价值为优化目标训练获得。
14.可选地，所述根据目标任务的任务信息和各所述计算节点的本地资源信息，确定目标计算节点，包括：根据所述本地资源信息确定资源提供时间和可用资源；当所述资源提供时间和所述可用资源均满足所述任务信息指示的任务需求时，确定所述计算节点为所述目标计算节点。
15.可选地，所述根据目标任务的任务信息和各所述计算节点的本地资源信息，确定目标计算节点和资源分配策略之前，还包括：统计各所述计算节点发布的所述本地资源信息；其中，所述本地资源信息由所述计算节点在所述本地资源信息满足预设条件时发布至所述边缘网络。
16.可选地，所述任务处理方法还包括：获取所述目标计算节点上传的所述目标任务的执行结果；将所述执行结果反馈至所述目标任务的发起端。
17.第三方面，本技术还公开了一种任务处理系统，包括边缘网络和部署于所述边缘网络中的计算节点，每一所述计算节点设置有一种或多种异构资源，其中，所述边缘网络，用于根据目标任务的任务信息和各所述计算节点的本地资源信
息，确定目标计算节点和资源分配策略，并将所述资源分配策略发送至各所述目标计算节点；所述资源分配策略包括每一种所述异构资源被分配的关于所述目标任务的处理量；所述目标计算节点，用于利用预设策略学习模型对所述资源分配策略和所述本地资源信息进行处理，获得资源共享策略，并利用所述资源共享策略执行所述目标任务；所述资源共享策略包括各所述异构资源的可提供资源，所述预设策略学习模型以所述计算节点的任务处理价值为优化目标训练获得。
18.第四方面，本技术还公开了一种任务处理装置，应用于边缘网络中的计算节点，每一所述计算节点设置有一种或多种异构资源，所述装置包括：接收模块，用于接收所述边缘网络下发的资源分配策略；所述资源分配策略包括每一种所述异构资源被分配的关于目标任务的处理量；处理模块，用于将所述资源分配策略和本地资源信息输入至预设策略学习模型进行处理，获得资源共享策略；所述资源共享策略包括各所述异构资源的可提供资源，所述预设策略学习模型以所述计算节点的任务处理价值为优化目标训练获得；执行模块，用于利用所述资源共享策略执行所述目标任务。
19.第五方面，本技术还公开了另一种任务处理装置，应用于边缘网络，所述边缘网络中的每一计算节点设置有一种或多种异构资源，所述装置包括：确定模块，用于根据目标任务的任务信息和各所述计算节点的本地资源信息，确定目标计算节点和资源分配策略；所述资源分配策略包括每一种所述异构资源被分配的关于所述目标任务的处理量；发送模块，用于将所述资源分配策略发送至各所述目标计算节点，以使各所述目标计算节点利用预设策略学习模型对所述资源分配策略和所述本地资源信息进行处理，获得资源共享策略，并利用所述资源共享策略执行所述目标任务；所述资源共享策略包括各所述异构资源的可提供资源，所述预设策略学习模型以所述计算节点的任务处理价值为优化目标训练获得。
20.第六方面，本技术还公开了一种任务处理设备，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现如上所述的任一种任务处理方法的步骤。
21.第七方面，本技术还公开了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的任一种任务处理方法的步骤。
22.应用本技术所提供的技术方案，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以所述计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
附图说明
23.为了更清楚地说明现有技术和本技术实施例中的技术方案，下面将对现有技术和本技术实施例描述中需要使用的附图作简要的介绍。当然，下面有关本技术实施例的附图描述的仅仅是本技术中的一部分实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图，所获得的其他附图也属于本技术的保护范围。
24.图1为本技术所提供的一种任务处理系统的结构示意图；图2为本技术所提供的一种任务处理方法的流程示意图；图3为本技术所提供的另一种任务处理方法的流程示意图；图4为本技术所提供的又一种任务处理方法的流程示意图；图5为本技术所提供的一种任务处理装置的流程示意图；图6为本技术所提供的另一种任务处理装置的流程示意图；图7为本技术所提供的一种任务处理设备的结构示意图。
具体实施方式
25.本技术的核心是提供一种任务处理方法，该任务处理方法可以为计算任务进行更为合理的资源分配，实现任务请求者和资源提供者的双赢；本技术的另一核心是提供另一种任务处理方法、任务处理装置及设备、计算机可读存储介质，均具有上述有益效果。
26.为了对本技术实施例中的技术方案进行更加清楚、完整地描述，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行介绍。显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
27.需要说明的是，本技术所提供的任务处理方法应用于任务处理系统，该任务处理系统为边缘网络系统。请参考图1，图1为本技术所提供的一种任务处理系统的结构示意图，该任务处理系统包括边缘网络100以及部署于边缘网络的各个计算节点200，其中，边缘网络100用于为计算任务进行资源分配，以将其分配至合适的计算节点100上，以便于基于计算节点100中的计算资源实现任务处理。
28.可以理解的是，边缘计算主要面向万物互联时代的海量终端用户，由终端用户及其设备产生高并发的计算任务请求，由于终端用户设备能力极其有限，因此，利用边缘计算网络中的计算力资源和网络带宽资源，用户可以将计算任务合理的卸载至边缘端，并由边缘网络中的计算节点分配相应的计算资源来处理用户的请求，完成任务处理。
29.本技术实施例提供了一种任务处理方法。
30.请参考图2，图2为本技术所提供的一种任务处理方法的流程示意图，该任务处理方法可应用于边缘网络中的计算节点，每一计算节点设置有一种或多种异构资源，包括如下s101至s103。
31.首先，需要说明的是，本技术实施例所提供的任务处理方法应用于边缘网络中的各个计算节点，即s101至s103的实现流程由边缘网络中的计算节点执行。在边缘网络中，各个计算节点在地理空间中分布部署，其资源提供者来源较为多样，换而言之，计算节点的类型并不唯一，例如，可以是电信运营商等基础设施服务提供商、云计算服务提供商以及接入
到互联网中的个人用户等。
32.其中，每一个计算节点中均包含有一种或多种异构资源，异构资源如上所述cpu、gpu、fpga以及asic等，这些异构资源各自具有明显的功能特性，在计算能力、功耗等方面具有不同的特点，能够适应不同类型的计算任务，例如，cpu善于处理具有顺序逻辑结构的任务，而gpu则对并行任务处理能力较强，fpga则对一些特点场景下的实时计算任务具有较好的处理性能，因此，在面对不同计算任务时，异构资源的处理能力也各有不同。在一种可能的实现方式中，边缘网络中每一个计算节点中的异构资源可以包括cpu资源、gpu资源、fpga资源。
33.s101：接收边缘网络下发的资源分配策略；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；本步骤旨在实现资源分配策略的获取，即接收边缘网络下发的资源分配策略。其中，资源分配策略是针对目标任务的策略，可以由边缘网络结合目标任务的任务需求和边缘网络中各计算节点的本地资源信息构建获得，用于为目标任务分配合理的计算资源，以便于实现目标任务的处理，该目标任务即为用户端发起的需要进行处理的计算任务。
34.其中，资源分配策略相当于初始的分配策略，其中包括有边缘网络中每一种异构资源被分配的关于目标任务的任务量。如上所述，每一个计算节点中均包含有一种或多种异构资源，每一种异构资源被分配的关于目标任务的处理量即为目标任务被分配至各个异构资源的子任务的任务量，该任务量可以为子任务关于目标任务的占比，也可以为子任务的数量。显然，当任务量为子任务占比时，所有异构资源的子任务占比的加和为1；当任务量为子任务数量时，所有异构资源的自任务数量加和为目标任务的总任务量。
35.需要说明的是，接收到边缘网络下发的资源分配策略的计算节点并不唯一，可以为边缘网络基于一定的筛选策略选中的计算节点，因此，在边缘网络中，接收到资源分配策略的计算节点可能为一个，也可能为多个，可能为边缘网络中的部分计算节点，也可能为边缘网络中的全部计算节点，当然，当边缘网络中的所有计算节点均未被选中时，说明当前边缘网络中不存在满足目标任务处理需求的计算节点，可以延迟等待一段时间再进行处理。在此基础上，可以想到的是，资源分配策略中所提到的异构资源是指被选中的各个计算节点的异构资源。
36.s102：将资源分配策略和本地资源信息输入至预设策略学习模型进行处理，获得资源共享策略；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获得；本步骤旨在基于预设策略学习模型实现资源共享策略的计算。首先，在各个计算节点中，均预先创建有适应于自身的策略学习模型，模型的输入为边缘网络下发的资源分配策略和计算节点自身的资源信息（即上述本地资源信息），该本地资源信息主要是指计算节点本身预计提供的可用资源，模型的输出即为资源共享策略。其中，预设策略学习模型是以计算节点的任务处理价值为优化目标训练获得的，该任务处理价值是指计算节点在进行任务处理时所获得的收益，也就是将计算节点的收益需求考虑在内，构建可以使得计算节点的任务处理价值达到最大化的预设策略学习模型，换而言之，基于该预设策略学习模型学习得到的资源共享策略，可以使得计算节点的任务处理收益达到最大化，以便于实现任务请求者和资源提供者的双赢。
37.进一步，预设策略学习模型输出资源共享策略即为最终的分配策略，其中包括有当前计算节点内部各异构资源的可提供资源，这里的可提供资源是指为处理当前目标任务所提供的资源，具体可以是每一种异构资源中为处理当前目标任务提供的资源与自身实际提供的可用资源的占比。
38.当然，当接收到资源分配策略的计算节点为多个时，每一个接收到资源分配策略的计算节点均会输出一个适用于自身的资源共享策略，且每一个资源共享策略均明确指示了自身计算节点内部各异构资源为目标任务提供的计算资源，由此，基于被选中的各个计算节点中各异构资源实际提供的计算资源即可实现目标任务的处理。
39.s103：利用资源共享策略执行目标任务。
40.本步骤旨在实现目标任务的执行，即基于资源共享策略执行目标任务。当然，此处执行目标任务具体为利用资源共享策略中指示的各异构资源的可提供资源执行该目标任务。可以理解的是，由于目标任务可能是由多个计算节点中的各个异构资源共同执行，因此，资源共享策略中的“共享”，是指执行目标任务的各个计算节点中的各个异构资源在执行目标任务期间可以进行信息共享，进而保证目标任务可以被执行完毕以及保证目标任务执行结果的准确性。
41.可见，本技术实施例所提供的任务处理方法，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以所述计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
42.在本技术的一个实施例中，上述利用资源共享策略执行目标任务之后，还可以包括如下步骤：获取目标任务的执行结果；将执行结果上报至边缘网络。
43.本技术实施例所提供的任务处理方法还可以进一步实现执行结果反馈功能。在基于资源共享策略执行完毕目标任务之后，还可以统计目标任务的执行结果，以便于将执行结果上报至边缘网络，从而实现执行结果的反馈。更进一步的，边缘网络还可以将执行结果反馈至目标任务的发起方。
44.在本技术的一个实施例中，该任务处理方法还可以包括如下步骤：对本地资源信息进行实时监控；当本地资源信息满足预设条件时，将本地资源信息发布至边缘网络。
45.如上所述，资源分配策略可以由边缘网络结合目标任务的任务需求和边缘网络中各计算节点的本地资源信息构建获得，因此，边缘网络在构建资源分配策略之前，需要先对各计算节点的本地资源信息进行获取。
46.其中，本地资源信息是由相应的计算节点发布至边缘网络中的，并且，各个计算节点将本地资源信息发布至边缘网络中，是在本地资源信息满足预设条件的情况下执行的，
当本地资源信息不满足自身的预设条件时，将不会进行本地资源信息的发布。因此，各个计算节点可以对自身的本地资源信息进行实时监控，并在本地资源信息满足预设条件时，将其发布至边缘网络。其中，预设条件则是由计算节点的拥有者根据自身实际需求预先设定的发布条件，并不唯一，本技术对此不做限定。
47.在本技术的一个实施例中，上述当本地资源信息满足预设条件时，将本地资源信息发布至边缘网络，包括如下步骤：根据本地资源信息确定可用资源；当可用资源的资源占比达到预设阈值时，将本地资源信息发布至边缘网络。
48.本技术实施例提供了一种具体类型的预设条件，即计算节点中的可用资源的资源占比达到预设阈值，其中，可用资源是指计算节点中的空闲资源，资源占比则是指空闲资源占总资源的比例。
49.在对本地资源信息进行实时统计的过程中，还可以进一步根据本地资源信息确定可用资源，并统计可用资源的资源占比，当该资源占比达到预设阈值时，说明自身可以为其他终端的计算任务提供计算资源，因此，可以进行本地资源信息的发布；反之，当资源占比未达到预设阈值时，说明自身无法为其他终端的计算任务提供计算资源，因此，不进行本地资源信息的发布。当然，预设阈值的取值并不影响本技术方案的实施，由计算节点的拥有者根据实际需求进行设置即可，本技术对此不做限定。
50.在本技术的一个实施例中，本地资源信息可以包括可用资源和资源提供时间，可用资源包括可以各异构资源的当前可用资源。
51.本技术实施例提供了一种具体类型的本地资源信息。首先，要想实现任务处理，计算节点的可用资源需要满足目标任务的实际需求；其次，计算节点的所有者对资源的分享意愿有时会随时间的变化而产生波动，如当某计算节点较为空闲时，则该计算节点的拥有者更倾向于分享其空闲资源，为其它用户进行服务，并获得一定的奖励或收益，因此，计算节点的资源提供时间也应当满足目标任务的实际需求。基于此，本地资源信息具体可以包括自身的可用资源和资源提供时间，其中，可用资源则包括自身内部各类异构资源的当前可用资源。
52.本技术实施例提供了另一种任务处理方法。
53.请参考图3，图3为本技术所提供的另一种任务处理方法的流程示意图，该任务处理方法可应用于边缘网络，边缘网络中的每一计算节点设置有一种或多种异构资源，包括如下s201和s202。
54.首先，需要说明的是，本技术实施例所提供的任务处理方法应用于边缘网络，即s201和s202的实现流程由边缘网络执行。
55.s201：根据目标任务的任务信息和各计算节点的本地资源信息，确定目标计算节点和资源分配策略；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；本步骤旨在实现目标计算节点和资源分配策略的确定。其中，目标计算节点即为从边缘网络中选中的用于实现目标任务处理的计算节点，资源分配策略则是针对目标任务的策略，用于为目标任务分配合理的计算资源，以便于实现目标任务的处理，该目标任务即为用户端发起的需要进行处理的计算任务。
56.在实现过程中，边缘网络在接收到待处理的目标任务时，可以先统计该目标任务
的任务信息，包括但不限于任务类型、任务目标、计算资源需求量等信息；然后统计边缘网络中各个计算节点的本地资源信息，该本地资源信息可以包括但不限于计算节点本身预计提供的可用资源、提供可用资源的时间限制等信息；最后，结合目标任务的任务信息和各计算节点的本地资源信息从众多计算节点中筛选确定目标计算节点，并构建获得资源分配策略。
57.其中，资源分配策略相当于初始的分配策略，其中包括有边缘网络中每一种异构资源被分配的关于目标任务的任务量。可以理解的是，每一个计算节点中均包含有一种或多种异构资源，其中，每一种异构资源被分配的关于目标任务的处理量即为目标任务被分配至各个异构资源的子任务的任务量，该任务量可以为子任务关于目标任务的占比，也可以为子任务的数量。显然，当任务量为子任务占比时，所有异构资源的子任务占比的加和为1；当任务量为子任务数量时，所有异构资源的自任务数量加和为目标任务的总任务量。
58.需要说明的是，目标计算节点的数量并不唯一，可能为一个，也可能为多个，可能为边缘网络中的部分计算节点，也可能为边缘网络中的全部计算节点，当然，没有确定任何一个目标计算节点时，说明当前边缘网络中不存在满足目标任务处理需求的计算节点，可以延迟等待一段时间再进行处理。在此基础上，可以想到的是，资源分配策略中所提到的异构资源是指被筛选确定的各个目标计算节点的异构资源。
59.s202：将资源分配策略发送至各目标计算节点，以使各目标计算节点利用预设策略学习模型对资源分配策略和本地资源信息进行处理，获得资源共享策略，并利用资源共享策略执行目标任务；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获得。
60.本步骤旨在实现资源分配策略的下发，即将资源分配策略下发至各个目标计算节点中，由各个目标计算节点基于该资源分配策略实现目标任务的执行。其中，每一个目标计算节点执行目标任务的实现流程如下：首先，在边缘网络的各个计算节点中，均预先创建有适应于自身的策略学习模型，对于目标计算节点而言，模型的输入为边缘网络下发的资源分配策略和目标计算节点自身的资源信息（即上述本地资源信息），该本地资源信息主要是指目标计算节点本身预计提供的可用资源，模型的输出即为资源共享策略。其中，预设策略学习模型是以计算节点的任务处理价值为优化目标训练获得的，该任务处理价值是指计算节点在进行任务处理时所获得的收益，也就是将计算节点的收益需求考虑在内，构建可以使得计算节点的任务处理价值达到最大化的预设策略学习模型，换而言之，基于该预设策略学习模型学习得到的资源共享策略，可以使得计算节点的任务处理收益达到最大化，以便于实现任务请求者和资源提供者的双赢。
61.进一步，预设策略学习模型输出资源共享策略即为最终的分配策略，其中包括有当前目标计算节点内部各异构资源的可提供资源，这里的可提供资源是指为处理当前目标任务所提供的资源，具体可以是每一种异构资源中为处理当前目标任务提供的资源与自身实际提供的可用资源的占比。
62.当然，当目标计算节点为多个时，每一个目标计算节点均会输出一个适用于自身的资源共享策略，且每一个资源共享策略均明确指示了自身计算节点内部各异构资源为目标任务提供的计算资源，由此，基于各个目标计算节点中各异构资源实际提供的计算资源
即可实现目标任务的处理。
63.最后，即可基于资源共享策略执行目标任务。当然，此处执行目标任务具体为利用资源共享策略中指示的各异构资源的可提供资源执行该目标任务。可以理解的是，由于目标任务可能是由多个目标计算节点中的各个异构资源共同执行，因此，资源共享策略中的“共享”，是指执行目标任务的各个目标计算节点中的各个异构资源在执行目标任务期间可以进行信息共享，进而保证目标任务可以被执行完毕以及保证目标任务执行结果的准确性。
64.可见，本技术实施例所提供的任务处理方法，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
65.在本技术的一个实施例中，上述根据目标任务的任务信息和各计算节点的本地资源信息，确定目标计算节点，可以包括如下步骤：根据本地资源信息确定资源提供时间和可用资源；当资源提供时间和可用资源均满足任务信息指示的任务需求时，确定计算节点为目标计算节点。
66.本技术实施例提供了一种筛选确定目标计算节点的实现方法。首先，要想实现任务处理，目标计算节点的可用资源需要满足目标任务的实际需求；其次，计算节点的所有者对资源的分享意愿有时会随时间的变化而产生波动，如当某计算节点较为空闲时，则该计算节点的拥有者更倾向于分享其空闲资源，为其它用户进行服务，并获得一定的奖励或收益，因此，目标计算节点的资源提供时间也应当满足目标任务的实际需求。
67.在此基础上，在实现过程中，在获得各个计算节点的本地资源信息之后，可以先根据该本地资源信息确定对应计算节点的资源提供时间和可用资源，然后判断这二者是否满足目标任务的任务信息中指示的任务需求，并在满足任务需求时将当前计算节点确认为目标计算节点。当有任何一类信息不满足任务需求时，则不会被确认为目标计算节点。
68.当然，上述选择标准仅为本技术实施例所提供的一种实现方式，并不唯一，具体可以根据资源提供者和任务请求者的实际需求进行设定，本技术对此不做限定。
69.在本技术的一个实施例中，上述根据目标任务的任务信息和各计算节点的本地资源信息，确定目标计算节点和资源分配策略之前，还可以包括如下步骤：统计各计算节点发布的本地资源信息；其中，本地资源信息由计算节点在本地资源信息满足预设条件时发布至边缘网络。
70.可以理解的是，资源分配策略由边缘网络基于目标任务的任务信息和各计算节点的本地资源信息构建获得，因此，边缘网络在构建资源分配策略之前，需要先对各计算节点的本地资源信息进行获取。其中，本地资源信息是由相应的计算节点发布至边缘网络中的，因此，边缘网络在接收到目标任务时可以直接抓取各个计算节点发布的本地资源信息。
71.此外，各个计算节点将本地资源信息发布至边缘网络中，是在本地资源信息满足预设条件的情况下执行的，当本地资源信息不满足自身的预设条件时，将不会进行本地资源信息发布。其中，预设条件则是由计算节点的拥有者根据自身实际需求预先设定的发布条件，并不唯一，例如，可以为自身的空闲资源占比达到预设阈值以上，当前时间满足预先设定的资源共享时间等。
72.在本技术的一个实施例中，该任务处理方法还可以包括如下步骤：获取目标计算节点上传的目标任务的执行结果；将执行结果反馈至目标任务的发起端。
73.本技术实施例所提供的任务处理方法还可以进一步实现执行结果反馈功能，该执行结果即为目标任务的执行结果。对于各目标计算节点而言，其在执行完成目标任务之后，可以进一步将执行结果上报至边缘网络；对于边缘网络而言，其在接收到目标计算节点上传的执行结果之后，即可将最终的执行结果反馈至目标任务的发起端。
74.本技术实施例提供了又一种任务处理方法。
75.请参考图4，图4为本技术所提供的又一种任务处理方法的流程示意图，该任务处理方法可包括如下步骤：1、分布式边缘网络异构计算资源主动发现策略。各分布式的边缘计算节点，根据自身运行状态及可用资源情况，主动适时地向边缘网络发布资源状态标签；2、基于异构计算的用户任务资源组合分配策略。根据当前用户的计算任务请求信息，以及当前边缘网络中获得的计算资源状态标签，统计各类异构计算资源的可调度情况，得到关于该计算任务的异构计算资源组合分配方案。
76.3、异构计算节点资源共享策略学习。利用多智能体策略学习技术，各异构边缘节点根据上一步给出的异构计算资源组合分配方案，输出自身的计算资源共享策略。
77.上述各步骤的具体实现流程如下：1、分布式边缘网络异构计算资源主动发现策略。
78.在边缘计算网络中，各个边缘计算节点在地理空间中分布部署，其资源提供者来源较为多样，这些边缘计算节点通常具有异构性，不同边缘计算节点能够提供的计算资源的能力和类型可能存在差异。此外，所有者对计算资源的分享意愿也随时间的变化而产生波动。因此，可以根据一定的策略，主动的将边缘网络中的异构计算资源进行共享和发现。
79.（1）边缘节点计算资源标签设置：以标签的形式，边缘计算节点所有者对其所拥有的异构计算资源进行描述，其标签可以表示为如下多元组：；其中，表示边缘计算节点用来进行主动资源发现的标签，表示该边缘计算节点可以发布标签的阈值，该阈值可以为当前所有可用计算资源占该边缘计算节点实际拥有的计算资源总量的百分比，表示拥有者设定的可以进行资源共享的时段，，，分别表示该边缘计算节点当前可以利用的cpu、gpu以及fpga计算资源的情况。
80.（2）资源主动发现策略：在该边缘计算节点上，常态运行资源发布模块，用来实时监控自身各类异构资源的利用情况以及当前时间，当满足发布条件时，该模块主动向边缘网络中发布标签，以表示此时该边缘计算节点上的计算资源可以在时间范围内被共享，且可共享的资源类型及大小分别为，，。
81.2、基于异构计算的用户任务资源组合分配策略。
82.当边缘网络中产生计算任务（目标任务）时，任务调度模块基于可用的异构计算资源，针对该用户的计算任务进行资源组合分配，以提高边缘网络资源利用率，并满足用户计算任务的各项约束要求，提高用户的体验质量。
83.（1）异构计算资源信息收集。任务调度模块首先根据当前各计算节点主动发布的标签，统计各类异构计算资源的可调度情况，筛选在用户计算任务完成时段内可以利用的计算节点；在此条件下，统计可以被调度的异构计算资源是否能够满足用户计算任务，若可以，则进行下一步，否则该计算任务无法被满足。
84.（2）异构资源组合分配策略生成。根据各类计算资源处理单位计算任务时所需要的消耗，以及用户计算任务的大小，可以得到基于异构计算资源组合的多个分配策略。假设cpu、gpu以及fpga分别处理单位计算任务量所需的资源消耗为实数，，，某产生于时刻的计算任务的总任务量为实数，且该计算任务可以被划分为多个实数部分，其中分别对应cpu、gpu以及fpga所处理的任务量为实数，，，在此条件下计算任务总的消耗为：；相应的限制条件为：；；其中，，表示针对该计算任务约束项的真实值，，，分别表示该时刻的计算任务对应于cpu、gpu、fpga等异构计算资源的约束因子，则异构计算资源的组合分配策略应该在满足任务约束项及计算任务总量的条件下，尽可能的降低总消耗，优化边缘网络的平均开销，并提升用户体验质量。求解该目标函数最优解的过程可以表示为线性规划问题，利用线性规划求解器对上述目标函数求解即可得到最优的异构计算资源组合策略。
85.3、异构计算节点资源共享策略学习。
86.利用多智能体策略学习技术，各边缘计算节点根据上一步骤中得到的最优资源组合策略，学习得到自身的资源分配策略。在当前边缘计算节点集合中，各边缘计算节点通过将部分计算资源进行共享，用于当前计算任务的处理，并获得相应的收益。
87.对于集合中的边缘计算节点，设其对当前计算任务的资源共享策略为：；其中，，，分别为其预计分配给当前计算任务的各类异构计算资源（cpu、gpu、fpga）占其自身当前可用资源的比例，均为0至1之间的实数，且满足：；；；即各边缘计算节点分享的计算资源能够满足计算任务的最优异构资源分配策略。各边缘计算节点的策略学习目标为生成最优的资源共享策略，使其能够最大化当前获得的收益：；；；；其中，，，分别表示其异构资源共享给当前计算任务所获得的奖励。奖励表示资源拥有者将自身拥有的各类异构计算资源提供给任务处理时能够获得的收益，且每个资源拥有者都追求其所获得的收益最大化。上式中，，的分别表示单位异构计算资源处理任务时能够获得的奖励值，即衡量共享某一类资源时的基础收益，为正实数。一般来说，异构资源对不同类型的计算任务处理能力表现不同，因此，需要通过设置面对计算任务时异构资源的单位收益来进一步提高对资源的使用效率以及提高资源拥有者的收益水平。
88.利用多智能体策略学习技术，对每个边缘计算节点的资源共享策略进行学习，采用集中训练、分布执行的机制。设置边缘计算节点的策略学习网络（预设策略学习模型）为，网络参数为，其输入为当前计算任务的异构计算资源组合分配策略以及该边缘计算节点的当前可用异构计算资源，策略学习网络的输出为资源共享决策。
89.此外，每个边缘计算节点设置单独的价值评价网络，其参数为，为了得到最优的共享决策输出，需要对的参数进行训练，每个边缘计算节点的训练过程如下：
（1）将边缘计算节点获取到的状态信息作为本地决策网络的输入，得到当前输出，执行动作，系统则转换到新的状态以及相应的收益，将保存在集合；（2）当集合中的记录数大于，从集合中采样次，计算目标价值：；其中，表示所有边缘计算节点观测到的下一个环境信息，为0到1之间的实数，表示折扣因子；（3）根据最小化损失函数来更新各边缘计算节点的价值评价网络的参数，最小化损失函数为：；其中，表示所有边缘计算节点观测到的当前环境信息；（4）策略学习网络的更新梯度为：；（5）训练收敛或达到指定的训练次数后，完成训练，并将部署在边缘计算节点中，生成当前边缘计算节点的资源共享策略。
90.可见，本技术实施例所提供的任务处理方法，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以所述计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
91.本技术实施例提供了一种任务处理系统。
92.如图1所示，该任务处理系统可以包括边缘网络100和部署于边缘网络100中的计算节点200，每一计算节点200设置有一种或多种异构资源，其中，边缘网络100，用于根据目标任务的任务信息和各计算节点200的本地资源信息，确定目标计算节点200和资源分配策略，并将资源分配策略发送至各目标计算节点200；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；目标计算节点200，用于利用预设策略学习模型对资源分配策略和本地资源信息进行处理，获得资源共享策略，并利用资源共享策略执行目标任务；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获
得。
93.可见，本技术实施例所提供的任务处理系统，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
94.对于本技术实施例提供的系统的介绍请参照上述方法实施例，本技术在此不做赘述。
95.本技术实施例提供了一种任务处理装置。
96.请参考图5，图5为本技术所提供的一种任务处理装置的结构示意图，该任务处理装置可应用于边缘网络中的计算节点，每一计算节点设置有一种或多种异构资源，包括：接收模块1，用于接收边缘网络下发的资源分配策略；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；处理模块2，用于将资源分配策略和本地资源信息输入至预设策略学习模型进行处理，获得资源共享策略；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获得；执行模块3，用于利用资源共享策略执行目标任务。
97.可见，本技术实施例所提供的任务处理装置，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
98.在本技术的一个实施例中，该任务处理装置还可以包括上报模块，用于在上述利用资源共享策略执行目标任务之后，获取目标任务的执行结果；将执行结果上报至边缘网络。
99.在本技术的一个实施例中，上述异构资源可以包括cpu资源、gpu资源、fpga资源。
100.在本技术的一个实施例中，该任务处理装置还可以包括发布模块，用于对本地资源信息进行实时监控；当本地资源信息满足预设条件时，将本地资源信息发布至边缘网络。
101.在本技术的一个实施例中，上述发布模块可具体用于根据本地资源信息确定可用资源；当可用资源的资源占比达到预设阈值时，将本地资源信息发布至边缘网络。
102.在本技术的一个实施例中，上述本地资源信息可以包括可用资源和资源提供时间，可用资源可以包括各异构资源的当前可用资源。
103.对于本技术实施例提供的装置的介绍请参照上述方法实施例，本技术在此不做赘
述。
104.本技术实施例提供了另一种任务处理装置。
105.请参考图6，图6为本技术所提供的另一种任务处理装置的结构示意图，该任务处理装置可应用于边缘网络，边缘网络中的每一计算节点设置有一种或多种异构资源，包括：确定模块4，用于根据目标任务的任务信息和各计算节点的本地资源信息，确定目标计算节点和资源分配策略；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；发送模块5，用于将资源分配策略发送至各目标计算节点，以使各目标计算节点利用预设策略学习模型对资源分配策略和本地资源信息进行处理，获得资源共享策略，并利用资源共享策略执行目标任务；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获得。
106.可见，本技术实施例所提供的任务处理装置，在边缘网络的各个计算节点中预先部署策略学习模型，并基于该预设策略学习模型实现资源共享策略的确定，从而利用该资源共享策略实现任务处理，由于预设策略学习模型是以计算节点的任务处理价值为优化目标进行训练获得的，因此，基于获得资源共享策略进行任务处理可以使得计算节点的任务处理价值得到最大化，并保证任务处理完毕，从而实现任务请求者和资源提供者的双赢；此外，由边缘网络创建资源分配策略，再由计算节点基于资源分配策略学习得到资源分配策略，且资源分配策略和资源共享策略均将计算节点中的异构资源考虑在内，进一步实现了计算节点内部异构资源的合理分配。
107.在本技术的一个实施例中，上述确定模块4可具体用于根据本地资源信息确定资源提供时间和可用资源；当资源提供时间和可用资源均满足任务信息指示的任务需求时，确定计算节点为目标计算节点。
108.在本技术的一个实施例中，该任务处理装置还可以包括统计模块，用于在上述根据目标任务的任务信息和各计算节点的本地资源信息，确定目标计算节点和资源分配策略之前，统计各计算节点发布的本地资源信息；其中，本地资源信息由计算节点在本地资源信息满足预设条件时发布至边缘网络。
109.在本技术的一个实施例中，该任务处理装置还可以包括反馈模块，用于获取目标计算节点上传的目标任务的执行结果；将执行结果反馈至目标任务的发起端。
110.对于本技术实施例提供的装置的介绍请参照上述方法实施例，本技术在此不做赘述。
111.本技术实施例提供了一种任务处理设备。
112.请参考图7，图7为本技术所提供的一种任务处理设备的结构示意图，该任务处理设备可包括：存储器，用于存储计算机程序；处理器，用于执行计算机程序时可实现如上述任意一种任务处理方法的步骤。
113.如图7所示，为任务处理设备的组成结构示意图，任务处理设备可以包括：处理器10、存储器11、通信接口12和通信总线13。处理器10、存储器11、通信接口12均通过通信总线13完成相互间的通信。
114.在本技术实施例中，处理器10可以为中央处理器（central processing unit，
cpu）、特定应用集成电路、数字信号处理器、现场可编程门阵列或者其他可编程逻辑器件等。
115.处理器10可以调用存储器11中存储的程序，具体的，处理器10可以执行任务处理方法的实施例中的操作。
116.存储器11中用于存放一个或者一个以上程序，程序可以包括程序代码，程序代码包括计算机操作指令，在本技术实施例中，存储器11中至少存储有用于实现以下功能的程序：接收边缘网络下发的资源分配策略；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；将资源分配策略和本地资源信息输入至预设策略学习模型进行处理，获得资源共享策略；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获得；利用资源共享策略执行目标任务；或者，根据目标任务的任务信息和各计算节点的本地资源信息，确定目标计算节点和资源分配策略；资源分配策略包括每一种异构资源被分配的关于目标任务的处理量；将资源分配策略发送至各目标计算节点，以使各目标计算节点利用预设策略学习模型对资源分配策略和本地资源信息进行处理，获得资源共享策略，并利用资源共享策略执行目标任务；资源共享策略包括各异构资源的可提供资源，预设策略学习模型以计算节点的任务处理价值为优化目标训练获得。
117.在一种可能的实现方式中，存储器11可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统，以及至少一个功能所需的应用程序等；存储数据区可存储使用过程中所创建的数据。
118.此外，存储器11可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件或其他易失性固态存储器件。
119.通信接口12可以为通信模块的接口，用于与其他设备或者系统连接。
120.当然，需要说明的是，图7所示的结构并不构成对本技术实施例中任务处理设备的限定，在实际应用中任务处理设备可以包括比图7所示的更多或更少的部件，或者组合某些部件。
121.本技术实施例提供了一种计算机可读存储介质。
122.本技术实施例所提供的计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时可实现如上述任意一种任务处理方法的步骤。
123.该计算机可读存储介质可以包括：u盘、移动硬盘、只读存储器（read-only memory，rom）、随机存取存储器（random access memory，ram）、磁碟或者光盘等各种可以存储程序代码的介质。
124.对于本技术实施例提供的计算机可读存储介质的介绍请参照上述方法实施例，本技术在此不做赘述。
125.说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而
言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
126.专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
127.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器（ram）、内存、只读存储器（rom）、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom或技术领域内所公知的任意其它形式的存储介质中。
128.以上对本技术所提供的技术方案进行了详细介绍。本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以对本技术进行若干改进和修饰，这些改进和修饰也落入本技术的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张亚强李茹杨邓琪李雪雷赵雅倩李仁刚
技术所有人：山东海量信息技术研究院
我是此专利的发明人

上一篇：透水铺装结构的制作方法
上一篇：一种户外的林园小动物居所的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。