一种智能资源编排模型的训练方法与流程

文档序号:30386106发布日期:2022-06-11 10:06阅读:196来源:国知局
一种智能资源编排模型的训练方法与流程

1.本技术属于计算机技术领域,尤其涉及一种智能资源编排模型的训练方法。


背景技术:

2.随着5g与智慧化应用的快速发展,网络中的设备数与数据量迅速增加,传统中心化云计算难以满足快速发展的新应用的需要。为了能够提供低延迟、高质量的计算服务,将网络边缘的计算能力整合起来,现有技术中会将网络边缘的计算能力整合起来,根据不同的计算集群的性能、参数等来合理分配不同的资源,确定出合理的资源编排策略。
3.但是,传统网络资源管理在进行资源编排时,主要基于手工、最优化算法或者启发式方法,复杂性高且自适应能力差,很难满足边缘计算用户的海量、动态与差异化的需求。一些基于人工智能的资源编排虽然能够获得更好的效果,但需要全局资源信息,这对于分散、自组织的边缘计算集群常常难以实现。


技术实现要素:

4.本技术实施例提供了一种智能资源编排模型的训练方法,可以解决传统网络资源管理在进行资源编排时,主要基于手工、最优化算法或者启发式方法,复杂性高且自适应能力差,很难满足边缘计算用户的海量、动态与差异化的需求的问题。
5.第一方面,本技术实施例提供了一种智能资源编排模型的训练方法,应用于控制设备,所述方法包括:
6.获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型;
7.接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息;
8.根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型。
9.进一步地,所述根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型,包括:
10.根据预设解密规则对所述第二加密信息进行解密,得到各所述计算集群对应的更新信息;
11.根据所有所述更新信息对所述全局资源编排模型进行训练,得到新的全局资源编排模型。
12.进一步地,初始的全局资源编排模型的训练方法包括:
13.获取第一样本训练集;所述第一样本训练集中包括历史任务信息及其对应的资源编排策略标签;
14.根据所述第一样本训练集对原始资源编排模型进行训练,得到初始的全局资源编排模型。
15.进一步地,所述样本训练集中还包括预设特殊情况任务信息及其对应的资源编排策略标签。
16.进一步地,在所述根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型之后,还包括:
17.若接收到由所述计算集群发送的模型信息获取请求,将所述新的全局资源编排模型和/或所述新的全局资源编排模型对应的第三加密信息发送至所述计算集群。
18.第二方面,本技术实施例提供了一种智能资源编排模型的训练方法,应用于计算集群,所述方法包括:
19.获取控制设备发送的第一加密信息;
20.根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型;
21.将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。
22.进一步地,初始的本地资源编排模型的训练方法包括:
23.获取原始资源编排模型和第二样本训练集;
24.根据所述第二样本训练集对所述初始智能资源编排模型进行训练,得到初始的本地资源编排模型。
25.进一步地,所述根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型,包括:
26.根据梯度提升树算法和所述第一加密信息进行迭代计算,构建所述本地资源编排模型对应的回归树;
27.当所述回归树满足预设条件时,获取当前智能资源编排模型作为更新后的本地资源编排模型。
28.第三方面,本技术实施例提供了一种资源编排策略的确定方法,包括:
29.获取待分配任务的任务信息;
30.将所述任务信息输入至预设的目标智能资源编排模型中进行处理,得到所述任务信息对应的资源编排策略;其中,所述目标智能资源编排模型由上述第一方面所述的智能资源编排模型的训练方法得到。
31.第四方面,本技术实施例提供了一种控制设备,包括:
32.第一处理单元,用于获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型;
33.接收单元,用于接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息;
34.第二处理单元,用于根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型。
35.进一步地,所述第二处理单元,具体用于:
36.根据预设解密规则对所述第二加密信息进行解密,得到各所述计算集群对应的更新信息;
37.根据所有所述更新信息对所述全局资源编排模型进行训练,得到新的全局资源编排模型。
38.进一步地,所述控制设备,还包括:
39.获取单元,用于获取第一样本训练集;所述样本训练集中包括历史任务信息及其对应的资源编排策略标签;
40.第三处理单元,用于根据所述第一样本训练集对原始资源编排模型进行训练,得到初始的全局资源编排模型。
41.进一步地,所述样本训练集中还包括预设特殊情况任务信息及其对应的资源编排策略标签。
42.进一步地,所述控制设备,还包括:
43.第四处理单元,用于若接收到由所述计算集群发送的模型信息获取请求,将所述新的全局资源编排模型和/或所述新的全局资源编排模型对应的第三加密信息发送至所述计算集群。
44.第五方面,本技术实施例提供了一种计算集群,包括:
45.第一获取单元,用于获取控制设备发送的第一加密信息;
46.更新单元,用于根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型;
47.发送单元,用于将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。
48.进一步地,所述计算集群,还包括:
49.第二获取单元,用于获取原始资源编排模型和第二样本训练集;
50.训练单元,用于根据所述第二样本训练集对所述初始智能资源编排模型进行训练,得到初始的本地资源编排模型。
51.进一步地,所述更新单元,具体用于:
52.根据梯度提升树算法和所述第一加密信息进行迭代计算,构建所述本地资源编排模型对应的回归树;
53.当所述回归树满足预设条件时,获取当前智能资源编排模型作为更新后的本地资源编排模型。
54.第六方面,本技术实施例提供了一种资源编排策略的确定装置,包括:
55.获取单元,用于获取待分配任务的任务信息;
56.处理单元,用于将所述任务信息输入至预设的目标智能资源编排模型中进行处理,得到所述任务信息对应的资源编排策略;其中,所述目标智能资源编排模型由上述第一方面所述的智能资源编排模型的训练方法得到。
57.第七方面,本技术实施例提供了一种控制设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的智能资源编排模型的训练方法。
58.第八方面,本技术实施例提供了一种计算集群,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第二方面所述的智能资源编排模型的训练方法。
59.第九方面,本技术实施例提供了一种控制设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第三方面所述的资源编排策略的确定方法。
60.第十方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面所述的智能资源编排模型的训练方法。
61.第十一方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第二方面所述的资源编排策略的确定方法。
62.第十二方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第三方面所述的智能资源编排模型的训练方法。
63.本技术实施例中,控制设备获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型;接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息;根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型。上述方法,当用户数量多,网络状况复杂的情况下,采用联邦学习的方法,对分散的计算集群进行独立计算,将计算结果汇总到控制设备,得到全局资源编排模型,全局资源编排模型能够准确且快速的确定资源编排策略,提高了资源利用率和计算效率。
64.另一方面,计算集群获取控制器发送的第一加密信息;根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型;将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。上述方法,当用户数量多,网络状况复杂的情况下,采用联邦学习的方法,对分散的计算集群进行独立计算,将计算结果汇总到控制设备,得到全局资源编排模型,全局资源编排模型能够准确且快速的确定资源编排策略,提高了资源利用率和计算效率。
65.另一方面,资源编排策略的确定装置获取待分配任务的任务信息;将所述任务信息输入至预设的目标智能资源编排模型中进行处理,得到所述任务信息对应的资源编排策略。上述方法中使用的目标智能资源编排模型是通过联邦学习的方法,对分散的计算集群进行独立计算,将计算结果汇总到控制设备,由控制设备汇总计算得到的。该目标智能资源编排模型能够准确且快速的确定资源编排策略,提高了资源利用率和计算效率。
附图说明
66.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
67.图1是本技术第一实施例提供的一种智能资源编排模型的训练方法的示意流程图;
68.图2是本技术第二实施例提供的一种智能资源编排模型的训练方法的示意流程图;
69.图3是本技术第三实施例提供的一种资源编排策略的确定方法的示意流程图;
70.图4是本技术第四实施例提供的控制设备的示意图;
71.图5是本技术第五实施例提供的计算集群的示意图;
72.图6是本技术第六实施例提供的资源编排策略的确定装置的示意图;
73.图7是本技术第七实施例提供的控制设备的示意图;
74.图8是本技术第八实施例提供的计算集群的示意图;
75.图9是本技术第九实施例提供的资源编排策略的确定设备的示意图。
具体实施方式
76.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
77.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
78.还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
79.如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0080]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0081]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0082]
随着5g与智能化技术的蓬勃发展,出现了许多延迟敏感的新应用,例如,工业控制类应用通过互联网对设备进行远程操控;设备监控类应用通过互联网分析设备运行状况,实现智能的设备管理;智能驾驶应用通过收集大量的视频、传感等数据,智能辅助车辆做出驾驶决策。部分远程工业操控类应用要求延迟低于20ms,智能驾驶场景需要延迟低于10ms,设备安全监控类应用要求延迟越低越好。
[0083]
传统的中心化云计算无法满足上述新应用的需要,这是因为云计算中心通常离用户有一定距离并带来额外的延迟,对于新的智慧化场景,例如,关键的工业互联网应用、远
程监控、智能驾驶等来说,存在致命的影响,可能带来巨大的损失或者安全隐患。因此,需要在靠近用户数据源端进行计算处理,才能为用户提供可靠的体验。
[0084]
边缘计算为解决上述问题提供了新方向。通过将计算服务器部署在靠近用户的边缘,在网络的边缘或靠近用户的位置提供信息技术服务环境和云计算能力,可以大大降低通信的延迟,优化网络效能,提升用户体验。
[0085]
但是,在实际应用过程中,现有的边缘计算技术面临资源利用率和计算效率不高的挑战:边缘计算通常为多个用户提供不同应用程序的计算服务,而不同应用程序具有不同的通信资源和计算资源需求。但是现有的资源编排方法依赖用户自主管理或者简单的优化算法,以物理机或虚拟机的粗粒度分配计算单元,资源利用率低下。
[0086]
所以,针对上述问题,本技术提出了一种智能资源编排模型的训练方法,以及一种资源编排策略的确定方法。
[0087]
请参见图1,图1是本技术第一实施例提供的一种智能资源编排模型的训练方法的示意流程图。本实施例中一种智能资源编排模型的训练方法的执行主体为控制设备。如图1所示的智能资源编排模型的训练方法可以包括:
[0088]
s101:获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型。
[0089]
在本实施例中,智能资源编排模型的训练是以联邦学习为基础的。联邦学习技术在保障数据交换时的信息安全和数据隐私方面的适应性,使其在分布式的信息单元之间开展高效的机器学习方面展现出较大的优势。控制设备和计算集群共同组成了一个联邦学习联盟,每个计算集群只基于本地数据而无需共享全局信息就可以更新局部模型,通过控制设备汇聚计算集群的局部模型信息,从而得到新的全局资源编排模型。
[0090]
在控制设备中,存储了初始的全局资源编排模型,初始的全局资源编排模型可以是由控制设备预先训练得到的,也可以是其他设备训练好后,移植到控制设备中。
[0091]
其中,控制设备可以通过以下方式训练初始的全局资源编排模型:控制设备获取第一样本训练集;第一样本训练集中包括历史任务信息及其对应的资源编排策略标签。其中,历史任务信息可以包括任务相关参数,例如,任务的数量、任务所需资源情况、任务的完成时间限制、任务完成需求等等。历史任务信息及其对应的资源编排策略标签为历史任务信息对应的优选的资源编排策略,优选的资源编排策略应该是考虑了各个计算集群的资源、带宽、服务质量以及性能等等因素后,得到的最优的资源编排策略。可以理解的是,该资源编排策略中的计算集群应该属于上文中提到的联邦学习联盟。
[0092]
为了样本的丰富性和真实性,样本训练集中包括的历史任务信息及其对应的资源编排策略标签的数量越多越好。
[0093]
控制设备获取了第一样本训练集后,根据第一样本训练集对原始资源编排模型进行训练,得到初始的全局资源编排模型。在训练过程中,初始的全局资源编排模型的输入为历史任务信息,初始的全局资源编排模型的输出为历史任务信息及其对应的资源编排策略。
[0094]
进一步地,由于系统是实时运行的,有可能会在运行过程中遇到一些突发或之前没有遇到过的情况,所以可以在训练样本中设置一些特殊情况样本,样本训练集中还包括
预设特殊情况任务信息及其对应的资源编排策略标签。特殊情况样本用来模拟一些历史上没有出现过的网络状态来进行训练,针对这种网络状态来获得最优解,进而在未来出现这种情况时,能够自适应地进行反应,得到优化的资源编排策略。
[0095]
控制设备在获取了初始的全局资源编排模型后,会根据计算集群发送的信息对初始的全局资源编排模型进行更新,更新后,将更新后的全局资源编排模型对应的加密信息发送给各个计算集群。各个计算集群根据收到的第一加密信息来更新自己的本地资源编排模型,并且各个计算集群将更新后的本地资源编排模型对应的加密信息发送至控制设备,用以控制设备继续更新当前的全局资源编排模型。这样,形成多次循环更新学习,控制设备每次获取计算集群发送的加密信息后,都对当前的全局资源编排模型进行更新,这样最后得到最终的全局资源编排模型。
[0096]
其中,本实施例中提到的加密信息是指全局资源编排模型在构建过程中的一个中间值,可以理解为一个权重系数,通过这个中间值可以确定该全局资源编排模型的构造。所以,控制设备获取了计算集群的加密信息后,是可以通过计算集群的加密信息来调整当前的全局资源编排模型,计算集群获取了控制设备的加密信息后,也可以通过控制设备的加密信息来调整本地资源编排模型。
[0097]
需要说明的是,由于本实施例中采用的是联邦学习的方式,各个计算集群和控制设备之间是不进行信息共享的,而上文中提到的中间值在计算过程中是需要使用类别标记的,它们可以被用来进行重构以发现类别信息,所以,如果直接发送该中间值是存在风险的。为了保证安全性,每个计算集群和控制设备都不能直接发送和访问中间值,控制设备在将其发送给每个计算集群之前首先进行加密处理。在加密时,可以采用同态加密的算法对其进行加密,以得到第一加密信息。同态加密举例来说,我们定义一个数字u在可加性的同态加密模式下的表达是《u》,根据同态加密的可加性原则,对于两个任意的数字u和v,我们有《u》+《v》=《u+v》。
[0098]
计算集群在接收到第一加密信息后,需要在不直接访问中间值的前提下利用中间值来更新本地资源编排模型。
[0099]
本实施例中,以循环更新中的一次更新为例,来说明控制设备是如何获取到更新的全局资源编排模型的。控制设备获取全局资源编排模型的第一加密信息,并将第一加密信息发送至联邦学习联盟中的各个计算集群,第一加密信息用于更新各个计算集群的本地资源编排模型。
[0100]
s102:接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息。
[0101]
控制设备将第一加密信息发送至联邦学习联盟中的各个计算集群后,计算集群从控制设备下载当前的全局资源编排模型作为本地资源编排模型,计算集群根据第一加密信息对本地资源编排模型进行更新,得到更新的本地资源编排模型,并且获取在更新过程的第二加密信息。计算集群将第二加密信息发送至控制设备,第二加密信息用于更新控制设备的当前的全局资源编排模型。
[0102]
控制设备这端接收由各个计算集群返回的更新后的本地资源编排模型的第二加密信息。
[0103]
s103:根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的
全局资源编排模型。
[0104]
控制设备根据所有第二加密信息对全局资源编排模型进行更新,得到新的全局资源编排模型。本实施例中,利用第二加密信息来更新全局资源编排模型的方式,可以采用梯度提升树算法的方式来更新,也可以采用神经网络训练的方式进行更新,此处不做限定。
[0105]
一种实施方式中,可以采用神经网络训练的方式进行更新,得到新的全局资源编排模型。控制设备获取计算集群发送的第二加密信息后,根据预设解密规则对第二加密信息进行解密,得到各计算集群对应的更新信息。
[0106]
根据所有所述更新信息对所述全局资源编排模型进行训练,得到新的全局资源编排模型。本实施例中,对当前的全局资源编排模型进行更新,采用机器学习的方式,对当前的全局资源编排模型进行训练,得到更新的全局资源编排模型。在训练过程中,加密信息可以用来调整训练参数。
[0107]
在这个训练过程中,可以设置特殊情况样本,来模拟一些历史上没有出现过的网络状态来进行训练,针对这种网络状态来获得最优解,进而在未来出现这种情况时,能够自适应地进行反应,得到优化的资源编排策略。
[0108]
在s103之后,还可以包括:若接收到由所述计算集群发送的模型信息获取请求,将所述新的全局资源编排模型和/或所述新的全局资源编排模型对应的第三加密信息发送至所述计算集群。这里,当控制设备获取了新的全局资源编排模型后,可以获取新的全局资源编排模型对应的中间值,对其进行加密,得到第三加密信息,在计算集群发送模型信息获取请求时,将新的全局资源编排模型和/或新的全局资源编排模型对应的第三加密信息发送至所述计算集群。
[0109]
本技术实施例中,控制设备获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型;接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息;根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型。上述方法,当用户数量多,网络状况复杂的情况下,采用联邦学习的方法实现了,对分散的计算集群进行独立计算,将计算结果汇总到控制设备,得到全局资源编排模型,全局资源编排模型能够准确且快速的确定资源编排策略,使边缘计算集群的能力得到充分发挥,为延迟敏感型应用提供优质的计算支持,根据任务特性动态智能地对资源进行编排,最小化任务的平均完成时间,最大化完成任务的数量,解决了计算效率方面的问题,提高了资源利用率和计算效率。
[0110]
请参见图2,图2是本技术第二实施例提供的一种智能资源编排模型的训练方法的示意流程图。本实施例中一种智能资源编排模型的训练方法的执行主体为计算集群。如图2所示的智能资源编排模型的训练方法可以包括:
[0111]
s201:获取控制设备发送的第一加密信息。
[0112]
在本实施例中,执行主体为计算集群,计算集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,计算集群可以被看作是一台计算机或者一台服务器。本实施例中的计算集群应当属于第一实施例中提到的联邦学习联盟。
[0113]
计算集群可以预设一个初始的本地资源编排模型,初始的本地资源编排模型可以
是由计算集群预先训练得到的,也可以是其他设备训练好后,移植到控制设备中。
[0114]
其中,初始的本地资源编排模型的训练方法包括:获取原始资源编排模型和第二样本训练集。其中,第二样本训练集中包括历史任务信息及其对应的资源编排策略标签。历史任务信息中可以包括联邦学习联盟中所有计算集群的公共特征数据样本,尽管不同计算集群的数据彼此独立,但由于边缘计算节点自身蕴含的一些公共特征,可以在绝大多数集群的数据中,找到一些包含有公共特征的数据样本。这些样本可以由它们的唯一标识符进行识别。此时,可以根据已有的隐私保护机制对跨计算集群的数据进行加密,继而选择出包含了公共特征的数据样本。
[0115]
具体来说,公共特征就是计算集群的基本属性特征,例如cpu类型、gpu类型、内存大小、存储空间大小、负载情况、算力资源情况等。
[0116]
计算集群根据第二样本训练集对所述初始智能资源编排模型进行训练,得到初始的本地资源编排模型。在训练过程中,初始的本地资源编排模型的输入为历史任务信息,初始的本地资源编排模型的输出为历史任务信息及其对应的资源编排策略。
[0117]
从控制设备上获取新的全局资源编排模型作为本地资源编排模型。其中,控制设备每次获取新的全局资源编排模型时,就可以主动将新的全局资源编排模型发送给计算集群,也可以计算集群在需要更新本地资源编排模型时,向控制设备发送请求。
[0118]
控制设备在获取了全局资源编排模型后,将全局资源编排模型对应的第一加密信息发送给各个计算集群。计算集群获取控制设备发送的第一加密信息,第一加密信息用于计算集群更新本地资源编排模型。
[0119]
s202:根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型。
[0120]
其中,在第一实施例中提到加密信息实际上是指全局资源编排模型在构建过程中的一个中间值,可以理解为一个权重系数。第一加密信息时控制设备通过同态加密得到的,计算集群获取第一加密信息后,通过利用同态加密的可加性原则,获取中间值,对本地资源编排模型进行更新,得到更新后的本地资源编排模型。
[0121]
一种实施方式中,可以采用梯度提升树算法对本地资源编排模型进行更新,得到更新后的本地资源编排模型。根据梯度提升树算法和第一加密信息进行迭代计算,构建本地资源编排模型对应的回归树。当回归树满足预设条件时,获取当前智能资源编排模型作为更新后的本地资源编排模型。
[0122]
具体来说,其基本思路如下:给定一个有着n个样本和d维特征的数据集x∈rn×d,利用xgboost算法构建k个回归树来预测本地资源编排模型输出:
[0123][0124]
其中,fk(xi):k个回归树中每个回归树的输出值,k个回归树的集成预测值。
[0125]
为了学习上述公式中的回归树模型,xgboost在t次迭代中增加一棵树f
t
来最小化下列损失:
[0126][0127]
其中,
[0128][0129]
其中,回归树的预测损失函数,
[0130]gi
、hi:的一阶偏导与二阶偏导,
[0131]ft
:用来减小计算误差、最小化预测损失的修正回归树,
[0132]
φ
(t)
:第t轮迭代的目标函数,迭代的过程就是最小化φ
(t)
的过程,
[0133]
γ:分裂阈值。
[0134]
当模型在第t次迭代构建回归树时,从深度为0开始,每次给一个叶子节点增加一个分裂(split),直到树达到最大深度。进一步地,利用以下形式来决定最好的分裂:
[0135][0136]
在上述方程中,i
l
和ir为分类后所有子树的节点样本。最大化分裂信息的分类则被选择为最优分裂。当模型获得一个最优的树结构时,叶结点j的最优权重可以按照如下公式给出:
[0137][0138]
其中,回归树编号为j的叶节点的最优权重值,ij是叶子j的样本空间。
[0139]
由于分裂候选集和最优的叶子节点权重仅依赖于gi和hi,所以,gi和hi即为上文中提到的中间值,进行同态加密后即为第二加密信息。
[0140]
s203:将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。
[0141]
计算集群将更新后的本地资源编排模型的第二加密信息发送至控制器,所述第二加密信息用于更新控制器的全局资源编排模型。控制设备根据所有计算机集群发送的第二加密信息对全局资源编排模型进行更新,得到新的全局资源编排模型。
[0142]
本实施例中,计算集群获取控制器发送的第一加密信息;根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型;将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。上述方法,当用户数量多,网络状况复杂的情况下,采用联邦学习的方法实现了,对分散的计算集群进行独立计算,将计算结果汇总到控制设备,得到全局资源编排模型,全局资源编排模型能够准确且快速的确定资源编排策略,使边缘计算集群的能力得到充分发挥,为延迟敏感型应用提供优质的计算支持,根据任务特性动态智能地对资源
进行编排,最小化任务的平均完成时间,最大化完成任务的数量,解决了计算效率方面的问题,提高了资源利用率和计算效率。
[0143]
请参见图3,图3是本技术第三实施例提供的一种资源编排策略的确定方法的示意流程图。本实施例中一种资源编排策略的确定方法的执行主体为具有资源编排策略的确定功能的设备,例如,台式电脑、服务器等。如图3所示的资源编排策略的确定方法可以包括:
[0144]
s301:获取待分配任务的任务信息。
[0145]
设备获取待分配任务的任务信息,任务信息可以包括任务相关参数,例如,任务的数量、任务所需资源情况、任务的完成时间限制、任务完成需求等等。
[0146]
s302:将所述任务信息输入至预设的目标智能资源编排模型中进行处理,得到所述任务信息对应的资源编排策略;其中,所述目标智能资源编排模型由权利要求1至5中任一项所述的智能资源编排模型的训练方法得到。
[0147]
设备中预先存储了目标智能资源编排模型,其中,目标智能资源编排模型的获取方式可以参考第一实施例和第二实施例中的智能资源编排模型的训练方法,此处不再赘述。
[0148]
将任务信息输入至预设的目标智能资源编排模型中进行处理,得到任务信息对应的资源编排策略。
[0149]
本实施例中,资源编排策略的确定装置获取待分配任务的任务信息;将所述任务信息输入至预设的目标智能资源编排模型中进行处理,得到所述任务信息对应的资源编排策略。上述方法中使用的目标智能资源编排模型是通过联邦学习的方法,对分散的计算集群进行独立计算,将计算结果汇总到控制设备,由控制设备汇总计算得到的。该目标智能资源编排模型能够准确且快速的确定资源编排策略,提高了资源利用率和计算效率。
[0150]
请参见图4,图4是本技术第四实施例提供的控制设备的示意图。包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,控制设备4包括:
[0151]
第一处理单元410,用于获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型;
[0152]
接收单元420,用于接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息;
[0153]
第二处理单元430,用于根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型。
[0154]
进一步地,所述第二处理单元430,具体用于:
[0155]
根据预设解密规则对所述第二加密信息进行解密,得到各所述计算集群对应的更新信息;
[0156]
根据所有所述更新信息对所述全局资源编排模型进行训练,得到新的全局资源编排模型。
[0157]
进一步地,所述控制设备4,还包括:
[0158]
获取单元,用于获取第一样本训练集;所述样本训练集中包括历史任务信息及其对应的资源编排策略标签;
[0159]
第三处理单元,用于根据所述第一样本训练集对原始资源编排模型进行训练,得到初始的全局资源编排模型。
[0160]
进一步地,所述样本训练集中还包括预设特殊情况任务信息及其对应的资源编排策略标签。
[0161]
进一步地,所述控制设备4,还包括:
[0162]
第四处理单元,用于若接收到由所述计算集群发送的模型信息获取请求,将所述新的全局资源编排模型和/或所述新的全局资源编排模型对应的第三加密信息发送至所述计算集群。
[0163]
请参见图5,图5是本技术第五实施例提供的计算集群的示意图。包括的各单元用于执行图2对应的实施例中的各步骤。具体请参阅图2对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图5,计算集群5包括:
[0164]
第一获取单元510,用于获取控制设备发送的第一加密信息;
[0165]
更新单元520,用于根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型;
[0166]
发送单元530,用于将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。
[0167]
进一步地,所述计算集群5,还包括:
[0168]
第二获取单元,用于获取原始资源编排模型和第二样本训练集;
[0169]
训练单元,用于根据所述第二样本训练集对所述初始智能资源编排模型进行训练,得到初始的本地资源编排模型。
[0170]
进一步地,所述更新单元520,具体用于:
[0171]
根据梯度提升树算法和所述第一加密信息进行迭代计算,构建所述本地资源编排模型对应的回归树;
[0172]
当所述回归树满足预设条件时,获取当前智能资源编排模型作为更新后的本地资源编排模型。
[0173]
请参见图6,图6是本技术第六实施例提供的资源编排策略的确定装置的示意图。包括的各单元用于执行图3对应的实施例中的各步骤。具体请参阅图3对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图6,资源编排策略的确定装置的6包括:
[0174]
获取单元610,用于获取待分配任务的任务信息;
[0175]
处理单元620,用于将所述任务信息输入至预设的目标智能资源编排模型中进行处理,得到所述任务信息对应的资源编排策略;其中,所述目标智能资源编排模型由上述第一方面所述的智能资源编排模型的训练方法得到。
[0176]
图7是本技术第七实施例提供的控制设备的示意图。如图7所示,该实施例的控制设备7包括:处理器70、存储器71以及存储在所述存储器71中并可在所述处理器70上运行的计算机程序72,例如智能资源编排模型的训练程序。所述处理器70执行所述计算机程序72时实现上述各个智能资源编排模型的训练方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器70执行所述计算机程序72时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块410至430的功能。
[0177]
示例性的,所述计算机程序72可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器71中,并由所述处理器70执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序72在所述控制设备7中的执行过程。例如,所述计算机程序72可以被分割成第一处理单元、接收单元、第二处理单元,各单元具体功能如下:
[0178]
第一处理单元,用于获取全局资源编排模型的第一加密信息,并将所述第一加密信息发送至联邦学习联盟中的各个计算集群,所述第一加密信息用于更新各个所述计算集群的本地资源编排模型;
[0179]
接收单元,用于接收由各个所述计算集群返回的更新后的本地资源编排模型的第二加密信息;
[0180]
第二处理单元,用于根据所有所述第二加密信息对所述全局资源编排模型进行更新,得到新的全局资源编排模型。
[0181]
所述控制设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是控制设备7的示例,并不构成对控制设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述控制设备还可以包括输入输出设备、网络接入设备、总线等。
[0182]
所称处理器70可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0183]
所述存储器71可以是所述控制设备7的内部存储单元,例如控制设备7的硬盘或内存。所述存储器71也可以是所述控制设备7的外部存储设备,例如所述控制设备7上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述控制设备7还可以既包括所述控制设备7的内部存储单元也包括外部存储设备。所述存储器71用于存储所述计算机程序以及所述控制设备所需的其他程序和数据。所述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
[0184]
图8是本技术第八实施例提供的计算集群的示意图。如图8所示,该实施例的计算集群8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82,例如智能资源编排模型的训练程序。所述处理器80执行所述计算机程序82时实现上述各个智能资源编排模型的训练方法实施例中的步骤,例如图2所示的步骤201至203。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如图5所示模块510至530的功能。
[0185]
示例性的,所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述计算集群8中的执行过程。例如,所述计算机程序82可以被分割成第一获取单元、更新单元、第二处理单元、发送单元,各单元具体功能如下:
[0186]
第一获取单元,用于获取控制设备发送的第一加密信息;
[0187]
更新单元,用于根据所述第一加密信息对本地资源编排模型进行更新,得到更新后的本地资源编排模型;
[0188]
发送单元,用于将所述更新后的本地资源编排模型的第二加密信息发送至所述控制器,所述第二加密信息用于更新所述控制器的全局资源编排模型。
[0189]
所述计算集群可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是计算集群8的示例,并不构成对计算集群8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算集群还可以包括输入输出设备、网络接入设备、总线等。
[0190]
所称处理器80可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0191]
所述存储器81可以是所述计算集群8的内部存储单元,例如计算集群8的硬盘或内存。所述存储器81也可以是所述计算集群8的外部存储设备,例如所述计算集群8上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述计算集群8还可以既包括所述计算集群8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述计算集群所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
[0192]
图9是本技术第九实施例提供的资源编排策略的确定设备的示意图。如图9所示,该实施例的资源编排策略的确定设备9包括:处理器90、存储器91以及存储在所述存储器91中并可在所述处理器90上运行的计算机程序92,例如资源编排策略的确定程序。所述处理器90执行所述计算机程序92时实现上述各个资源编排策略的确定方法实施例中的步骤,例如图3所示的步骤301至302。或者,所述处理器90执行所述计算机程序92时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块610至620的功能。
[0193]
示例性的,所述计算机程序92可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器91中,并由所述处理器90执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序92在所述资源编排策略的确定设备9中的执行过程。例如,所述计算机程序92可以被分割成接收单元、第一处理单元、第二处理单元、第三处理单元、第四处理单元、执行单元,各单元具体功能如下:
[0194]
接收单元,用于接收定时请求,所述定时请求包括定时时长和处理任务;
[0195]
第一处理单元,用于获取单调递增时钟的第一递增时间,根据所述第一递增时间和所述定时时长确定第一虚拟闹钟时间;
[0196]
第二处理单元,用于根据所述第一虚拟闹钟时间以及所述处理任务创建虚拟定时器,以及,根据所述第一虚拟闹钟时间确定系统闹钟任务;
[0197]
第三处理单元,用于当系统时钟触发系统闹钟任务时,获取所述单调递增时钟的
第二递增时间;
[0198]
第四处理单元,用于获取各个所述虚拟定时器对应的虚拟闹钟时间,将所述虚拟闹钟时间小于所述第二递增时间的虚拟定时器确定为目标定时器;
[0199]
执行单元,用于执行所述目标定时器对应处理任务。
[0200]
所述资源编排策略的确定设备可包括,但不仅限于,处理器90、存储器91。本领域技术人员可以理解,图9仅仅是资源编排策略的确定设备9的示例,并不构成对资源编排策略的确定设备9的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述资源编排策略的确定设备还可以包括输入输出设备、网络接入设备、总线等。
[0201]
所称处理器90可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0202]
所述存储器91可以是所述资源编排策略的确定设备9的内部存储单元,例如资源编排策略的确定设备9的硬盘或内存。所述存储器91也可以是所述资源编排策略的确定设备9的外部存储设备,例如所述资源编排策略的确定设备9上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述资源编排策略的确定设备9还可以既包括所述资源编排策略的确定设备9的内部存储单元也包括外部存储设备。所述存储器91用于存储所述计算机程序以及所述资源编排策略的确定设备所需的其他程序和数据。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。
[0203]
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0204]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0205]
本技术实施例还提供了一种虚拟定时器的定时设备,该虚拟定时器的定时设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
[0206]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储
有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
[0207]
本技术实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
[0208]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
[0209]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0210]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0211]
在本技术所提供的实施例中,应该理解到,所揭露的装置/设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0212]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0213]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1