本技术涉及联邦学习,特别涉及一种云边缘系统联邦学习需求响应的在线调度方法及相关装置。
背景技术:
1、分布式云边缘系统通常会消耗电网中的大量能量,并且非常适合应急需求响应(edr)计划。通常,在edr期间,电网会向云边缘系统发送具有时变能量上限的信号,而云边缘系统必须将其能耗降至能量上限以下,以助于确保电网的稳定性和供需平衡。为此,云边缘系统运营商需要在edr期间仔细管理其工作负载,特别是在不同用户向系统提交工作负载的公共或共享环境中。然而,每个用户通常只关心自己工作量的执行,而不考虑整个系统的能耗或edr,这一问题称为“分割激励”。
2、解决分割激励的一种方法是基于拍卖。也就是说,云边缘运营商充当拍卖商,每个用户充当一个投标人,以自己的估价提交投标书,以执行自己的工作量或任务;拍卖商根据edr策略性地选择中标者,并安排相应任务的执行。然而,由于用户越来越多地执行人工智能(ai)或机器学习(ml)工作负载这一新兴的范式使得拍卖方法更加困难。
3、联邦学习为是以分布式方式训练ml模型,其可以使大量设备能够在不共享原始数据的情况下协作学习模型。这样虽然可以就学习时间和能耗而言,具有实际效率和有效性,但是就学习时间和能耗而言,也会产生相当大的成本。由此,如何确定联邦学习任务数量以及每轮训练中的本地迭代次数,成为降低成本的关键问题。
4、为了解决上述问题,目前普遍采用的方法是以最优地选择联邦学习的控制变量,并以最小化总成本为目标函数来进行调度。然而,现有的方法是针对单个联邦学习任务的,无法解决多个联邦任务的在线学习问题。
技术实现思路
1、本技术要解决的技术问题在于,针对现有技术的不足,提供一种云边缘系统联邦学习需求响应的在线调度方法及相关装置。
2、为了解决上述技术问题,本技术实施例第一方面提供了一种云边缘系统联邦学习需求响应的在线调度方法,所述的方法包括:
3、获取当前时刻接收到的各联邦学习任务的任务参数;
4、以联邦学习任务训练时间约束、联邦学习任务训练条件约束、联邦学习任务的期望准确性约束及能量上限约束为约束条件,基于各任务参数构建长期社会福利最大化问题;
5、解耦所述长期社会福利最大化问题,以得到各联邦学习任务对应的调度结果。
6、在一个实现方式中,所述任务参数包括到达时间、期望准确性、本地迭代次数、离开时间、投标报酬以及超时惩罚函数。
7、在一个实现方式中,所述以联邦学习任务训练时间约束、联邦学习任务训练条件约束、联邦学习任务的期望准确性约束及能量上限约束为约束条件,基于各任务参数构建长期社会福利最大化问题具体包括:
8、基于各任务参数确定各联邦学习任务的任务社会福利以及云边缘系统的系统社会福利;
9、基于各任务社会福利以及系统社会福利构建目标函数;
10、以联邦学习任务训练时间约束、联邦学习任务训练条件约束、联邦学习任务的期望准确性约束和能量上限约束为约束条件,基于所述目标函数构建长期社会福利最大化问题。
11、在一个实现方式中,所述长期社会福利最大化问题为:
12、
13、
14、
15、
16、
17、
18、
19、其中,i表示联邦学习任务请求集合,t表示预设时间段,xi表示联邦学习任务i的投标结果,表示时刻t联邦学习任务i的训练状态,bi表示联邦学习任务i的投标报酬,gi(.)表示联邦学习任务i的超时惩罚函数,τi表示联邦学习任务i的超时时隙数,ni表示联邦学习任务i的模型精度,ri表示联邦学习任务i的全局迭代次数,et表示t时刻的电量消耗值,ft(.)表示时刻t对应的电费计算函数,γ和γ均是常数,θi(ni)是ni的函数,表示集合,在t时刻选择联邦学习任务i的边缘服务器,ei,k(ni)e'i,k(ni)e”i(ni)是关于ni的函数,εi表示期望准确性。
20、在一个实现方式中,所述解耦所述长期社会福利最大化问题,以得到各联邦学习任务对应的调度结果具体包括:
21、将所述长期社会福利最大化问题转换为时刻表选择问题;
22、采用原始对偶算法解耦所述时刻表选择问题,以得到各联邦学习任务对应的调度结果。
23、在一个实现方式中,所述将所述长期社会福利最大化问题转换为时刻表选择问题具体包括:
24、将预设时间段划分为若干时隙;
25、对于每个时隙,将设置为定值以将长期社会福利最大化问题转换为时刻表选择问题,其中,xi表示联邦学习任务i的投标结果,表示时刻t联邦学习任务i的训练状态,τi表示联邦学习任务i的超时时隙数,ni表示联邦学习任务i的模型精度,ri表示联邦学习任务i的全局迭代次数。
26、在一个实现方式中,所述通过原始对偶算法求解所述时刻表选择问题,以得到各联邦学习任务对应的调度结果具体包括:
27、对于每个联邦学习任务,通过拉格朗日对偶算法确定所述时刻表选择问题对应的对偶问题;
28、通过动态规划算法解耦所述对偶问题,以得到各联邦学习任务对应的调度结果。
29、本技术实施例第二方面提供了一种云边缘系统联邦学习需求响应的在线调度系统,所述系统包括:
30、获取模块,用于获取当前时刻接收到的各联邦学习任务的任务参数;
31、构建模块,用于以联邦学习任务训练时间约束、联邦学习任务训练条件约束、联邦学习任务的期望准确性约束及能量上限约束为约束条件,基于各任务参数构建长期社会福利最大化问题;
32、解耦模块,用于解耦所述长期社会福利最大化问题,以得到各联邦学习任务对应的调度结果。
33、本技术实施例第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的云边缘系统联邦学习需求响应的在线调度方法中的步骤。
34、本技术实施例第四方面提供了一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
35、所述通信总线实现处理器和存储器之间的连接通信;
36、所述处理器执行所述计算机可读程序时实现如上任一所述的云边缘系统联邦学习需求响应的在线调度方法中的步骤。
37、有益效果:与现有技术相比,本技术提供了一种云边缘系统联邦学习需求响应的在线调度方法及相关装置,方法包括获取当前时刻接收到的各联邦学习任务的任务参数,以联邦学习任务训练时间约束、联邦学习任务训练条件约束、联邦学习任务的期望准确性约束及能量上限约束为约束条件,基于各任务参数构建长期社会福利最大化问题;解耦所述长期社会福利最大化问题,以得到各联邦学习任务对应的调度结果。本技术以联邦学习任务的在线学习问题为出发点,以在动态环境中构建长期社会福利最大化问题,通过解耦构建长期社会福利最大化问题来实现边缘完了的长期社会福利最大化,从而可以降低联邦学习任务的训练成本。