本发明属于5g网络边缘智能,尤其涉及一种无线供能边缘智能系统中神经网络(deep neural network,dnn)模型的分割及资源分配方法,该方法适用于信道状态时变、用户设备有时延约束的情况下制定出合理的神经网络模型分割和资源分配决策,最大化用户任务完成率。
背景技术:
1、在边缘智能系统中,设备有限的能耗是执行dnn推理任务过程中很重要的一个制约因素。尽管有边缘服务器辅助完成dnn模型推理任务,但是本地计算和卸载也需要大量的计算和传输能耗,并且从不同的网络层对dnn进行分割所产生的总能耗差别很大,因此制定一个最优的分割决策非常重要。
2、另外,考虑到无线设备通常是电池供电,需要频繁更换电池且不环保,应用无线能量传输(wireless power transfer,wpt)技术可以为设备持续供电。在该无线供能量边缘智能系统中,无线接入点(access point,ap)给设备传输能量同时也可以接收设备卸载的计算任务。同时,该系统存在两个挑战,一个挑战是在无线信道衰落的环境中,信道状态的变化会给时间分配决策造成很大影响,如何联合优化卸载和时间资源分配是一个关键问题。另外在每个时隙内设备捕获能量有限,如何分配设备的发射功率和计算频率来保证设备能通过有限的能量完成dnn推理也未得到解决。
技术实现思路
1、本发明要克服现有技术的上述缺点,提供一种无线供能边缘智能系统中神经网络的分割及资源分配方法。
2、首先,为了最大化dnn推理计算任务完成率,本发明提出了一个无线能量传输环境下的神经网络模型分割及资源分配模型,该模型在考虑无线信道状态时变的基础上,进一步考虑到了多个用户设备的时延约束。其次,本发明提出了一个基于强化学习和matlab凸优化函数的优化算法以实现有效的时间资源分配决策、dnn模型分割决策、发送功率分配决策和计算速率分配决策,从而最大化dnn推理任务完成率。
3、为了实现上述过程,本发明提供以下的技术方案:
4、一种无线供能边缘智能场景下的神经网络模型分割及资源分配方法,包括以下步骤:
5、步骤1:将边缘服务器放置于接入点ap,并通过有线与ap连接,ap有稳定的电源供应。在ap的通信范围内放置n个用户设备,每个设备i有一个单独的天线,既可以用来捕获能量,也可以进行数据卸载。
6、步骤2:系统分为t个时隙,每个时隙设备i都会产生一个深度神经网络dnn推理任务ri={li,ci,oi},其中li表示dnn网络层数量,ci={ci,j|j∈{1,…li}},ci,j表示计算dnn模型i第j层所需要的浮点数计算量(flops),oi={oi,j|j∈{1,…li}},oi,j表示第j层输出的数据量大小。s=(s0,s1,…,sn)是dnn模型分割决策向量,si表示第i个任务的分割决策。
7、步骤3:在时隙t内,信道状态ht不变,设备在前αt时间同时进行能量捕获,α∈[0,1],后(1-α)t时间以时分复用的通信方式进行数据卸载。设备i捕获到的能量为ei=μphiαt,其中μ∈(0,1)是能量捕获效率系数,p是ap的发送功率,hi是设备i的无线信道增益。
8、步骤4:以每个用户设备的能量ei和时隙长度t为约束条件,以时间资源分配决策α、dnn模型分割决策s、发送功率分配决策p和计算速率分配f决策为优化变量,以最大化用户计算任务的完成率为优化目标建立优化问题
9、步骤5:通过强化学习算法训练时间分配决策,将优化问题转化为问题采用遍历搜索的方式搜索dnn模型分割决策,以此将问题转化为凸优化问题采用matlab中的fmincon函数求解凸优化问题最终求得优化问题从而得到最佳dnn网络分割及资源分配方案。
10、进一步地,所述步骤4中,优化问题的表达式为:
11、
12、其中i(x)是一个指示性函数,这里表示网络层在本地计算需要的时延,fi表示设备i的计算速率,表示传输中间参数需要的传输时延,ri表示设备的传输速率,表示网络层在边缘服务器计算需要的时延,fe是服务器的计算速率;优化变量α表示能量捕获时间占比决策,s=(s0,s1,…,sn)表示dnn模型分割决策向量;p=(p0,p1,…,pn)表示功率分配决策向量;f=(f0,f1,…,fn)表示计算速率分配决策向量。
13、再进一步的,步骤4所述的优化问题的限制条件表达式为:
14、
15、
16、0≤α≤1 (4)
17、
18、
19、
20、其中式(2)表示所有用户任务的传输时延之和不能超过总计算卸载时间;式(3)表示用户设备计算卸载所需的能量消耗不能超过前αt时间内捕获的能量,这里为本地计算所需能耗,k为设备芯片能耗效率系数,为传输能耗,为空闲能耗,是设备空转时的功率,为设备空转时间;式(4)表示设备能量捕获的时间限制在时隙长度之内;式(5)表示dnn切割点在0至网络层数li之间;式(6)表示设备计算速率限制在0至之内,表示设备最大计算速率;式(7)表示设备发送功率限制在0至之内,表示设备最大发射功率。
21、更进一步的,所述步骤5中,问题的表达式为:
22、
23、
24、其中表示任务i的总完成时延;式(9)表示所有用户设备i传输时延不能超过分配给它的卸载时延,其中ρi表示任务i的时间资源限制占总卸载时延的比例。另外,上述问题中式(3)、式(5)、式(6)、式(7)也为问题的限制条件表达式。
25、问题的表达式为:
26、
27、上述问题中式(3)、式(6)、式(7)和问题中式(9)为问题的限制条件表达式。
28、更进一步地,所述步骤5中,采用强化学习结合遍历搜索及matlab函数的算法对步骤4中问题进行求解的步骤为:
29、步骤5.1:随机初始化强化学习中神经网络的参数θ,从时隙t=1时刻开始遍历,根据t时刻信道状态ht输出决策按照探索步长δ生成含有k个候选值的集合,表示为
30、
31、步骤5.2:将从步骤4.1中得到的k个候选值全部代入问题求解,遍历每一个用户任务,通过遍历搜索的方式搜索si,将问题进一步转化为凸优化问题将每一个si代入问题并通过fmincon函数求解问题得到最优的遍历完成之后进一步得到和任务完成率。
32、步骤5.3:根据步骤4.2得到的结果,在候选决策值中选出使得任务完成率最大的最优决策值并将对应的状态-动作对放到经验回放池中。当回放池被放满的时候,旧的状态-动作会被新的替换。
33、步骤5.4:从经验回放池中批量选取状态-动作对作为样本用来训练神经网络,将神经网络参数从θt更新到θt+1(对应的策略也变为),最新的策略用在下一个时隙中根据ht+1来生成决策估计值
34、步骤5.5:重复上述过程直至收敛,求得最优策略
35、本发明的有益效果主要表现在:适用于无线供能多用户边缘智能场景下的神经网络任务分割及相关资源分配决策,根据无线信道状态和用户提出的时延约束,联合优化能量捕获时间分配、神经网络模型分割、发送功率分配和计算速率分配决策,最后大幅提高多用户神经网络推理计算任务的完成率。