1.高可靠低时延低能耗的电力巡检系统,其包括基站、每个基站至少配置一个边缘服务器、可移动的智能巡检机器人,所述智能巡检机器人具有可实现任务卸载决策及本地任务处理的计算能力,优选的,所述智能巡检机器人的数量不少于基站数量。
2.权利要求1所述系统进行电力巡检的方法,其包括:
由所述智能巡检机器人产生巡检计算任务;
由所述智能巡检机器人通过任务卸载决策模型对所述任务进行分配;
由所述智能巡检机器人和/或被分配到任务的基站对任务进行处理;
由所述智能巡检机器人产生处理结果和/或接收被分配到任务的基站的关于处理结果的反馈;
优选的,所述任务卸载决策模型为优化后的任务卸载决策模型;
优选的,被分配到任务的基站对任务进行的处理通过其配置的边缘服务器完成。
3.根据权利要求2所述的方法,其特征在于:所述任务卸载决策模型基于所述智能巡检机器人的本地侧模型、基站侧模型、本地侧对基站侧的模拟模型、超可靠低延迟通信约束及最小化长期总能耗中的一项或多项做出。
4.根据权利要求3所述的方法,其特征在于:所述本地侧模型包括本地侧数据队列模型、本地侧处理时延模型、本地侧处理能耗模型、本地侧传输能耗模型;和/或所述基站侧模型包括基站侧数据处理模型;和/或所述本地侧对基站侧的模拟模型包括本地侧对基站侧的数据队列模拟模型;
优选的,所述本地侧数据队列模型如式(1)所示:
其中,
进一步优选的,将被本地处理的数据的量通过式(2)获得:
其中,fk,t表示所述智能巡检机器人在第t个时隙分配的用于处理该任务的本地cpu周期频率,τ表示每个时隙的长度,λk表示处理每比特数据需要的cpu周期;j=j+1表示所述智能巡检机器人选择本地处理;
和/或进一步优选的,将被卸载到基站上的数据的量通过式(6)获得:
其中,
其中,bk表示所述智能巡检机器人被分配到的专用子信道的带宽;γk,j,t表示其在第t个时隙的信噪比,优选通过下式获得:
其中,ptx表示传输功率,gk,j,t表示所述智能巡检机器人和被分配到任务的基站间的信道增益,δ2表示噪声功率;
优选的,所述本地侧处理时延模型如式(3)所示:
优选的,所述本地侧处理能耗模型如式(4)所示:
其中αk表示本地cpu的有效切换电容;
优选的,所述本地侧传输能耗模型如式(7)所示:
式(7)中的zk,j,t表示将被卸载到基站上的数据量。
5.根据权利要求4所述的方法,其特征在于:所述基站侧数据处理模型如式(10)所示:
其中,yk,j(t)表示第t个时隙基站处理的数据量,hk,j,t表示第t个时隙基站上存储的、被所述智能巡检机器人分配的但还未处理的任务的数据量;fk,j,t表示基站根据任务的重要性分配的cpu周期频率,其优选通过式(9)得到:
其中,βk为权重参数,
6.根据权利要求4所述的方法,其特征在于:所述本地侧对基站侧的数据队列模拟模型如式(11)所示:
hk,j(t+1)=min{hk,j(t)-yk,j(t)+xk,j,tzk,j,t,0},(11)
其中,hk,j(t)表示第t个时隙基站上存储的来自所述智能巡检机器人的数据队列;xk,j,t表示任务卸载指示符,当xk,j,t=1时,表示第t个时隙所述智能巡检机器人选择了一个基站进行任务卸载,其中j=j+1时,表示所述智能巡检机器人选择本地处理。
7.根据权利要求3所述的方法,其特征在于:所述超可靠低延迟通信约束如式(12)及(13)所示:
其中,
优选的,所述约束还包括式(14)-(15):
其中
优选的,所述约束还包括式(16)-(17):
其中,
8.根据权利要求7中任一项所述的方法,其特征在于:最小化长期总能耗采用如式(18)所示的优化模型:
p1:
且满足如下约束:
c1:
c2:关于本地队列qk(t)的约束(12),(14)及(15)
c3:关于基站侧队列hk,j(t)的约束(13),(16)及(17),
其中,c1表示在一个时隙内,每个智能巡检机器人只能选择一个基站进行任务卸载,或进行本地处理;
优选的,所述优化模型采用如式(25)所示的模型:
p2:
且满足:c1:
其中,θk,j,t表示总能量消耗和所述超可靠低延迟通信约束赤字的加权和的倒数,优选通过式(26)获得:
其中,
其中,
其中,
进一步优选的,
和/或进一步优选的,
9.根据权利要求8所述的方法,其特征在于:通过如下的过程一获得最优决策:
s30:输入
s31:初始化:
包括设置qk(0)及hk,j(0)为队列积压的初始值,设置
s32:决策:
包括:
获得可用基站的集合
根据gsi计算θk,j,t的准确值,其中
通过解决所述问题p2获得最优选项
根据最优选项,更新式(1)、(11)和(19)-(24)中的参数qk(t+1),hk,j(t+1),
s33:迭代步骤s32至t>t,获得最优决策;
其中,t表示整个优化时间内时隙的数量。
10.根据权利要求8所述的方法,其特征在于:通过如下的过程二获得最优决策:
s40:输入
s41:初始化:
包括设置qk(0)及hk,j(0)为队列积压的初始值,设置
s42:决策:
包括:
获得可用基站的集合
根据选择概率模型,对每个可选项的被选中概率进行估算,得到概率分布;
根据所述概率分布,做出基础决策
s43:决策学习:
包括:
观察
根据回报值,更新估值回报
更新式(19)-(24)中的参数
s44:迭代步骤s42-s43至t>t,获得最优决策;
其中,ρ和ωk,j,t分别表示通过吉布斯分布中均匀分布部分得到的概率值,以及通过与经验性能相关的分布部分得到的经验值;
优选的,所述选择概率模型如式(27)所示:
优选的,所述估值回报的值通过式(28)获得:
优选的,所述ωk,j,t+1通过式(29)获得