边缘计算网络中基于机器学习的无人机飞行轨迹优化方法与流程

文档序号:17923083发布日期:2019-06-15 00:14阅读:789来源:国知局
边缘计算网络中基于机器学习的无人机飞行轨迹优化方法与流程

本发明涉及一种无人机飞行轨迹优化方法,具体涉及一种边缘计算网络中基于机器学习的无人机飞行轨迹优化方法。



背景技术:

传统上,无线通信主要采用固定的地面基础设施,如地面基站(bs)、接入点和中继。为了有效地满足日益增长和高度多样化的交通需求,利用各种空中通信平台,如气球(helikites)和无人机(uav),从空中提供无线连接。无人机(uav)近年来在许多领域得到了广泛的关注:它们可以应用于许多不同的场景,包括监视、监视、移动中继和数据收集。一般来说,无人机可以提供视距路径(los)链路,从而提供良好的链路容量。由于其潜在的机动性,灵活的部署,以及低成本,无人机可用于多种应用,如精确农业,搜索和救援,物联网(iot)通信以及及时的环境监测和灾害预警。此外,无人机可以用作移动中继来扩展网络的容量和覆盖率。同时,随着信息技术(it)领域的日益普及,facebookaquiladrone和googleloonproject都旨在利用无人机为远程用户提供无处不在的互联网接入。灵活部署无人机,可以使其成为空中基站(bss)为地面终端(gts)提供服务。因此,无人机能够在缺乏地面基础设施的地区或过载条件下为地面用户提供地面-空中通信服务。然而,无人机通信系统仍面临许多关键挑战。其中之一是电池容量有限,使得无人机不得不着陆充电,这严重限制了无人机的耐久性。随着无人机的不断降低成本和耐久性的提高,以及通信设备的设备小型化,无人机支持的通信将在未来的无线系统中发挥越来越重要的作用。根据实际应用,无线通信系统中的无人机既可以准静态地部署在预定位置,也可以通过遵循某些轨迹在服务地面设备上连续飞行。应用的一些实际场景包括在热点地区启用无人机缓存或任务卸载和在自然灾害后快速恢复通信服务。沿着这个方向,通过利用无人机-地面链路的独特信道特性,在二维(2d)或三维空间中优化无人机的布局。通过根据所服务的地面终端的位置及其通信要求动态地调整无人机的位置,这与在地面具有固定中继的传统系统相比,可有助于显著提高性能。例如,对于物联网(iot)和机器类型通信的数据收集,无人机可以顺序地接近每个地面终端,以便缩短它们的视距距离以获得更高效的数据收集。对于这样的应用,系统性能关键取决于无人机轨迹,这也是我们研究的课题。



技术实现要素:

本发明的目的在于克服上述现有技术的缺点,提供了一种边缘计算网络中基于机器学习的无人机飞行轨迹优化方法,该方法能够有效地减少无人机的飞行距离及飞行时间。

为达到上述目的,本发明所述的边缘计算网络中基于机器学习的无人机飞行轨迹优化方法包括以下步骤:

在一个周期内,无人机从部署服务器的位置出发,依次经过各地面终端并完成通信任务,然后返回至初始位置,其中,当无人机起飞时,根据地面终端的位置分布计算飞行调度表,然后根据所述飞行调度表依次飞行经过各地面终端;

其中,当无人机进入地面终端的通信范围d内时,无人机初始化地面终端的信息,同时地面终端向无人机发送需求信息,无人机接收到需求信息后则开始向地面终端传输需求内容,其中,同一时间无人机只能与一个地面终端进行通信,当无人机与当前地面终端完成通信任务后,则飞向下一个地面终端;

无人机在飞行过程中,利用迭代采取随机方法及机器学习方法计算其局部优化轨迹,将所述局部优化轨迹添加到全局优化轨迹q中,并沿着该全局优化轨迹q飞行。

当无人机起飞时,根据地面终端的位置分布计算飞行调度表,然后根据所述飞行调度表依次飞行经过各地面终端的具体操作为:

令d=0,地面终端的最短轨迹问题变成经典旅行商问题,利用蚁群算法求解该地面终端的最短轨迹问题,得飞行调度表;

整理所述飞行调度表,无人机按照该飞行调度表顺序依次经过各地面终端。

当无人机进入地面终端的通信范围d内时,无人机初始化地面终端的信息,同时地面终端向无人机发送需求信息,并开始向地面终端传输需求内容的具体操作为:

当无人机进入当前需要通信的地面终端时,无人机获取地面终端所需的通信数据,然后将地面终端所需的通信数据发送给地面终端,其中,地面终端所需通信数据的大小为bit;

设地面终端的正上方,无人机在位置坐标wk处的最大传输速率rmax为:

无人机处于位置坐标wk的通信边界上的最小传输速率rmin为:

则无人机完成通信需要的最短时间无人机完成通信需要的最长传输时间即在实际情况下无人机完成通信需要的时间i为mmin≤i<mmax。

计算无人机的局部优化轨迹的具体过程为:

建立全局轨迹优化问题(p1),其中,

(p1):minm

其中,m为一个周期时间离散的间隙δ(t)数量,q(1)=q(m)表示在一个周期内,无人机从起点出发最终返回至起点,l表示无人机在一个时隙的飞行距离,αk(n)为变量,αk(n)表示地面终端的通信调度因子,αk(n)具体表示无人机在时隙n时是否与地面终端发生数据交互,即αk(n)=1,则表明无人机在时隙n时与地面终端发生了数据交互通信;αk(n)=0,则表明无人机在时隙n时没有与地面终端发生数据交互通信,b为通信带宽,γ0为当距离1米时接收机的信噪比,p为传输功率,h为无人机与地面终端的高度差,wk为地面终端的位置坐标,代表地面终端所需通信数据量的大小;

求解该全局轨迹优化问题(p1),通过计算飞行调度表将其转化为求解局部轨迹优化问题,得无人机的局部优化轨迹然后将局部优化轨迹添加到全局优化轨迹q中。

求解该轨迹优化问题(p1),得无人机的局部优化轨迹然后将局部优化轨迹添加到全局优化轨迹q中的具体操作过程为:

1a)设已传输数据大小为rk,初始化rk=0,传输率贪心指数ε∈[0,1],η为迭代计数,令η=0,设终止计数为c,初始化最优轨迹数据集为当前迭代局部轨迹为qk;

1b)ξ为[0,1]内均匀分布的随机数,获取所述随机数ξ;

1c)当ξ>ε或最优轨迹数据集为空集时,则本次迭代采取随机方法;当ξ≤ε时,则本次迭代采取机器学习方法;

1d)计算本次迭代局部轨迹预计路程将该路程sk与最短轨迹路程相比,当且α≥1,则将当前迭代局部轨迹qk存入最优轨迹数据集中,即令否则,则最优轨迹数据集保持不变,同时迭代计数增加1,即η←η+1。

1e)循环步骤1b)到步骤1d),直到迭代计数η≥c为止,得局部优化轨迹将局部优化轨迹添加到全局优化轨迹q中。

步骤1c)中随机方法的具体步骤为:

2a)初始化计步器i=0,获得当前任务地面终端的位置wk及下一任务地面终端的位置wk+1;

2b)已知在满足(1-α)||qk(i)-wk||+α||qk(i)-wk+1||≤(1-α)||qk(i+1)-wk||+α||qk(i+1)-wk+1||和||qk(i+1)-qk(i)||≤l的条件下,得θi的上界及下界θi表示无人机在第i个时隙至第i+1个时隙之间的飞行方向,θi的概率密度为根据θi的概率密度p(θi)随机选取θi值,得qk(i+1)=[xk(i+1),yk(i+1)]的坐标;

2c)计算传输速率

2d)更新

2e)转至步骤2b),直至||qk(i)-wk||≥d或α≥1或i≥mmax为止,得当前迭代局部轨迹qk。

步骤1c)中机器学习方法的具体步骤为:

3a)初始化计步器i=0,得目标通信地面终端的位置wk及下一任务地面终端的位置wk+1,获取初始位置qk(i)=[xk(i),yk(i)]及最优空间中的参数

3b)已知在满足(1-α)||qk(i)-wk||+α||qk(i)-wk+1||≤(1-α)||qk(i+1)-wk||+α||qk(i+1)-wk+1||和||qk(i+1)-qk(i)||≤l的条件下,得θi的上界和下界θi表示无人机在第i个时隙至第i+1个时隙之间的飞行方向,θi的概率密度p(θi)为根据θi的概率密度p(θi)随机选取θi值,得qk(i+1)=[xk(i+1),yk(i+1)]的坐标;

3c)计算传输速率

3d)更新rk←rk+r,

3e)转至步骤3b),直至||qk(i)-wk||≥d或α≥1或i≥mmax为止,得当前迭代局部轨迹qk。

无人机轨迹通过[x(t),y(t),h],0≤t≤tp表示,其中,x(t)和y(t)分别表示在水平平面上投影的x坐标和y坐标,则无人机的投影位置q(t)=[x(t),y(t)],其中,0≤t≤tp。

本发明具有以下有益效果:

本发明所述的边缘计算网络中基于机器学习的无人机飞行轨迹优化方法在具体操作时,无人机从起点起飞时,采用蚁群算法计算地面终端的访问顺序,然后依次访问各地面终端;无人机在飞行过程中,利用迭代采取随机方法及机器学习方法计算其局部优化轨迹,再将所述局部优化轨迹添加到全局优化轨迹q中,并沿着该全局优化轨迹q飞行,以降低无人机的飞行距离及飞行时间,降低周期循环时间,操作方便、简单,经济性较强。

附图说明

图1为系统的模型图;

图2为局部轨迹优化示意图;

图3为无人机进行一个周期数据传输的流程图;

图4为当d=50时无人机的轨迹优化图;

图5为当d=100时无人机的轨迹优化图。

具体实施方式

下面结合附图对本发明做进一步详细描述:

参考图1及图3,本发明所述的边缘计算网络中基于机器学习的无人机飞行轨迹优化方法包括以下步骤:

在一个周期内,无人机从部署服务器的位置出发,依次经过各地面终端并完成通信任务,然后返回至初始位置,其中,当无人机起飞时,根据地面终端的位置分布计算飞行调度表,然后根据所述飞行调度表依次飞行经过各地面终端;

其中,当无人机起飞时,根据地面终端的位置分布计算飞行调度表,然后根据所述飞行调度表依次飞行经过各地面终端的具体操作为:

令d=0,地面终端的最短轨迹问题变成经典旅行商问题,利用蚁群算法求解该地面终端的最短轨迹问题,得飞行调度表;

整理所述飞行调度表,无人机按照该飞行调度表顺序依次经过各地面终端。

当无人机进入地面终端的通信范围d内时,无人机初始化地面终端的信息,同时地面终端向无人机发送需求信息,无人机接收到需求信息后则开始向地面终端传输需求内容,其中,同一时间无人机只能与一个地面终端进行通信,当无人机与当前地面终端完成通信任务后,则飞向下一个地面终端;

其中,当无人机进入地面终端的通信范围d内时,无人机初始化地面终端的信息,同时地面终端向无人机发送需求信息,并开始向地面终端传输需求内容的具体操作为:

当无人机进入当前需要通信的地面终端时,无人机获取地面终端所需的通信数据,然后将地面终端所需的通信数据发送给地面终端,其中,地面终端所需通信数据的大小为bit;

设地面终端的正上方,无人机在位置坐标wk处的最大传输速率rmax为:

无人机处于位置坐标wk的通信边界上的最小传输速率rmin为:

则无人机完成通信需要的最短时间无人机完成通信需要的最长传输时间即在实际情况下无人机完成通信需要的时间t为mmin≤t<mmax。

无人机在飞行过程中,利用迭代采取随机方法及机器学习方法计算其局部优化轨迹,将所述局部优化轨迹添加到全局优化轨迹q中,并沿着该全局优化轨迹q飞行。

具体的,参考图2,设由k={1,2,…,k}表示的k个地面终端组成的无线通信系统,地面终端k的位置表示为wk∈r2×1,k∈k,在实践中,地面终端的位置可以在系统数据库中获得,或者由标准定位技术确定。派遣一架在地面以上固定高度h飞行的无人机,向所有地面终端提供内容,在实践中,h可以对应于最小高度以确保无人机的安全操作,例如,用于避障而不频繁地使飞机上升或下降。

因此,无人机轨迹可用[x(t),y(t),h],0≤t≤tp进行表示,其中,x(t)和y(t)表示在水平平面上投影的x和y的坐标,所以无人机的投影位置可以用q(t)=[x(t),y(t)]表示,其中,0≤t≤tp。为了便于问题的公式化,我们引入时隙δ(t),将周期时间离散为m个时隙δ(t),设无人机的轨迹满足以下约束:q(1)=q(m),即在一个周期内,无人机从起点出发最终返回起点;

在任何一个时隙内,无人机与地面终端k之间的距离dk(n)为:

假设其他地面终端不会对无人机和当前通信任务的地面终端k之间的通信信道造成任何干扰,每个uav-gt信道遵循los链路。实际的uav-gt信道可以很好地近似于los模型,假设由于无人机的移动性引起的多普勒频移可以完全预补偿掉,从地面终端k到无人机的信道功率增益符合自由空间损耗模型,其表示为

其中,β0表示当距离d0=1米处的接收功率。

每个时隙中的每个地面终端的传输功率p是恒定的,则时隙n时地面终端k的接收信噪比snr为

其中,σ2为加性高斯白噪声功率,表示当d0=1米时接收机的信噪比snr。为满足通信质量,即γk[n]的值应大于某个阈值,该条件等价于无人机与地面终端k之间的水平距离不应大于某个阈值d。定义二进制变量αk(n),αk(n)代表地面终端的通信调度因子,即表示无人机在时隙n是否与地面终端k发生数据交互;当αk(n)=1,则表明无人机在时隙n与地面终端k通信;否则,αk(n)=0,αk(n)应满足

设无人机的通信带宽为b,无人机和地面终端k之间的瞬时信道容量可以被写为

同时每个地面终端可以使用时分多址(tdma)共享整个频带,则在整个周期,地面终端k的吞吐量rk为:

具体的,设无人机搭载的边缘计算服务器需要处理来自地面终端的各种数据请求,地面终端请求的所有数据可以用一组数据集表示:c={1,2,…,cmax},c中的元素代表数据对象,这些数据对象的类型多种多样,在实际系统中,数据集c中元素可能有无限多个,由于无人机搭载的缓存设备容量有限,无人机会对其缓存服务器中的缓存内容进行处理,使其在每个周期内其缓存的内容都是该周期内流行度最高和需求量最高的内容,即使在本周期内无法提供所需内容,在下个周期的准备时间,无人机准备好所需数据,以保证无人机在飞行过程中能满足地面终端的请求。地面终端k所需内容的总大小为

通过计算飞行调度和局部轨迹优化两者结合来优化无人机完成任务所飞行的最短路径和最短时间,则建立轨迹优化问题(p1),其中,

(p1):minm

其中,m为一个周期时间离散的间隙δ(t)数量,q(1)=q(m)表示在一个周期内,无人机从起点出发最终返回至起点,l表示无人机在一个时隙的飞行距离,αk(n)为变量,αk(n)表示地面终端的通信调度因子,αk(n)具体表示无人机在时隙n时是否与地面终端发生数据交互,即αk(n)=1,则表明无人机在时隙n时与地面终端发生了数据交互通信;αk(n)=0,则表明无人机在时隙n时没有与地面终端发生数据交互通信,b为通信带宽,γ0为当距离1米时接收机的信噪比,p为传输功率,h为无人机与地面终端的高度差,wk为地面终端的位置坐标,代表地面终端所需通信数据量的大小;

求解该轨迹优化问题(p1),通过计算飞行调度表将其转化为求解局部轨迹优化问题,得无人机的局部优化轨迹,然后将局部优化轨迹添加到全局优化轨迹q中。具体,求解该轨迹优化问题(p1),得无人机的局部优化轨迹,然后将局部优化轨迹添加到全局优化轨迹q中的具体操作过程为:

1a)设已传输数据大小为rk,初始化rk=0,传输率贪心指数ε∈[0,1],η为迭代计数,令η=0,设终止计数为c,初始化最优轨迹数据集为当前迭代局部轨迹为qk;

1b)ξ为[0,1]内均匀分布的随机数,获取所述随机数ξ;

1c)当ξ>ε或最优轨迹数据集为空集时,则本次迭代采取随机方法;当ξ≤ε时,则本次迭代采取机器学习方法;

1d)计算本次迭代局部轨迹预计路程将该路程sk与最短轨迹路程相比,当且α≥1,则将当前迭代局部轨迹qk存入最优轨迹数据集中,即令否则,则最优轨迹数据集保持不变,同时迭代计数增加1,即η←η+1。

1e)循环步骤1b)到步骤1d),直到迭代计数η≥c为止,得局部优化轨迹将局部优化轨迹添加到全局优化轨迹q中。

步骤1c)中随机方法的具体步骤为:

2a)初始化计步器i=0,获得当前任务地面终端的位置wk及下一任务地面终端的位置wk+1;

2b)已知在满足(1-α)||qk(i)-wk||+α||qk(i)-wk+1||≤(1-α)||qk(i+1)-wk||+α||qk(i+1)-wk+1||和||qk(i+1)-qk(i)||≤l的条件下,得θi的上界及下界θi表示无人机在第i个时隙至第i+1个时隙之间的飞行方向,θi的概率密度为根据θi的概率密度p(θi)随机选取θi值,得qk(i+1)=[xk(i+1),yk(i+1)]的坐标;

2c)计算传输速率

2d)更新rk←rk+r,

2e)转至步骤2b),直至||qk(i)-wk||≥d或α≥1或i≥mmax为止,得当前迭代局部轨迹qk。

步骤1c)中机器学习方法的具体步骤为:

3a)初始化计步器i=0,得目标通信地面终端的位置wk及下一任务地面终端的位置wk+1,获取初始位置qk(i)=[xk(i),yk(i)]及最优空间中的参数

3b)已知在满足(1-α)||qk(i)-wk||+α||qk(i)-wk+1||≤(1-α)||qk(i+1)-wk||+α||qk(i+1)-wk+1||和||qk(i+1)-qk(i)||≤l的条件下,得θi的上界和下界θi表示无人机在第i个时隙至第i+1个时隙之间的飞行方向,θi的概率密度p(θi)为根据θi的概率密度p(θi)随机选取θi值,得qk(i+1)=[xk(i+1),yk(i+1)]的坐标;

3c)计算传输速率

3d)更新rk←rk+r,

3e)转至步骤3b),直至||qk(i)-wk||≥d或α≥1或i≥mmax为止,得当前迭代局部轨迹qk。

其中,无人机轨迹通过[x(t),y(t),h],0≤t≤tp表示,其中,x(t)和y(t)分别表示在水平平面上投影的x坐标和y坐标,则无人机的投影位置q(t)=[x(t),y(t)],其中,0≤t≤t。

验证性实验

利用仿真数据集来验证算法性能:数据集包含k个地面终端的位置坐标和一个上级服务器的位置坐标(随机均匀分布),在实验中相同的参数为:l=10m;h=50m;p=10dbm,b=1mhz,γ0=69db,c=100000;

性能标准有

总路程

时间其中,v为无人机单位平均速度;

如图4所示,路线1为采用飞往地面终端中心位置的tsp算法的最短轨迹,其路程为2520米;路线2为本发明给出的最短轨迹,其路程为2231米;本发明的路径比tsp算法路径少289米,减少11.47%。

如图5所示,路线1为采用飞往地面终端中心位置的tsp算法的最短轨迹,其路程为2762米;路线2为本发明给出的最短轨迹,其路程为1888米;本发明的路径比tsp算法路径少874米,减少31.64%。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1