无人机和有人机混合编队内的在线信息分发方法和装置与流程

文档序号:11275694阅读:517来源:国知局
无人机和有人机混合编队内的在线信息分发方法和装置与流程
本发明涉及无人机领域,尤其涉及一种无人机和有人机混合编队内的在线信息分发方法和装置。
背景技术
:无人-有人协同是一种由无人机与有人机组成的混合编队共同执行任务的途径和方法。通过借助无人机的低成本、作战持续时间长的特点以及有人机的模糊决策能力强和抗干扰能力突出等特点,可以有效地提高任务执行效果。在无人/有人协同执行任务过程中,各类信息在通信网络拓扑中的有效通讯关系到编队任务的执行效果。其中,通信网络拓扑为编队内所有可用的通信链路。目前,针对无人机编队的任务规划问题的研究主要集中在静态规划方面。然而,编队内部的通信网络拓扑往往呈现动态的变化特征、各飞行器之间的信息交互需求的产生和灭失也往往具有动态和随机的特点,现有的方法面对错综复杂的真实环境,编队效果不佳。技术实现要素:(一)要解决的技术问题为了作出针对实时环境和信息需求变化的无人机和有人机混合编队内的在线信息分发方案,本发明提供一种无人机和有人机混合编队内的在线信息分发方法,当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;基于分发信息、通信网络拓扑的状态、优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;执行在线信息分发方案,实现分发信息的在线分发。(二)技术方案为了达到上述目的,本发明采用的主要技术方案包括:一种无人机和有人机混合编队内的在线信息分发方法,所述方法包括:101,当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;102,基于所述分发信息、所述通信网络拓扑的状态、所述优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;103,执行所述在线信息分发方案,实现所述分发信息的在线分发。可选地,在线信息分发条件每隔预设时间段被触发一次;或者,若预先设定一件或多件触发事件,则当确定预先设定的任一触发事件发生时,在线信息分发条件被触发。可选地,所述触发事件为通信链路拥堵,或者,所述触发事件为通信链路中断。可选地,所述优化子问题参数包括:当前时刻u对应的滚动窗的时间起点geu,u对应的滚动窗的时间终点glu,所述分发信息k最早到达信息宿enk的时间ek,所述k最迟到达enk的时间lk,所述k从信息源bnk开始分发时刻btk,所述k实际到达enk的时刻etk,所述通信网络拓扑中可接受的最大时延dw,所述k需要的带宽twk;所述enk为接收所述k的无人或者有人机,所述bnk为提供所述k的无人或者有人机。可选地,执行步骤102之前,还包括:200,建立优化子问题模型;所述优化子问题模型如下:目标函数:约束条件:(ek+lk)/2≥geu,k∈t;(ek+lk)/2≤glu,k∈t;etk≤lk,k∈t;etk≥ek,k∈t;etk-btk≤dw,k∈t;其中,ctijk为k从i传递到j发生的传输时延,ftijk为k从i传递到j发生的传播时延,zij为i到j的有向边<i,j>的通信链路的状态,i、j、m均为通信网络拓扑所对应的有向图中的节点,v为通信网络拓扑所对应的有向图中节点的集合,t为分发信息的集合,bwm为m能提供的最大数据量,nwij为<i,j>能承受的最大带宽,xijk、xmjk、为决策变量。可选地,执行步骤200之后,还包括:300,求解所述建立优化子问题模型。可选地,步骤300具体包括:300-1,令t=1,counter=1;300-2,生成初始解,组成初始种群pop(t);300-3,计算pop(t)中各个染色体的目标函数值popcost(t);300-4,计算各个染色体的适应度函数值popfitness(t),所述popfitness(t)=m-popcost(t),其中,m为极大自然数;300-5,采用锦标赛法对popcost(t)进行选择算子操作,得到selectpop(t);300-6,随机在selectpop(t)中选取2个第一染色体,并基于所述第一染色体随机选取2个交叉点,交换两点之间所有任务序列,得到第一新种群crosspop(t);300-7,随机在crosspop(t)中选取1个第二染色体,随机选取所述第二染色体中2个变异位,并交换任务队列,得到第二新种群mutapop(t);300-8,对各个染色体进行可行性校验,并以预设概率对未通过可行性校验的染色体进行变异,对于变异后仍然无法通过可行性校验的染色体添加惩罚值punish;300-9,记录当前最优解;300-10,从mutapop(t)中选取预设数量updatep×popsize个染色体,同时,从pop(t)中选取(1-updatep)×popsize个染色体,组成下一代种群pop(t+1),所述popsize为所述初始解的个数;300-11,令t=t+1,counter=counter+1;300-12,若counter≤预设最大值,则返回步骤300-3,否则执行步骤300-13;300-13,输出pop(t)中的最优染色体。可选地,步骤300-2中生成初始解具体包括:300-2-1,令计数器q=1;300-2-2,若q与所述popsize相同,则执行步骤300-2-12,若q与所述popsize不相同,则执行步骤300-2-3;300-2-3,根据t生成染色体列表chromq,所述chromq包括基因的标志位参数taskflag,转发节点参数和转发时间参数;300-2-4,将所述通信网络拓扑中各节点的taskflag设置为1;300-2-5,读取t中各个信息的宿节点taskr;300-2-6,为每个待发信息随机生成信息源task1,其中,task1≠taskr;300-2-7,随机生成r-2个中间转发节点,各中间转发节点、task1和taskr之间不重复,r为所述通信网络拓扑中的节点总数量;300-2-8,将非中间转发节点的taskflag设置为-1;300-2-9,读取t中各个信息的时间窗,在时间窗中随机生成一个时间time;300-2-10,基于所述time计算各个中间转发节点的转发时间;300-2-11,记录当前chromq,q=q+1,返回步骤300-2-2;300-2-12,生成初始解population={chromq|q≤popsize}。除此之外,本发明采用的主要技术方案还包括:一种无人机和有人机混合编队内的在线信息分发装置,所述装置包括:第一获取模块,用于当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;第二获取模块,用于基于所述分发信息、所述通信网络拓扑的状态、所述优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;分发模块,用于执行所述在线信息分发方案,实现所述分发信息的在线分发;其中,在线信息分发条件每隔预设时间段被触发一次;或者,若预先设定一件或多件触发事件,则当确定预先设定的任一触发事件发生时,在线信息分发条件被触发;其中,所述触发事件为通信链路拥堵,或者,所述触发事件为通信链路中断;其中,所述优化子问题参数包括:当前时刻u对应的滚动窗的时间起点geu,u对应的滚动窗的时间终点glu,所述分发信息k最早到达信息宿enk的时间ek,所述k最迟到达enk的时间lk,所述k从信息源bnk开始分发时刻btk,所述k实际到达enk的时刻etk,所述通信网络拓扑中可接受的最大时延dw,所述k需要的带宽twk;所述enk为接收所述k的无人或者有人机,所述bnk为提供所述k的无人或者有人机。可选地,所述装置还包括:建立模块,用于建立优化子问题模型;所述优化子问题模型如下:目标函数:约束条件:(ek+lk)/2≥geu,k∈t;(ek+lk)/2≤glu,k∈t;etk≤lk,k∈t;etk≥ek,k∈t;etk-btk≤dw,k∈t;其中,ctijk为k从i传递到j发生的传输时延,ftijk为k从i传递到j发生的传播时延,zij为i到j的有向边<i,j>的通信链路的状态,i、j、m均为通信网络拓扑所对应的有向图中的节点,v为通信网络拓扑所对应的有向图中节点的集合,t为分发信息的集合,bwm为m能提供的最大数据量,nwij为<i,j>能承受的最大带宽,xijk、xmjk、为决策变量。可选地,所述装置还包括:求解模块,用于求解所述建立优化子问题模型;具体用于:300-1,令t=1,counter=1;300-2,生成初始解,组成初始种群pop(t);300-3,计算pop(t)中各个染色体的目标函数值popcost(t);300-4,计算各个染色体的适应度函数值popfitness(t),所述popfitness(t)=m-popcost(t),其中,m为极大自然数;300-5,采用锦标赛法对popcost(t)进行选择算子操作,得到selectpop(t);300-6,随机在selectpop(t)中选取2个第一染色体,并基于所述第一染色体随机选取2个交叉点,交换两点之间所有任务序列,得到第一新种群crosspop(t);300-7,随机在crosspop(t)中选取1个第二染色体,随机选取所述第二染色体中2个变异位,并交换任务队列,得到第二新种群mutapop(t);300-8,对各个染色体进行可行性校验,并以预设概率对未通过可行性校验的染色体进行变异,对于变异后仍然无法通过可行性校验的染色体添加惩罚值punish;300-9,记录当前最优解;300-10,从mutapop(t)中选取预设数量updatep×popsize个染色体,同时,从pop(t)中选取(1-updatep)×popsize个染色体,组成下一代种群pop(t+1),所述popsize为所述初始解的个数;300-11,令t=t+1,counter=counter+1;300-12,若counter≤预设最大值,则返回步骤300-3,否则执行步骤300-13;300-13,输出pop(t)中的最优染色体;其中,步骤300-2中生成初始解具体包括:300-2-1,令计数器q=1;300-2-2,若q与所述popsize相同,则执行步骤300-2-12,若q与所述popsize不相同,则执行步骤300-2-3;300-2-3,根据t生成染色体列表chromq,所述chromq包括基因的标志位参数taskflag,转发节点参数和转发时间参数;300-2-4,将所述通信网络拓扑中各节点的taskflag设置为1;300-2-5,读取t中各个信息的宿节点taskr;300-2-6,为每个待发信息随机生成信息源task1,其中,task1≠taskr;300-2-7,随机生成r-2个中间转发节点,各中间转发节点、task1和taskr之间不重复,r为所述通信网络拓扑中的节点总数量;300-2-8,将非中间转发节点的taskflag设置为-1;300-2-9,读取t中各个信息的时间窗,在时间窗中随机生成一个时间time;300-2-10,基于所述time计算各个中间转发节点的转发时间;300-2-11,记录当前chromq,q=q+1,返回步骤300-2-2;300-2-12,生成初始解population={chromq|q≤popsize}。(三)有益效果本发明的有益效果是:当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;基于分发信息、通信网络拓扑的状态、优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;执行在线信息分发方案,实现分发信息的在线分发,实现动态情形下的在线信息分发,即仅对当前局部优化问题求解最优解,避免了现有技术中分发方案与应对环境和信息需求的变化不匹配的问题。附图说明图1为本发明一个实施例提供的预测窗口与滚动窗口的关系示意图;图2为本发明一个实施例提供的优化子问题模型建立流程图;图3为本发明一个实施例提供的一种无人机和有人机混合编队内的在线信息分发方法流程图;图4为本发明一个实施例提供的另一种无人机和有人机混合编队内的在线信息分发方法流程图;图5为本发明一个实施例提供的一种无人机和有人机混合编队内的在线信息分发装置结构示意图;图6为本发明一个实施例提供的另一种无人机和有人机混合编队内的在线信息分发装置结构示意图;图7为本发明一个实施例提供的另一种无人机和有人机混合编队内的在线信息分发装置结构示意图。具体实施方式为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。如何在动态环境下更好的进行无人机和有人机混合编队内的在线信息分发是在线信息分发过程中的关键问题,在线在线信息分发不仅需要满足现有网络拓扑性能的限制,同时还需要及时的对在线信息分发需求的变化做出反应。本发明针对这一问题提出了一种无人机和有人机混合编队内的在线信息分发方法,可以基于滚动时域优化进行在线信息分发,通过响应环境的变化和不断地求解子优化问题模型,从而实现全局优化。本发明一实施例提供了一种无人机和有人机混合编队内的在线信息分发方法,该方法将滚动时域优化方法应用于在线信息分发领域,实现动态情形下的在线信息分发,即仅对当前局部优化问题求解最优解,避免了现有技术中分发方案与应对环境和信息需求的变化不匹配的问题。本实施例提供的方法在具体实施时,会基于滚动时域优化方法建立优化子问题模型。滚动时域优化方法采用滚动式有限时域优化策略,即将任务的执行过程划分为若干个连续的时间片段,优化过程只在基于当前时刻起的若干个连续的时间片段所组成的优化区间内进行。随着任务的进行,优化区间不断向前滚动,滚动时域优化就是通过不断地在优化区间中求解局部优化问题来取代求解全局静态优化问题,进而实现全局最优化的方法。在每一步优化区间内,仅对当前局部优化问题求解最优解,并执行优化结果,其中,局部优化问题的目标和约束与全局优化问题的目标和约束是一致的,但需要根据即时信息对局部优化问题的相关参数进行更新。由此,滚动时域优化方法形成了一种闭环控制机制,通过跟踪和预测环境的变化,可以很好地弥补静态优化方法的反馈控制不足的问题,对环境的动态性有很好的适应性。滚动时域优化方法中的主要要素包括:(1)预测窗口预测窗口是指从当前时刻t起未来若干个时间片段内的已知或预测的全部信息的集合,可以用fw(t)={tfw,tfw(t),ifw(t)}表示。其中tfw表示预测窗口fw(t)的大小,则预测窗口的时间区域为[t,t+tfw];tfw(t)表示所有未执行任务的集合;ifw(t)表示预测窗口内所有已知信息或预测信息的集合。(2)滚动窗口滚动窗口指在当前时刻t,从预测窗口中按照一定规则选择出用于子优化问题求解的部分已知或预测信息的集合,用nw(t)={tnw,tnw(t),inw(t)}表示,其中tnw表示滚动窗口nw(t)的大小,tnw=n×δt,滚动窗口的时间区域可以表示为[t,t+tnw];tnw(t)表示落入滚动窗口中的任务集合;inw(t)表示滚动窗口内所有已知信息或预测信息的集合。由此,预测窗口与滚动窗口的关系如图1所示。本实施例基于滚动时域优化方法以及无人-有人机编队协同在线信息分发问题所面对的复杂动态环境,在影响分发方案执行效率的众多环境因素中确定主要影响因素是信息集的动态性与网络拓扑的动态性。因此,本实施将在线信息分发场景下的优化子问题描述为:无人-有人机编队协同完成任务过程中,编队内部通过点对点的通信链路进行无人机和有人机混合编队内的在线信息分发。在本实施中,将编队内所有可用的通信链路称为通信网络拓扑,将提供信息的无人/有人机称为信息源,将接收信息的无人/有人机称为信息宿。在执行任务过程中编队内部除了既定的信息发送需求,还存在即时产生的信息发送需求,同时,通信网络拓扑会由于受到内、外部因素等的干扰而呈现动态不确定型变化。此时,动态情形下的无人机和有人机混合编队内的在线信息分发问题可以描述为:基于当前的待分发信息集与网络拓扑状态,并考虑带宽、时间窗、信息源和时延的约束下,选择合适的信息源,规划信息从信息源发送的时间序列、信息量大小以及转发方式,使得信息到达信息宿的时间尽可能少。至此,本实施例用有向图g(v,e)表示无人机/有人机之间所有可用的通信网络拓扑,将无人机和有人机描述为通信网络拓扑中的节点,将所有可用的通信链路描述为通信网络拓扑中的有向边。基于此,本实施例建立的优化子问题模型如下:目标函数:约束条件:(ek+lk)/2≥geu,k∈t(2);(ek+lk)/2≤glu,k∈t(3);etk≤lk,k∈t(7);etk≥ek,k∈t(8);etk-btk≤dw,k∈t(9);上述优化子问题模型中各参数解释如下:i、j、m均为通信网络拓扑所对应的有向图中的节点。k为待分发信息。t为分发信息的集合。v:v={uav1,uav2,…,uavn,mv1,mv2,…,mvs}表示通信网络拓扑中节点集合,其中,uavi表示第i架无人机,用n表示无人机总数,mvj表示第j架有人机,用s表示有人机总数。e:e={<i,j>|i,j∈v,i≠j}表示有向边集合,<i,j>表示通信网络拓扑中节点i到节点j的有向边。w:w={wij|i,j∈v}表示通信网络拓扑图中每条有向边的权值集合,其中wij表示i到j之间的实际距离。z:z={zij|zij≥1,i,j∈v}表示通信网络拓扑的连通状态,其中zij表示<i,j>的通信链路的状态,zij=1表示通信链路<i,j>的可以正常使用,随着zij取值的增大,表示通信链路<i,j>处的连通状态逐渐下降。[geu,glu]表示当前时刻u的滚动窗口,geu表示滚动窗口的时间起点,glu表示滚动窗口的时间终点。t:t={1,2,…,t}表示待分发信息集合,t表示集合中元素的个数;[ek,lk]表示待分发信息k的时间窗,ek表示最早到达信息宿的时间,lk表示最迟到达信息宿的时间。btk表示待分发信息k从信息源开始分发时刻。etk表示k实际到达信息宿的时刻。bnk表示k的信息源,其中,信息源为提供k的无人或者有人机。enk表示k的信息宿,其中,信息宿为接收k的无人或者有人机。ctijk表示k从i传递到j发生的传输时延,当ctijk=0时,表示k不从节点i传递到节点j。ftijk表示k从i传递到j发生的传播时延,当ftijk=0时,表示k不从节点i传递到节点j。dw表示通信网络拓扑中可接受的最大时延。twk表示k所需要的带宽。nwij表示通信网络拓扑中有向边<i,j>所能承受的最大带宽。bwi表示通信网络拓扑中节点i所能提供的最大数据量。bwm为m能提供的最大数据量。xijk、xmjk、为决策变量。xijk=1表示k从节点i传递到节点j,xijk=1表示k不从节点i传递到节点j。公式(4)为信源约束,即信息源发出的总数据量不能超出信息源的供应能力。公式(5)带宽约束,即通信链路中同时能够传递的待分发信息数据量之和不得超过通信网络拓扑的平均带宽。公式(6)、公式(7)和公式(8)为时间窗约束,即待分发信息必须在指定的时间窗内完成分发传递。公式(9)为时延约束,即待分发信息的传输时延和传播时延不得超过通信网络拓扑的最大时延;公式(10)和公式(11)为信息分发约束,公式(10)表示每个待分发信息有且只有一个信息源,公式(11)表示每个待分发信息有且只有一个信息宿。公式(12)转发约束,即任意一个节点不能多次转发同一个待分发信息。本实施例将该优化子问题模型作为动态情形下的在线信息分发模型。在得当上述优化子问题模型之后,本实施例还会验证模型的有效性。具体采用遗传算法(geneticalgorithm,ga)对上述优化子问题模型进行求解。ga是一种模拟达尔文的生物进化论思想和遗传学机理的计算模型,是一种通过模拟自然进化过程寻找最优解的算法。相比于其他智能算法,ga具有搜索效率高、全局优化性好以及较好的鲁棒性等特点,因此适应解决组合优化问题。本实施例实现ga求解优化子问题模型,即动态情形下的在线信息分发模型的具体方法为,首先选取出未分发的信息队列中落入滚动窗口的信息,生成待分发信息集合。然后对问题的解进行编码形成染色体,并选取若干条染色体构成初始解种群。随后按照ga流程循环进行选择、交叉、变异和更新等操作,最终找到种群中的最优染色体作为模型的最优解。在执行上述方法时,用y表示待分发信息集合中元素个数,用r表示通信网络拓扑中的节点总数量。用t作为染色体中的基因数量,同时基因采用s元组的方式进行编码,其中s=1+r+r,如下所示:gene=(taskflag,task1,task2,...,taskr,time1,time2,...,timer)其中,taskflag为基因的标志位,表示该待分发信息是否被分发;task2,task3,...,taskr-1表示该待分发信息的r-2个转发节点,task1表示待分发信息的信息源,taskr表示待分发信息的信息宿;与转发节点对应,time1,time2,...,timer表示该待分发信息的r-1个转发时间,time1表示待分发信息开始发送的时刻,timer表示待分发信息到达信息宿的时刻。下表1描述了y=4,r=3的染色体的编码结构,其中第一个基因表示该信息被发送,发送的信息源是节点1,不经过转发直接被发送至节点2(信息宿),发送的起始时间时0,到达信息宿的时间是2.5。表1taskflagtask1task2task3time1time2time311-120-12.511235.579.512133510.513-115-115.75参见图2,本实施例通过遗传算法对优化子问题模型进行求解,同时,可以验证模型的有效性。本实施例提供的验证建立优化子问题模型的有效性方法在经典遗传算法的基础上结合无人机和有人机混合编队内的在线信息分发问题的特点,添加了“第二变异算子”,即在对染色体进行可行性校验时,对导致染色体不可行的关键基因进行变异,这样处理更有利于保留原染色体中的优良基因。本实施例提供的求解优化子问题模型的方法在初始population基础上,通过选择算子、交叉算子、变异算子、约束校验(第二变异算子)和更新算子等操作对population进行迭代寻优,并最终得到最优染色体。具体步骤如下:300-1,令t=1,counter=1。300-2,生成初始解,组成初始种群pop(t)。针对动态情形下在线信息分发模型的ga,本实施例提出了初始解population。在生成初始解时,采用随机化生成的思想,从而可以使初始解尽可能的包含所有解空间。具体的,通过如下12个步骤实现。300-2-1,令计数器q=1。300-2-2,若q与popsize相同,则执行步骤300-2-12,若q与popsize不相同,则执行步骤300-2-3。其中,popsize为初始解的数量,该值可以为预设值。300-2-3,根据t生成染色体列表chromq,chromq如表1所示包括基因的标志位参数taskflag,转发节点参数和转发时间参数。300-2-4,将通信网络拓扑中各节点的taskflag设置为1。300-2-5,读取t中各个信息的宿节点taskr。300-2-6,为每个待发信息随机生成信息源task1,其中,task1≠taskr。300-2-7,随机生成r-2个中间转发节点,各中间转发节点、task1和taskr之间不重复,r为通信网络拓扑中的节点总数量。300-2-8,将非中间转发节点的taskflag设置为-1。300-2-9,读取t中各个信息的时间窗,在时间窗中随机生成一个时间time。300-2-10,基于time计算各个中间转发节点的转发时间。300-2-11,记录当前chromq,q=q+1,返回步骤300-2-2。300-2-12,生成初始解population={chromq|q≤popsize}。300-3,计算pop(t)中各个染色体的目标函数值popcost(t)。300-4,计算各个染色体的适应度目标函数值popfitness(t),popfitness(t)=m-popcost(t),其中,m为极大自然数。300-5,采用锦标赛法对popcost(t)进行选择算子操作,得到selectpop(t)。300-6,根据交叉概率crossp进行交叉算子操作,即随机在selectpop(t)中选取2个第一染色体,如chromosome-1和chromosome-2,并基于第一染色体随机选取2个交叉点,交换两点之间所有任务序列,得到第一新种群crosspop(t)。300-7,根据变异概率mutap进行变异算子操作,即随机在crosspop(t)中选取1个第二染色体,如chromosome-x,随机选取第二染色体(如chromosome-x)中2个变异位,并交换任务队列,得到第二新种群mutapop(t)。300-8,第二变异算子操作(2ndmutationregulation,mr2),即对各个染色体进行可行性校验,并以预设概率对未通过可行性校验的染色体进行变异,对于变异后仍然无法通过可行性校验的染色体添加惩罚值punish。本步骤的第二变异算子操作,是针对在线信息分发场景的特点在基本遗传算法流程上做的改进。对于不具有实际可行性染色体,对其中导致整个染色体不可行的部分基因进行变异,使该染色体尽可能具有可行性,对于仍然无法通过可行性校验的染色体增加惩罚值,使其有较大的概率无法遗传到下一代。第二变异算子的优点在于尽可能的保留了种群中基因的多样性,使染色体不会仅因为部分较差的基因而使整个染色体被淘汰。300-9,记录当前最优解。300-10,将预设数量updatep作为更新率,根据更新率(即updatep)进行变异算子操作,即从mutapop(t)中选取预设数量updatep×popsize个染色体,同时,从pop(t)中选取(1-updatep)×popsize个染色体,组成下一代种群pop(t+1)。300-11,令t=t+1,counter=counter+1。300-12,若counter≤预设最大值,则返回步骤300-3,否则执行步骤300-13。300-13,输出pop(t)中的最优染色体。在经过上述过程得到优化子问题模型后,可以通过图3所示的过程进行动态情形下的无人机和有人机混合编队内的在线信息分发。101,当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数。本步骤中,在线信息分发条件在如下情况下被触发:在线信息分发条件每隔预设时间段被触发一次;或者,若预先设定一件或多件触发事件,则当确定预先设定的任一触发事件发生时,在线信息分发条件被触发。其中,触发事件为通信链路拥堵,或者,触发事件为通信链路中断。通过上述触发条件构建了本实施例提供的无人机和有人机混合编队内的在线信息分发方法的滚动机制。包括滚动方式有周期性滚动机制和事件触发型滚动机制。周期型滚动机制是指,任务过程中按照周期循环的方式,每经过一个时间片时,执行实施例提供的方法,在决策点处开始一次滚动时域优化,得到当前滚动窗口内的在线信息分发方案。事件触发型滚动机制是指:当遇到诸如通信链路拥堵或中断等突发事件时,立即执行本实施例提供的方法,插入一次滚动时域优化过程,从而得到当前滚动窗口内的在线信息分发方案。滚动时域优化的核心是优化子问题,指对当前滚动窗口内的任务进行优化的问题。每当触发滚动机制时,通过本实施例提供的方法开始一次求解优化子问题过程,滚动时域优化就是通过求解连续的优化子问题进而实现全局优化的过程。其中,优化子问题参数包括:当前时刻u对应的滚动窗的时间起点geu,u对应的滚动窗的时间终点glu,分发信息k最早到达信息宿enk的时间ek,k最迟到达enk的时间lk,k从信息源bnk开始分发时刻btk,k实际到达enk的时刻etk,通信网络拓扑中可接受的最大时延dw,k需要的带宽twk;enk为接收k的无人或者有人机,bnk为提供k的无人或者有人机。102,基于分发信息、通信网络拓扑的状态、优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案。103,执行在线信息分发方案,实现分发信息的分发。本实施例提供的无人机和有人机混合编队内的在线信息分发方法,可以将滚动时域优化方法引入动态情形下的在线信息分发场景,即通过构造滚动时域优化框架,将无人/有人协同在线信息分发问题消解为若干个连续的优化子问题,并通过连续的求解优化子问题取代全局规划,从而实现全部在线信息分发问题的最优化。如图4所示,本实施例将在线信息分发问题的滚动时域优化框架描述为:将无人/有人协同在线信息分发的过程作为任务执行过程,其时间范围可以表示为[0,t],将该任务过程划分为若干个等长的连续时间片段,长度用δt表示,并称时间片之间的时间点为决策点,称由当前决策点起未来n个时间片段所组成的时间区域为滚动窗口,并在滚动窗口内建立优化子问题模型,其中子优化问题参数需要根据当前情形进行更新。触发滚动机制时滚动时域优化开始,滚动窗口向前滚动,并利用优化子问题模型对滚动窗口中的待分发信息进行分发,得到在线信息分发策略。当下一次滚动优化开始后,滚动窗口随之向前滚动。重复这一过程,直到所有信息在线分发完成。本实施例提供的方法能够有效的对信息进行分发。在应用到解决动态情形下的在线信息分发问题中时,针对无人机和有人机混合编队内的在线信息分发问题的特点,采用周期型滚动机制与事件触发型滚动机制交叉的混合滚动机制(mixedrollingmethod,mrm),即在任务的执行过程中按照周期型滚动方式向前推进,当遇到动态突发事件时,在周期型滚动方式的基础上,随即执行一次滚动优化过程,由此形成了混合型滚动方式。另外,将编队内所有信息发送需求作为优化目标,即用tfw(t)表示所有未分发信息,用ifw(t)表示网络拓扑的状态预测信息;对于滚动窗口,用tnw(t)表示落入当前滚动窗口的待分发信息集,用inw(t)表示当前网络拓扑的状态信息。当没有突发事件发生时,inw(t)来自ifw(t);当突发事件发生时,inw(t)表示受扰动后的当前网络拓扑状态。此外,采用循环滚动进行在线信息分发。当进行一次滚动优化时,优化子问题利用滚动窗口中的tnw(t)作为优化目标,进行在线信息分发,同时使在线信息分发策略满足当前的网络拓扑状态inw(t)。将全部信息按照时间窗进行分解,对待分发信息集中的信息利用优化子问题模型进行求解。本实施例提供的方法当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;基于分发信息、通信网络拓扑的状态、优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;执行在线信息分发方案,实现分发信息的在线分发,实现动态情形下的在线信息分发,即仅对当前局部优化问题求解最优解,避免了现有技术中分发方案与应对环境和信息需求的变化不匹配的问题。基于同一发明构思,本实施例提供一种无人机和有人机混合编队内的在线信息分发装置,由于该装置解决问题的原理与一种无人机和有人机混合编队内的在线信息分发方法相似,因此该装置的实施可以参见上述无人机和有人机混合编队内的在线信息分发方法的实施例,重复之处不再赘述。参见图5,本实施例提供的无人机和有人机混合编队内的在线信息分发装置包括:第一获取模块501,用于当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;第二获取模块502,用于基于分发信息、通信网络拓扑的状态、优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;分发模块503,用于执行在线信息分发方案,实现分发信息的在线分发;其中,在线信息分发条件每隔预设时间段被触发一次;或者,若预先设定一件或多件触发事件,则当确定预先设定的任一触发事件发生时,在线信息分发条件被触发;其中,触发事件为通信链路拥堵,或者,触发事件为通信链路中断;其中,优化子问题参数包括:当前时刻u对应的滚动窗的时间起点geu,u对应的滚动窗的时间终点glu,分发信息k最早到达信息宿enk的时间ek,k最迟到达enk的时间lk,k从信息源bnk开始分发时刻btk,k实际到达enk的时刻etk,通信网络拓扑中可接受的最大时延dw,k需要的带宽twk;enk为接收k的无人或者有人机,bnk为提供k的无人或者有人机。参见图6,该装置还包括:建立模块504,用于建立优化子问题模型;优化子问题模型如下:目标函数:约束条件:(ek+lk)/2≥geu,k∈t;(ek+lk)/2≤glu,k∈t;etk≤lk,k∈t;etk≥ek,k∈t;etk-btk≤dw,k∈t;其中,ctijk为k从i传递到j发生的传输时延,ftijk为k从i传递到j发生的传播时延,zij为i到j的有向边<i,j>的通信链路的状态,i、j、m均为通信网络拓扑所对应的有向图中的节点,v为通信网络拓扑所对应的有向图中节点的集合,t为分发信息的集合,bwm为m能提供的最大数据量,nwij为<i,j>能承受的最大带宽,xijk、xmjk、为决策变量。参见图7,该装置还包括:求解模块505,用于求解建立优化子问题模型;具体用于:300-1,令t=1,counter=1;300-2,生成初始解,组成初始种群pop(t);300-3,计算pop(t)中各个染色体的目标函数值popcost(t);300-4,计算各个染色体的适应度函数值popfitness(t),popfitness(t)=m-popcost(t),其中,m为极大自然数;300-5,采用锦标赛法对popcost(t)进行选择算子操作,得到selectpop(t);300-6,随机在selectpop(t)中选取2个第一染色体,并基于第一染色体随机选取2个交叉点,交换两点之间所有任务序列,得到第一新种群crosspop(t);300-7,随机在crosspop(t)中选取1个第二染色体,随机选取第二染色体中2个变异位,并交换任务队列,得到第二新种群mutapop(t);300-8,对各个染色体进行可行性校验,并以预设概率对未通过可行性校验的染色体进行变异,对于变异后仍然无法通过可行性校验的染色体添加惩罚值punish;300-9,记录当前最优解;300-10,从mutapop(t)中选取预设数量updatep×popsize个染色体,同时,从pop(t)中选取(1-updatep)×popsize个染色体,组成下一代种群pop(t+1),popsize为初始解的个数;300-11,令t=t+1,counter=counter+1;300-12,若counter≤预设最大值,则返回步骤300-3,否则执行步骤300-13;300-13,输出pop(t)中的最优染色体;其中,步骤300-2中生成初始解具体包括:300-2-1,令计数器q=1;300-2-2,若q与popsize相同,则执行步骤300-2-12,若q与popsize不相同,则执行步骤300-2-3;300-2-3,根据t生成染色体列表chromq,chromq包括基因的标志位参数taskflag,转发节点参数和转发时间参数;300-2-4,将通信网络拓扑中各节点的taskflag设置为1;300-2-5,读取t中各个信息的宿节点taskr;300-2-6,为每个待发信息随机生成信息源task1,其中,task1≠taskr;300-2-7,随机生成r-2个中间转发节点,各中间转发节点、task1和taskr之间不重复,r为通信网络拓扑中的节点总数量;300-2-8,将非中间转发节点的taskflag设置为-1;300-2-9,读取t中各个信息的时间窗,在时间窗中随机生成一个时间time;300-2-10,基于time计算各个中间转发节点的转发时间;300-2-11,记录当前chromq,q=q+1,返回步骤300-2-2;300-2-12,生成初始解population={chromq|q≤popsize}。本实施例提供的装置当在线信息分发条件被触发后,获取分发信息、通信网络拓扑的状态、优化子问题参数;基于分发信息、通信网络拓扑的状态、优化子问题参数,通过预先建立的优化子问题模型,获得在线信息分发方案;执行在线信息分发方案,实现分发信息的在线分发,实现动态情形下的在线信息分发,即仅对当前局部优化问题求解最优解,避免了现有技术中分发方案与应对环境和信息需求的变化不匹配的问题。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1