一种基于遗传算法的多USV群体协同避碰规划方法与流程

文档序号:17693748发布日期:2019-05-17 21:17阅读:343来源:国知局
一种基于遗传算法的多USV群体协同避碰规划方法与流程

本发明属于usv控制技术领域,具体涉及一种基于遗传算法的多usv群体协同避碰规划方法。



背景技术:

随着现代科学技术的发展,人类对海洋资源的开发利用方式变得多种多样,为了适应近海浅水域作战、开展搜集气象和海洋数据等非战斗性海军活动等任务而设计的usv(无人水面艇)脱颖而出。usv经常被用来在严峻复杂的海洋环境中执行各种特殊的、不适合有人平台完成的军事活动、海事监管、海洋安全巡航等任务,然而对于一些复杂、动态性高、难度较大的任务,单一的usv则难以胜任。在这种情况下,多usv以其整体优势逐渐被重视。而实现避碰功能是多usv航行作业的一大重要前提,避碰规划技术始终是usv技术研究的热点之一。目前,国内外对多usv避碰规划技术的研究较少,而应用遗传算法进行多usv避碰规划的则更少,具有代表性如文献[1],刘佳男.基于进化遗传算法的无人艇避碰系统研究[d].大连:大连海事大学硕士学位论文,2015.基于进化遗传算法设计的usv避碰决策系统采取启发式的种群初始化方法,由经济性、平滑性、安全性作为评价因子,并在传统遗传操作中新加入了删除、修复操作建立优化迭代过程。文献[2]何爱民、何晓文、肖滨.基于改进遗传算法的水下无人平台航路规划[j].青岛大学学报,2012,17(4):89-92.遗传算法的适应度函数结合了基于时变选择策略的模拟退火算法,利用模拟退火算法摆脱局部最优的能力来避免遗传算法陷入局部最优。文献[3]毕校伟、程向红.基于多种群遗传算法的水面无人艇航迹控制方法[j].测控技术,2018,37(4):1-5.中的多种群遗传算法采用不同种群取不同进化参数、改变种群进化模型和种群间添加移民算子的方法克服陷入局部最优的问题。

现有技术的缺陷:遗传算法作为一种智能化的全局搜索算法,应用到usv对象中进行避碰规划,存在陷入局部最优、过早收敛、子代最优劣于父代最优等问题。另一方面,算法迭代次数和种群容量决定每次优化时长,普遍具有实效性差的缺陷,文献[2]遗传算法的适应度函数中嵌套了模拟退火算法,算法求解困难且必定会大幅度增加每次迭代的时间,文献[3]多种群遗传算法采用的种群间移民算子作用很小,并且未考虑实际usv航行中的平滑性、稳定性等要求对转向和速度设限。文献[1]采用的启发式二进制初始化编码过程繁杂冗余,添加的删除、修复操作作用不大,经济性、平滑性、安全性作为评价因子难以建模衡量,并且设计的简单仿真案例无法证明算法的有效性。



技术实现要素:

本发明的目的在于提供一种基于遗传算法的多usv群体协同避碰规划方法,利用遗传算法的实时规划使多usv从起点出发驶向终点的过程中避开环境中所有静态障碍物、usv间不发生碰撞、不出现大角度转向与大范围加减速,并且遗传算法能够稳定、准确、快速得到最优解。

本发明的目的是这样实现的:

一种基于遗传算法的多usv群体协同避碰规划方法,包括如下步骤:

步骤1:采用浮点数编码方式对usv的速度调节量和艏向调节量进行初始化编码并设置控制参数;

步骤2:构建评价函数,计算出种群的每代个体的评价函数值从而对种群个体进行轮盘赌选择、离散交叉、高斯变异的遗传操作,建立迭代过程得出最优解;

步骤3:利用qt软件构建usv避碰规划仿真软件平台,添加雷达探测模块和遗传算法,设计典型的仿真案例验证方法的有效性。

所述步骤2中评价函数为:

式中f为评价函数值,其值衡为正,ωi+1为usv下一时刻选取第i个体的艏向角,d0为雷达坐标系的原点到障碍物的最短距离,d1表示本usv到另一usv的最短距离,d表示usv当前位置到对应终点的距离,ν和μ为障碍物边界上下限角,γ和δ为另一usv边界上下限角。

所述步骤2中轮盘赌选择是根据每个个体的评价函数值计算每个体被选择组成子代的概率,评价函数值越大的个体被选择的概率越大,并按照计算出的概率值随机选择个体组成下一代种群。

所述步骤2中离散交叉是随机选择个体配对后个体之间交换变量值且子代个体随机选择父代个体,将两个速度调节量和艏向调节量分开交叉,将航速变化量基因与航速变化量基因交叉、艏向变化量基因与艏向变化量基因交叉。

所述步骤2中高斯变异是产生一个服从高斯概率分布的随机数取代原来个体,按照一定的概率选择个体的某个变量进行变异操作。

所述步骤3设计典型的仿真案例,首先设置多usv对应的起点、终点位置;再设置航行环境中障碍物的形状、大小、位置,任意选择障碍物的数量形状大小位置参数;设置usv启动避碰的距离及最小安全距离;最后选择多usv实验的任务无通信的控制模式开始实验。

本发明有益效果在于:

(1)本发明利用遗传算法的优化作用实时规划出多usv的最优速度调节量和最优艏向调节量,使多个usv从起点出发躲避环境中所有静态障碍物到达终点,且航行过程中usv之间不发生碰撞、不出现大角度转向、大范围加减速;

(2)本发明解决了遗传算法的时效性差、陷入局部最优、过早收敛、子代最优劣于父代最优等问题以及航行过程的大角度转向、大范围加减速的不良航行问题。

附图说明

图1为雷达搜索图;

图2为离散交叉示意图;

图3为高斯变异法示意图;

图4为多usv任务无通信式避碰规划仿真效果图;

图5为多usv任务无通信式避碰规划速度变化趋势图;

图6为多usv任务无通信式避碰规划艏向变化趋势图;

图7为多usv任务无通信式避碰规划三艇相对距离变化趋势图;

图8为多usv任务无通信式避碰规划遗传算法迭代优化图。

具体实施方式

下面结合附图对本发明做更进一步描述。

多usv群体协同避碰规划方法中采用几何环境模型建模来描述usv航行环境、usv实时位置等,环境地图赋值法表示存在障碍物和其他usv。

多usv群体协同避碰规划方法的实现过程为:

步骤一、采用浮点数编码方式对usv的速度调节量和艏向调节量进行初始化编码以及设置算法的其他控制参数。

步骤二、综合考虑平滑性等指标构建评价函数,计算出种群的每代个体的评价函数值从而对种群个体进行轮盘赌选择、离散交叉、高斯变异的遗传操作,设计最优保留操作改善算法性能后建立迭代过程得出最优解。

步骤三、利用qt软件构建usv避碰规划仿真软件平台,添加雷达探测模块和遗传算法,设计典型的仿真案例验证算法的有效性。

图1是雷达搜索图,图中o0-x0y0为本usv雷达随动坐标系,圆表示雷达检测的范围。其中a为障碍物,o1为另一usv的雷达坐标系原点,d0为雷达坐标系的原点到障碍物的最短距离,d1表示本usv到另一usv的最短距离,d表示usv当前位置到相对应终点的距离。μ为障碍物边界下限角(雷达坐标系原点与雷达检测到的障碍物下边界点的夹角),ν为障碍物边界上限角(雷达坐标系原点与雷达检测到的障碍物上边界点的夹角)。δ为另一usv边界下限角(雷达坐标系原点与雷达检测到的另一usv下边界点的夹角),γ为另一usv边界上限角(雷达坐标系原点与雷达检测到的另一usv上边界点的夹角)。

个体编码与种群初始化设计过程如下:

遗传算法共有二进制编码、格雷码编码、浮点数编码等多种编码方式,传统上普遍使用的二进制编码方式存在编码、解码过程复杂、操作麻烦、程序冗余的缺陷。比较几种编码方式,浮点数编码方式最为简便快捷,所以种群初始化采取浮点数编码方式,减少程度迭代耗费的时间。浮点数编码方法是用某一范围内的浮点数来表示个体基因值,变量的个数决定了个体编码长度。

usv运动控制通常采用“艏向控制”和“速度控制”的策略,那么本文变量取为速度调节量和艏向调节量。每个usv的初始种群设置50个个体(染色体),个体编码长度为2,其中第jusv每个个体ij(δvji,δωji)包含当前usv速度调节量δvji和航行器艏向调节量δωji两部分,经评价函数选择迭代后找到当前最优的速度调节量与艏向调节量。

任意设置第jusv的初始位置(xj0,yj0),而每个usv初始速度v0和初始艏向ω0则分别取(10,40)节和(0°,360°)范围内的任意值。另外,考虑到保证usv的航行稳定性和避免出现大角度转向与紧急加减速(平滑性),则设置每个usv的速度改变量的变化范围为+2节到-2节,速度的变化范围为10节到40节;每个无人航行器艏向变化量的变化范围-15°到+15°,即艏向调节量δω初始化时取-15°~15°范围内的随机数。

每个usv进行完当前时刻状态的寻优后,下一时刻的当前位置、当前速度与艏向、终点位置、航行环境中障碍物的位置以及航行器到障碍物的距离等参数发生了变化,需要重新进行下一时刻的初始化种群,再找到这时刻的最优解。那么,由每一时刻的最优速度调节量与艏向调节量组成了第jusv的一系列最优解结构为:

(δv0,δω0)→(δv1,δω1)→…→(δvi,δωi)→…→(δvn,δωn)

其中,(δvi,δωi)为第i次优化的最优解。

假设第jusv当前的位置为(xji,yji),当前的速度和艏向为(vji,ωji),第i步遗传算法迭代得到最优解为(δvji,δωji),那么下一时刻的航速和艏向为:

下一时刻的位置为:

假设(xj0,yj0)和(xjn,yjn)为第jusv的起点和终点,(xji,yji)为第i次优化的最优解求出的路径点,由此组成一条第jusv的最优路径。其结构为:

(xj0,yj0)→(xj1,yj1)→…→(xji,yji)→…→(xjn,yjn)

步骤二中,构建评价函数时应充分综合每个usv的当前位置及当前位置到终点的距离、当前速度与艏向、终点位置、航行环境中障碍物的位置以及usv到障碍物的距离等因素。如图1的usv雷达搜索图,其模拟同时搜索到障碍物与其他usv的状态,d0为雷达坐标系的原点到障碍物的最短距离,d1表示本usv到另一usv的最短距离,d表示usv当前位置到对应终点的距离。ν和μ为障碍物边界上下限角,γ和δ为另一usv边界上下限角。那么,本文中usv避碰规划的评价函数取为:

式中,f为评价函数值,其值衡为正,f值越大被选择成为子代的可能性越大。ωi+1为usv下一时刻选取第i个体的艏向角。评价函数采取奖惩机制增大区分度,当所取个体的下一时刻艏向角在障碍物边界上下限角范围内或者另一usv边界上下限角范围内,对其评价函数值缩小100倍使其被选择的概率减小;当所取个体的下一时刻的艏向角不在障碍物边界上下限角范围内和另一usv边界上下限角范围内,对其评价函数值扩大100倍使其被选择的概率增大,为极大值求解。

计算出种群个体的评价函数值后,选择轮盘赌选择法根据每个个体的评价函数值计算每个体被选择组成子代的概率,评价函数值越大的个体被选择的概率越大,并按照计算出的概率值随机选择个体组成下一代种群。

假设f(ji)(i=1,2,…,50)为第jusv该代种群50个体的评价函数值,则每个体被选择的概率为:

每个个体的累计概率:

之后产生区间[0,1]范围内的随机数p,若p<q(i),则选择个体i;否则选择满足q(k-1)<p<q(k)条件的个体k。这样重复50次后则完成了选择操作。

如图2,采用最为适应的离散交叉,即随机选择个体配对后个体之间交换变量值且子代个体随机选择父代个体,这里的交叉概率设置为0.8。这里将两个速度调节量和艏向调节量分开交叉,即航速变化量基因与航速变化量基因交叉、艏向变化量基因与艏向变化量基因交叉。

如图3所示,选择高斯变异方式,即产生一个服从高斯概率分布的随机数取代原来个体,这里按照一定的概率选择个体的某个变量进行变异操作。初始化时设置50个种群个体,则这里设置种群个体的倒数0.02为变异概率。

为了有效解决交叉、变异进化过程中随机性较强搜索效率低下致使进化迭代过程中出现子代最优个体劣于父代最优个体的“退化”问题,这里在传统遗传算法的而基础上添加了保留操作,即比较父代子代种群的评价函数值,将其中最优个体完整的保留到下一代中。而早熟现象和局部寻优能力差的原因正是没有保留父代优良个体,所以这里的保留操作也有效解决了这两个问题。

最后,经过若干代种群的迭代后判断算法是否满足迭代结束条件,若满足,则输出最优个体的航速变化量和艏向变化量,若不满足,则重新构造评价函数进行迭代。

步骤三中,在qt平台构建的仿真平台中设计典型的仿真案例来验证基于遗传算法的多usv群体协同避碰规划方法的有效性和可行性。首先设置多usv对应的起点、终点位置,这里可以设置任意位置,为了更好的实验效果这里选择3-5个usv;再设置航行环境中障碍物的形状、大小、位置,任意选择障碍物的数量形状大小位置参数;设置usv启动避碰的距离为8海里,最小安全距离为1海里;最后选择多usv实验的任务无通信的控制模式开始实验。

如图4的多usv任务无通信式避碰规划实验仿真效果图,实验中usv从起点向终点出发,当usv离障碍物较远时沿直线航行,当usv航行到障碍物附近时通过雷达探测到了障碍物信息,从两侧绕开障碍物后继续向终点航行,并且usv之间未发生碰撞,避碰效果良好。多usv路径圆滑证明了航行过程没有出现大角度转弯和紧急加减速,具有较好的平滑性。早熟现象和局部寻优能力差的表现是航迹上存在尖峰,这里并不存在此问题,证明了保留操作的提高局部寻优能力、提高搜索效率的作用。

如图5的多usv任务式避碰规划速度调节量变化趋势图和图6多usv任务无通信式避碰规划艏向调节量变化趋势图,速度调节量始终在-2节到+2节之间变化,艏向调节量始终在到之间变化,并无大角度转弯和紧急加减速,再一次证明了具有较好的平滑性。

如图7多usv任务无通信式避碰规划三艇相对距离变化趋势图显示的航行过程中三个usv的相对距离变化趋势,usv之间并未发生相撞。如图8多usv任务无通信式避碰规划遗传算法迭代优化图显示的优化过程中种群个体评价函数值的变化趋势,每个usv评价函数值的变化趋势都大致相似,即算法的迭代次数越多,种群个体的评价函数值越大,为最大值优化。从图中可以看出此次实验中200次迭代以后评价函数值保持恒值不变,然而为了测试出最优迭代次数,这里保持其他参数不变,改变迭代次数多次试验,最后测试出迭代次数500最合适,这里对早熟现象和局部最优问题也有一定改善。

一次迭代优化求解过程实际用时约0.5秒,如果按usv最高航速计算,每次优化过程usv最多航行0.05海里,相比于制定的2海里启动避碰距离和0.2海里的最小安全距离,usv具有足够的时间和转弯半径来进行躲避。

本发明的关键点:

1、设计编码与初始化方式对控制变量进行个体编码与种群初始化设计;2、评价函数的建立;3、设计选择、交叉、变异方式建立迭代过程;4、设计寻优保留操作。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1