一种智能环境下机器人路径的多神经网络控制规划方法与流程

文档序号:11773220阅读:180来源:国知局

本发明属于机器人路径规划领域,特别涉及一种智能环境下机器人路径的多神经网络控制规划方法。



背景技术:

随着中国制造2025的深入发展,机器人在智能医疗、智能工厂、智能实验室等智能环境下的应用越来越多,机器人的智能化程度决定了生产科研活动的自动化水平,生产力的发展水平。其中,机器人路径规划问题是提高机器人运载效率的关键,如何高效、最优的解决机器人的路径规划问题一直是该领域的难点。

前人已经提出许多优秀的路径规划方法,有早期的可视图法、人工势场法、栅格法以及后来的蚁群算法、遗传算法、神经网络算法等。例如中国专利cn101604166b公开了一种基于粒子群优化算法的移动机器人路径规划方法,该方法优点在于具有相当快的逼近最优解的速度,简单且易于实现,具有鲁棒性,但是也容易由于过早收敛而陷入局部最优。又如中国专利cn105116902a中公开一种移动机器人避障导航的方法和系统,其利用的a*算法是机器人路径规划中最有效的直接搜索方法,搜索速度快,效率高,但是也易陷于局部最优,无法得到全局最优解。



技术实现要素:

本发明提供了一种智能环境下机器人路径的多神经网络控制规划方法,其目的在于,克服上述现有技术中存在的问题,通过分别建立全局静态路径规划模型和局部动态避障模型,利用神经网络的非线性拟合特性,快速的找到全局最优解,避免了常见的路径规划中陷入局部最优的问题。在全局静态路径规划中使用蝙蝠算法优化的模糊神经网络模型,局部动态避障规划中使用思维进化算法优化的多核支持向量机模型,保证了路径规划中路径的最优特性。

一种智能环境下机器人路径的多神经网络控制规划方法,包括以下步骤:

步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;

运载区域地面中心点为原点,正东方向为x轴,正北方向为y轴,垂直地面方向为z轴;

所述运载机器人运载区域为一个楼栋内所有的地板连通区域,所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域;

在全局地图三维坐标系中,每个楼层的地板连通区域的二维平面坐标相同,z坐标不同;

步骤2:获取训练样本集;

在全局地图三维坐标系中,设计至少200组可行走区域中不同的点到点的最优设计全局路径,以每条最优设计全局路径作为一个训练样本;

步骤3:构建运载机器人的全局静态路径规划模型;

利用全局训练样本集中每个全局样本的起点-终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据,对模糊神经网络进行训练,得到基于模糊神经网络的全局静态路径规划模型;

其中,在全局训练过程中,模糊神经网络所使用的权值、隶属函数均值以及方差采用蝙蝠算法进行寻优获得;

步骤4:将运输任务中的起点和终点坐标输入至基于模糊神经网络的全局静态路径规划模型,获得对应的运载机器人最优规划路径。

运载机器人依据得到的最优规划路径前行,完成运输任务。

从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后返回初始待命点。

进一步的,所述基于模糊神经网络的全局静态路径规划模型中模糊神经网络所使用的权值、隶属函数均值以及方差采用蝙蝠算法进行寻优获得的过程如下:

步骤2.1:以蝙蝠个体的位置作为模糊神经网络的权值、隶属函数均值以及方差,设置蝙蝠种群参数;

蝙蝠种群规模m的取值范围为[120,300],蝙蝠个体最大脉冲频度r0,取值范围为[0.45,0.55],最大脉冲声音强度a0的取值范围为[0.40,0.6],蝙蝠搜索频度增加系数的取值范围为[0.03,0.05],声音强度衰减系的取值范围为[0.90,0.95],适应度方差阈值的取值范围为[0.01,0.05],搜索脉冲频率的取值范围为[0,0.15],最大迭代次数的取值范围为[300,1000],最大搜索精度的取值范围为[0.001,0.01];

步骤2.2:随机初始化蝙蝠种群中每个蝙蝠个体的位置、速度和频率;

步骤2.3:设定适应度函数,并确定初始最优蝙蝠个体位置x*和迭代次数t,t=1;

将蝙蝠个体位置对应的权值、隶属函数均值以及方差参数代入基于模糊神经网络的全局静态路径规划模型中,并利用蝙蝠个体位置确定的基于模糊神经网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的规划路径,将所有全局训练样本的规划全局路径和最优设计全局长度作商后,再取均值,作为第一适应度函数f1;

其中,m为训练样本数,n为输出的全局规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个全局训练样本使用该蝙蝠确定的模糊神经网络得到的路径中第j点和第j-1点的x轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标y轴坐标,第j点和第j-1点为相邻两点,l为人工设置的样本对应最优设计全局路径的长度;

模型输出的路径越短,蝙蝠个体的适应度f越大,个体越优秀。

步骤2.4:利用设定的脉冲频率更新蝙蝠的搜索脉冲频率、位置和速度;

步骤2.5:若r1<ri,则更新蝙蝠当前位置,否则对蝙蝠当前位置进行扰动,扰动后位置代替蝙蝠当前位置;

其中,r1为在[0,1]上均匀分布的随机数,ri为第i只蝙蝠的脉冲频度;

步骤2.6:若r2<ai且f1(xi)<f1(x*),则利用步骤2.5得到的扰动位置,对第i只蝙蝠的脉冲频度和脉冲声音强度进行更新,否则,不对蝙蝠进行更新;

其中,r2为在[0,1]上均匀分布的随机数,ai为第i只蝙蝠的声音强度;

步骤2.7:根据适应度函数对新的蝙蝠群体进行评估判定,找出当前位置最佳蝙蝠个体及对应的最优位置;

步骤2.8:判断是否达到最大搜索精度或者t达到最大迭代次数,若达到,则输出最优蝙蝠个体位置对应的模糊神经网络的权值、隶属函数均值以及方差,若未达到,则令t=t+1,返回步骤2.4。

进一步的,运载机器人依据得到的最优规划路径前行,执行运输任务时,在前行过程中,利用kinect传感器实时获取的新增障碍物所在区域的起点和终点输入局部动态避障规划模型进行避障;

利用局部避障训练样本集中每个样本的起点和终点坐标作为输入数据,对应的最优设计避障路径为输出,对多核支持向量机进行训练,得到基于多核函支持向量机的局部避障模型;

其中,在训练过程中,多核函支持向量机的惩罚系数c、核参数g和核函数权值d采用蝙蝠算法进行思维进化算法寻优确定;

所述kinect传感器获取的新增障碍物所在区域的起点和终点是通过kinect传感器发出测量信号与接收到的设置在天花板的定位片位置信息计算获得;

所述局部避障训练样本集是在全局地图三维坐标系中,设计至少200组可行走区域中新增障碍物所在区域中不同的点到点的最优设计避障路径构成,每条最优设计避障路径作为一个避障训练样本。

进一步的,所述基于多核函支持向量机的局部避障模型中多核支持向量机所使用的惩罚系数c、核参数g和核函数权值d采用思维进化算法进行寻优获得的过程如下:

步骤4.1:以思维进化算法中的个体作为多核支持向量机的惩罚系数c、核参数g和核函数权值d,设置个体种群参数;

个体种群规模n的取值范围为[100,400],最大迭代次数范围[400,1000];

随机初始化种群中的个体,在解空间中随机生成m个个体;

步骤4.2:设定适应度函数,并确定初始最优个体和迭代次数t,t=1;

将个体位置对应的变量惩罚系数c、核参数g和核函数权值d代入基于多核函支持向量机的局部避障模型,并利用个体确定的基于多核函支持向量机的局部避障模型输出避障训练样本集中每个避障训练样本起点和终点对应的规划局部路径,将所有避障训练样本的规划局部路径和最优设计避障长度作商后,再取均值,作为第二适应度函数f2;

其中,m为训练样本数,n为输出的避障规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个避障训练样本使用该个体确定的基于多核支持向量机的全局静态路径规划模型得到的路径中第j点和第j-1点的x轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标y轴坐标,第j点和第j-1点为相邻两点,l为人工设置的避障规划样本对应最优设计全局路径的长度;

思维进化算法优化mksvm模型输出的路径越短,个体的适应度f2越大,个体越优秀。

步骤4.3:子群体生成

选择得分最高的前m/10个个体作为优胜个体,前m/10到m/5个个体作为临时个体,以所选优胜个体和临时个体为中心,生成n个优胜子群体和u个临时子群体,每个种群数目为5;

步骤4.4:子群体趋同操作

趋同操作指各个子群体内部个体竞争选出胜者,直到不再产生新的胜者,所有子群体不再产生新的胜者,趋同操作结束;

步骤4.5:子群体异化操作

异化操作是在成熟子群体间的全局竞争行为,以不断探索新的解空间;若某一临时子群体的得分大于任一成熟优胜子群体的得分,则该优胜子群体被临时子群体替代;而若一成熟临时子群体的得分小于任意优胜子群体的得分,则临时子群体被放弃,重新进行的趋同和异化操作,最终得到全局最优个体及其得分;

步骤4.5:收敛条件为得分最高优胜子群体得分不再提高或者达到t最大迭代次数,如不满足收敛条件,则令t=t+1,返回并重复步骤4.3和步骤4.4步骤,直到满足收敛条件,输出全局最优个体及其得分,得到多核支持向量机中最优的惩罚系数c、核参数g和核函数权值d。

进一步的,利用运载机器人自带的kinect传感器与设置在天花板的定位片,通过kinect传感器发出的测量信号与接收到的定位片位置信息,获取运载机器人的实时位置,将实时位置与规划路径位置之间的误差进行比较,对实时前行中的运载机器人进行坐标校准。

进一步的,当运载机器人需要从一个楼层运动至另外一个楼层时,将全局路径规划分解成在两个楼层中的局部路径规划,每个局部路径规划均采用基于模糊神经网络的全局静态路径规划模型;

第一个局部路径规划的起点为运输任务起点,终点为第一个楼层的电梯所在位置;

第二个局部路径规划的起点为第二个楼层的电梯所在位置,终点为运输任务终点;

第一个楼层的电梯和第二个楼层的电梯为同一电梯。

根据实际任务的起点和终点使用路径规划算法模型进行路径规划,如果起点和终点跨楼层,那么路径规划的输入改为起点坐标和起点楼层电梯路径点坐标,终点和终点楼层电梯路径点坐标,输出两个楼层中的最优线路,并将其与电梯模块进行连接,构成完整路径轨迹。没有跨楼层情况发生的情况下,直接输入起点和终点坐标,使用算法模型进行路径规划。

运输过程中,机器人开启安装于头部的kinect,并实时监测路径前方的道路通畅情况,一旦发现有障碍物,通过头部kinect的深度传感器将障碍物的轮廓位置扫描并传输到车载计算机,计算机开启局部动态避障模型,将障碍物轮廓位置,对应为不可行区域添加在地图中,计算最优避障路径,并根据最优避障路径通过障碍物;

定位片布置方法如下:

在机器人工作环境中布置定位片,用以机器人在运行中实时校准自身坐标在全局坐标系中的位置。

首先保证全局环境内部能够被定位片覆盖,在室内环境下定位片密度为一个定位片控制1.5m2范围的环境,在楼道中每隔3m设置一个定位片。

其次在机器人的待命处,取物处,放物处,电梯门前,门禁前等地点布置定位片,有利于机器人在保证自身位置精度的基础进行取物、放物、门禁交互、电梯交互操作。

在前行过程中,利用运载机器人自带的kinect传感器获取障碍物所在区域信息,将新增障碍物所在的区域从可行区域中删除,更新可行区域范围。

运载机器人从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后返回指定待命点。

有益效果

本发明提供了一种智能环境下机器人路径的多神经网络控制规划方法,使用混合神经网络计算方法,从全局和局部的角度对路径规划分别建立模型,利用神经网络的较强的非线性拟合,可映射任意复杂的非线性关系能力,而且学习规则简单,便于计算机实现。具有很强的鲁棒性、记忆能力,能有效解决机器人路径规划中的局部最优、动态避障问题,大幅提升运载机器人在智能环境下的运载效率和安全性。

附图说明

图1为本发明所述方法的路径规划流程图。

具体实施方式

下面将结合附图和实施例对本发明做进一步的说明。

运载机器人路径规划流程图如图1所示。

一种智能环境下机器人路径的多神经网络控制规划方法,包括以下步骤:

步骤1:对运载机器人运载区域构建全局地图三维坐标系,获取在全局地图三维坐标系下的可行走区域坐标;

运载区域地面中心点为原点,正东方向为x轴,正北方向为y轴,垂直地面方向为z轴;

所述运载机器人运载区域为一个楼栋内所有的地板连通区域,所述可行走区域是指从所有的地板连通区域中删除楼栋内的障碍物所在区域;

在全局地图三维坐标系中,每个楼层的地板连通区域的二维平面坐标相同,z坐标不同;

步骤2:获取训练样本集;

在全局地图三维坐标系中,设计200组可行走区域中不同的点到点的最优设计全局路径,以每条最优设计全局路径作为一个训练样本;

步骤3:构建运载机器人的全局静态路径规划模型;

利用全局训练样本集中每个全局样本的起点-终点坐标和对应的最优设计全局路径分别作为输入数据和输出数据,对模糊神经网络进行训练,得到基于模糊神经网络的全局静态路径规划模型,其中隶属函数选取高斯函数;

其中,在全局训练过程中,模糊神经网络所使用的权值、隶属函数均值以及方差采用蝙蝠算法进行寻优获得;

所述基于模糊神经网络的全局静态路径规划模型中模糊神经网络所使用的权值、隶属函数均值以及方差采用蝙蝠算法进行寻优获得的过程如下:

步骤2.1:以蝙蝠个体的位置作为模糊神经网络的权值、隶属函数均值以及方差,设置蝙蝠种群参数;

蝙蝠种群规模m的取值为200,蝙蝠个体最大脉冲频度r0,取值为0.5,最大脉冲声音强度a0的取值为0.5,蝙蝠搜索频度增加系数的取值范围为0.04,声音强度衰减系的取值范围为0.94,适应度方差阈值的取值为0.01,搜索脉冲频率的取值范围为[0,0.15],最大迭代次数的取值范围为800,最大搜索精度的取值为0.001;

步骤2.2:随机初始化蝙蝠种群中每个蝙蝠个体的位置、速度和频率;

步骤2.3:设定适应度函数,并确定初始最优蝙蝠个体位置x*和迭代次数t,t=1;

将蝙蝠个体位置对应的权值、隶属函数均值以及方差参数代入基于模糊神经网络的全局静态路径规划模型中,并利用蝙蝠个体位置确定的基于模糊神经网络的全局静态路径规划模型输出全局训练样本集中每个全局训练样本起点和终点对应的规划路径,将所有全局训练样本的规划全局路径和最优设计全局长度作商后,再取均值,作为第一适应度函数f1;

其中,m为训练样本数,n为输出的全局规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个全局训练样本使用该蝙蝠个体确定的模糊神经网络得到的路径中第j点和第j-1点的x轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标y轴坐标,第j点和第j-1点为相邻两点,l为人工设置的样本对应最优设计全局路径的长度;

模型输出的路径越短,蝙蝠个体的适应度f越大,个体越优秀。

步骤2.4:利用设定的脉冲频率更新蝙蝠的搜索脉冲频率、位置和速度;

步骤2.5:若r1<ri,则更新蝙蝠当前位置,否则对蝙蝠当前位置进行扰动,扰动后位置代替蝙蝠当前位置;

其中,r1为在[0,1]上均匀分布的随机数,ri为第i只蝙蝠的脉冲频度;

步骤2.6:若r2<ai且f1(xi)<f1(x*),则利用步骤2.5得到的扰动位置,对第i只蝙蝠的脉冲频度和脉冲声音强度进行更新,否则,不对蝙蝠进行更新;

其中,r2为在[0,1]上均匀分布的随机数,ai为第i只蝙蝠的声音强度;

步骤2.7:根据适应度函数对新的蝙蝠群体进行评估判定,找出当前位置最佳蝙蝠个体及对应的最优位置;

步骤2.8:判断是否达到最大搜索精度或者t最大迭代次数800,若达到,则输出最优蝙蝠个体位置对应的模糊神经网络的权值、隶属函数均值以及方差,否则,令t=t+1,返回步骤2.4。

步骤4:将运输任务中的起点和终点坐标输入至基于模糊神经网络的全局静态路径规划模型,获得对应的运载机器人最优规划路径。

运载机器人依据得到的最优规划路径前行,完成运输任务。

从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后返回初始待命点。

运载机器人依据得到的最优规划路径前行,执行运输任务时,在前行过程中,利用kinect传感器实时获取的新增障碍物所在区域的起点和终点输入局部动态避障规划模型进行避障;

所述kinect传感器获取的新增障碍物所在区域的起点和终点是通过kinect传感器发出测量信号与接收到的设置在天花板的定位片位置信息计算获得;

利用局部避障训练样本集中每个样本的起点和终点坐标作为输入数据,对应的最优设计避障路径为输出,对多核支持向量机进行训练,得到基于多核函支持向量机的局部避障模型;

所述mksvm采用线性核函数(kline)和多项式核函数(kpoly)形成混合核函数:

kmix=dkline+(1-d)kpoly

其中,核函数权值d得取值范围为[0,1],d的取值为思维进化算法优化结果;

所述局部避障训练样本集是在全局地图三维坐标系中,设计200组可行走区域中新增障碍物所在区域中不同的点到点的最优设计避障路径构成,每条最优设计避障路径作为一个避障训练样本。

其中,在训练过程中,多核函支持向量机的惩罚系数c、核参数g和核函数权值d采用蝙蝠算法进行思维进化算法寻优确定;

所述基于多核函支持向量机的局部避障模型中多核支持向量机所使用的惩罚系数c、核参数g和核函数权值d采用思维进化算法进行寻优获得的过程如下:

步骤4.1:以思维进化算法中的个体作为多核支持向量机的惩罚系数c、核参数g和核函数权值d,设置个体种群参数;

个体种群规模n的取值为200,最大迭代次数800;

随机初始化种群中的个体,在解空间中随机生成200个个体;

步骤4.2:设定适应度函数,并确定初始最优个体和迭代次数t,t=1;

将个体位置对应的变量惩罚系数c、核参数g和核函数权值d代入基于多核支持向量机的局部避障模型,并利用个体确定的基于多核函支持向量机的局部避障模型输出避障训练样本集中每个避障训练样本起点和终点对应的规划局部路径,将所有避障训练样本的规划局部路径和最优设计避障长度作商后,再取均值,作为第二适应度函数f2;

其中,m为训练样本数,n为输出的避障规划路径所经历的坐标点的个数,xi,j和xi,j-1为第i个避障训练样本使用该个体确定的多核支持向量机得到的路径中第j点和第j-1点的x轴坐标,类似的,yi,j和yi,j-1分别为第j点和第j-1点的标y轴坐标,第j点和第j-1点为相邻两点,l为人工设置的避障规划样本对应最优设计全局路径的长度;

思维进化算法优化mksvm模型输出的路径越短,个体的适应度f越大,个体越优秀。

步骤4.3:子群体生成

选择得分最高的前20个个体作为优胜个体,前21到40个个体作为临时个体,以所选优胜个体和临时个体为中心,生成n个优胜子群体和u个临时子群体,每个种群数目为5;

步骤4.4:子群体趋同操作

趋同操作指各个子群体内部个体竞争选出胜者,直到不再产生新的胜者,所有子群体不再产生新的胜者,趋同操作结束;

步骤4.5:子群体异化操作

异化操作是在成熟子群体间的全局竞争行为,以不断探索新的解空间。若某一临时子群体的得分大于任一成熟优胜子群体的得分,则该优胜子群体被临时子群体替代;而若一成熟临时子群体的得分小于任意优胜子群体的得分,则临时子群体被放弃,重新进行的趋同和异化操作,最终得到全局最优个体及其得分;

步骤4.5:收敛条件为得分最高优胜子群体得分不再提高或者t达到最大迭代次数800,如不满足收敛条件,则令t=t+1,返回并重复步骤4.3和步骤4.4步骤,直到满足收敛条件,输出全局最优个体及其得分,得到多核支持向量机中最优的惩罚系数c、核参数g和核函数权值d。

利用运载机器人自带的kinect传感器与设置在天花板的定位片,通过kinect传感器发出的测量信号与接收到的定位片位置信息,获取运载机器人的实时位置,将实时位置与规划路径位置之间的误差进行比较,对实时前行中的运载机器人进行坐标校准。

当运载机器人需要从一个楼层运动至另外一个楼层时,将全局路径规划分解成在两个楼层中的局部路径规划,每个局部路径规划均采用基于模糊神经网络的全局静态路径规划模型;

第一个局部路径规划的起点为运输任务起点,终点为第一个楼层的电梯所在位置;

第二个局部路径规划的起点为第二个楼层的电梯所在位置,终点为运输任务终点;

第一个楼层的电梯和第二个楼层的电梯为同一电梯。

根据实际任务的起点和终点使用路径规划算法模型进行路径规划,如果起点和终点跨楼层,那么路径规划的输入改为起点坐标和起点楼层电梯路径点坐标,终点和终点楼层电梯路径点坐标,输出两个楼层中的最优线路,并将其与电梯模块进行连接,构成完整路径轨迹。没有跨楼层情况发生的情况下,直接输入起点和终点坐标,使用算法模型进行路径规划。

运输过程中,机器人开启安装于头部的kinect,并实时监测路径前方的道路通畅情况,一旦发现有障碍物,通过头部kinect的深度传感器将障碍物的轮廓位置扫描并传输到车载计算机,计算机开启局部动态避障mea-mksvm模型,将障碍物轮廓位置,对应为不可行区域添加在地图中,计算最优避障路径,并根据最优避障路径通过障碍物;

所述路径点定位片布置方法如下:

在机器人工作环境中布置定位片,用以机器人在运行中实时校准自身坐标在全局坐标系中的位置。

首先保证全局环境内部能够被定位片覆盖,在室内环境下定位片密度为一个定位片控制1.5m2范围的环境,在楼道中每隔3m设置一个定位片。

其次在机器人的待命处,取物处,放物处,电梯门前,门禁前等地点布置定位片,有利于机器人在保证自身位置精度的基础进行取物、放物、门禁交互、电梯交互操作。

在前行过程中,利用运载机器人自带的kinect传感器获取障碍物所在区域信息,将新增障碍物所在的区域从可行区域中删除,更新可行区域范围。

运载机器人从初始待命点出发前往取物点,得到运输物品后前往放物点,放下物品后返回指定待命点。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1