一种未知环境下移动机器人多行为融合自动导航方法

文档序号:6283185阅读:192来源:国知局

专利名称::一种未知环境下移动机器人多行为融合自动导航方法
技术领域
:本发明属于机器人导航以及智能控制领域,涉及一种未知环境下移动机器人多行为融合自动导航方法。
背景技术
:近20年来,人工智能技术和计算机技术的飞速发展,自主智能移动机器人研究取得了重大关注。目前智能移动机器人广泛应用于工农业、交通运输、军事、医疗卫生等行业,以解决危险环境下工作问题和取代人类繁重工作。为提高移动机器人在未知环境下的工作能力和应用范围,移动机器人自主导航的研究是急需解决的关键难题。对于移动机器人而言,导航能力是其最重要的功能之一,机器人首先要求避免危险情况如碰撞等,将机器人停留于安全的操作环境下;其次需具备完成到环境中某一特定位置执行特定任务的能力。目前常见的导航控制方法主要分为两大类行为控制和势场导航方法。行为导航控制通常假定已知机器人的起始位置和期望目标位置,机器人根据当前局部范围内获取的传感器信息(红外、声纳、激光等测距信息、视觉信息等)进行决策,改变转向角和运动速度以避免向期望目标方向行驶过程中与障碍物发生碰撞。该类探索方法简单有效,得到广泛应用。目前,为实现复杂环境下的高效机器人控制,模糊控制、神经网络、遗传算法等理论被引入子行为控制器的设计和子行为之间协调、融合策略的研究,但是仍缺乏可靠性高、自适应性强的解决方案。
发明内容本发明所要解决的技术问题在于克服现有技术的不足,提供一种未知环境下移动机器人多行为融合自动导航方法,移动机器人利用声纳、电子罗盘传感器获取环境信息,完成环境建模、理解环境,从而提高移动机器人的自主导航能力。本发明的技术解决方案如下一种未知环境下移动机器人多行为融合自动导航方法,其特征在于,包括以下步骤1)根据目标和移动机器人的相对位置实时获取当前的方位角,根据移动机器人周围障碍物状况实时获取多个距离参数;2)基于奔向目标、沿墙走和避障三个子行为的多输出支持向量机模糊控制器根据获取的方位角和多个距离参数输出转角值《和速度值v,,i=l,2,3;3)基于奔向目标、沿墙走和避障三个子行为的多输出支持向量机环境辨识控制器根据方位角和多个距离参数输入信号,输出三个子行为的权重参数w,,i=l,2,3;4)按照下式计算移动机器人当前用于导航的转角值e和速度值v:33夕=Zh7,><6*,,v=Zw,xV,.。所述的步骤2)中,采用电子罗盘获取移动机器人与目标点之间的方位角w,采用8个环状配置的超声波测距传感器获取8个距离参数dld8;其中{dl,d2,d3}为左向距离,(d4,d5》为前向距离,《d6,d7,d8》为右向距离;所述的多输出支持向量机模糊控制器的障碍信号左向障碍Left_obs,前向障碍Front—obs和右向障碍Right—obs定义为Left—obs=Min{dl,d2,d3};Front—obs=Min{d4,d5};Right_obs=Min{d6,d7,d8}。对于所述的多输出支持向量机模糊控制器,沿墙走和避障子行为的输入为左向障碍Left—obs、前向障碍Front—obs和右向障碍Right一obs,奔向目标子行为的输入为方位角《;控制器的输出为两个,转角值《和速度值v,,i=l,2,3,i为l、2、3分别对应奔向目标、沿墙走和避障三个子行为;左向障碍Left一obs,前向障碍Front_obs,右向障碍Right—obs采用{远,近,很近口卩(Far,Near,Veryneai^三个模糊语言变量组成的模糊集合表示,方位角"采用{大左,中左,左,向前,右,中右,大右}即(far-left,medium-left,left,head-on,right,medium-right,far-right)七个模糊语言变量表示;行为模糊控制器的输出模糊集合转角《.用模糊集合{负大,负中,负小,零,正小,正中,正大}即(NB,NM,NS,ZE,PS,PM,PB》表示,速度v,用模糊集合(快,中,慢》即《Fast,Medium,Slow}表示。对于所述的多输出支持向量机模糊控制器,利用多输出支持向量机回归,将模糊专家知识确定的规则作为样本,在允许误差范围内进行函数逼近,选出成为支持向量的样本,从而剔除掉规则库中的冗余规则,得到拟合函数。所述的多输出支持向量机环境辨识控制器的输入为距离参数(dl,d2,d3,d4,d5,d6,d7,c^和方位角《;输出层为当前环境分别与三个子行为的匹配度/("=1,2,3),匹配度之和等于l,训练时首先获取环境信息作为输入,并根据专家经验为每个子行为分配的与当前环境的匹配度的值作为多输出支持向量机环境辨识控制器的期望输出,由此得到一系列的训练样本并对该多输出支持向量机环境辨识控制器进行训练;训练完成所得到的网络结构即为所述的多输出支持向量机环境辨识控制器;则三个子行为的权重参数w,,i=l,2,3为<formula>formulaseeoriginaldocumentpage6</formula>有益效果与现有技术相比,本发明的优点就在于1、采用多输出支持向量机模糊控制器,能有效地减少冗余规则,省略反模糊化过程,简化了计算,优化了模糊控制器。2、利用多输出支持向量机辨识环境,根据实际环境动态确定子行为与当前所处环境的匹配程度,从而确定子行为输出在整个导航行为输出中所占的权重,提高了导航行为输出的可信度。提出多行为的融合策略,进一步优化了导航权值参数。3、模块化结构,方便添加其它子行为,提高了系统的自适应性。实验结果(见实施例)也验证了本发明能可靠的实现移动机器人的导航。图1为本发明的未知环境下移动机器人多行为融合导航方法总体流程图;图2为移动机器人前向声纳环(超声波测距传感器)配置示意图;图3为子行为模糊控制器结构示意图;图4为输入输出模糊隶属度函数;图5为离线训练多输出支持向量机程序流程图;图6为当前环境与子行为匹配度训练样本;图7为理想地图示意图8为环境1中对目标(goal)的导航控制实验对比结果((a)八*算法的规划路径(b)本方法对规划路径的跟踪轨迹(C)本方法自主导航路径);图9为环境1中对目标(goal)的导航控制实验对比结果((a)A+算法的规划路径(b)本方法对规划路径的跟踪轨迹(C)本方法自主导航路径);图10为环境2中对目标(goal)的导航控制实验对比结果((a)A+算法的规划路径(b)本方法对规划路径的跟踪轨迹(c)本方法自主导航路径);具体实施例方式下面参照附图和实施例对本发明的实施进行说明。以下将结合附图和具体实施过程对本发明做进一步详细说明实施例1:本发明的系统结构图如图1所示(图1中FSVM是模糊支持向量机),输入信号为方位角和8个距离参数,将导航行为划分为奔向目标、沿墙走、避障三个子行为,传感器获取信息分别送入子行为控制器和环境辨识控制器。子行为控制器的输出均为机器人的转角^和运动速度v,环境辨识控制器的输出为子行为与当前环境的匹配度。子行为控制器输出与对应的环境辨识控制器输出乘积之和为整个导航系统的输出,控制移动机器人的转向和速度。转角P和运动速度v用来实现导航行为,其中转角^用于改变机器人的运动方向。移动机器人采用超声波测距传感器、电子罗盘来完成环境建模及导航子行为,其前端安装有八个声纳测距传感器。图2中移动机器人声纳传感器的位置为±10°、±30°、±50°和±90°,用于探测各自方向上障碍物的信息。声纳的测距信息分为左、前、右三个扇区,分别记为Left—obs,Front—obs,Right一obs,用于探测这三个方向的障碍物信息。1、多输出支持向量机子行为模糊控制器首先针对子行为设计设计模糊控制器,然后多输出支持向量机回归原理,采用多输出支持向量机提取控制规则。1)子行为说明导航行为划分为奔向目标、沿墙走、避障三个子行为。其中奔向目标行为是指不考虑前方是否能通行,只朝向目标所在方向行进;沿墙走行为是指沿走廊、墙等有较长直线边缘行进,而忽略目标所在方向;避障行为是指绕开前方静态的障碍物继续朝前行进,而忽略目标所在方向。2)子行为模糊控制器说明利用模糊理论为设计子行为模糊控制器。算法通常电子罗盘获取机器人与目标点之间方位角《;移动机器人的8个声纳测量障碍物与机器人之间的距离,Wl,d2,d3,d4,d5,d6,d7,d8》按照式(1)分为Left_obs,Front—obs,Right一obs三组,其中Min()表示从多个值当中取最小值。Left_obs=Min{dl,d2,d3};Front—obs=Min{d4,d5};Right—obs=Min{d6,d7,d8}(1)本发明采用的模糊控制器根据子行为的功能确定输入,为Left—obs,、Front—obs、Right一obs与w的搭配。一般需要确定距离信息的子行为其输入必须包括Left_0bs,、Front一obs、Right—obs,需要确定机器人与目标点之间方位的其输入必须包括^,即沿墙走、避障行为的输入为Left—obs,、Front—obs、Right_obs,奔向目标行为的输入为《。控制器的输出为两个,即转角^和速度v。其结构如图3所示,图中输入采用虚线,表示根据子行为功能的需要进行选择输入。三组距离信息均可用{Far,Near,Veryneai^三个模糊语言变量组成的模糊集合表示,方位信息《可用《far-left,medium-left,left,head-on,right,medium-right,far-righ1^七个模糊语言变量表示;行为模糊控制器的输出模糊集合转角^用模糊集合(NB,NM,NS,ZE,PS,PM,PB》表示,速度v用模糊集合(Fast,Medium,Slow)表示。输入输出的模糊隶属度函数如图4所示。然后针对每个行为设计模糊控制规则,奔向目标行为、沿墙走行为和避障行为的模糊控制规则分别如表l、表2、表3所示。表l奔向目标行为模糊规则库<table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table>3)多输出支持向量机抽取控制规则说明利用多输出支持向量机回归,将模糊专家知识确定的规则作为样本,在一定允许误差范围内进行函数逼近,选出成为支持向量的样本,从而剔除掉规则库中的冗余规则,并得到具有较好学习能力的拟合函数,即基于多输出支持向量机的模糊控制器。根据子行为模糊控制器的输入输出数量,确定支持向量机的输入与输出数量。即支持向量机的输入节点数量等于子行为模糊控制器的输入数量;支持向量机的输出节点数量等于子行为模糊控制器的输出数量,均为转角《和速度"。子行为模糊控制器包含一系列由IFTHEN组成的控制规则,规则库中的一条控制规则对应于一个样本中心点,规则库中有N条规则,就会得到N个样本点。然后对这N个样本点采用支持向量机回归方法,在适当精度e下无误差地用非线性回归函数拟合这N个样本,求解二次规划最优问题,找到样本中的支持向量(s个),其所对应的控制规则即为有用的规则,而非支持向量的样本所对应的控制规则即为规则库中的冗余规则,同时也得到拟合函数,即支持向量机子行为模糊控制器。以支持向量机抽取奔向目标行为模糊控制规则为例说明其过程。如表1所示的奔向目标行为模糊规则库中的一条控制规则对应于一个样本中心点,该规则库中有7条规则,就会得到7个样本点,如表4所示。表4奔向目标行为样本样本阵列情况输入输出<table>tableseeoriginaldocumentpage12</column></row><table>然后对这7个样本点采用支持向量机回归方法(一个输入,两个输出),在适当精度5>0(根据经验调整,此处选择^=0.3)下用非线性回归函数拟合这7个样本,训练的程序流程图如图5所示,图中参数c为支持向量机的惩罚因子且oO。本方法采用RBF核函数即/:(x,,x)^exp(-g|x-jc,f),x,为要求解的支持向量,式中及图5中的参数g为核函数的参数且g〉0。2、基于多输出支持向量机的环境辨识说明移动机器人导航任务分解为三个子行为,如何确定移动机器人所处环境与子行为的匹配程度,最终确定子行为在导航系统输出中的权重,关系到导航系统的性能。本发明釆用多输出支持向量机来辨识环境与子行为的匹配程度,提高系统的可靠性。算法多输出支持向量机环境辨识控制器的输入有九个,即反映移动机器人周围障碍物信息的声纳测距信息《dl,d2,d3,d4,d5,d6,d7,d8!和移动机器人与目标之间的夹角";输出层为环境与子行为的匹配度/^=1,2,3),匹配度之和等于l,输出节点的数量与子行为数量一致。训练时首先获取环境信息作为输入,并根据专家经验为设计的每个子行为分配与当前环境的匹配程度值作为多输出支持向量机环境辨识控制器的期望输出,这样可得到一系列的训练样本。移动机器人导航任务分解为奔向目标行为、避障行为和沿墙走行为,分配子行为与当前环境匹配度的部分训练样本示例如图6所示图6(a)中,声纳传感器探测到移动机器人周边无障碍物,奔向目标行为与当前环境的匹配度为1,其它子行为与当前环境的匹配度为0;图6(b)中,声纳传感器探测到移动机器人右边有障碍物,且目标在其左前方,奔向目标行为与当前环境的匹配度为1,其它子行为与当前环境的匹配度为O;图6(C)中,声纳传感器探测到移动机器人右边有障碍物,且目标在其右后方,沿墙走行为与当前环境的匹配度为1,其它子行为与当前环境的匹配度为O;图6(d)中,声纳传感器探测到移动机器人正前方有障碍物,且目标也在其正前方,奔向目标行为与当前环境的匹配度为O.l,避障行为与当前环境的匹配度为0.9,沿墙走行为与当前环境的匹配度为o。图6所抽象的环境,可搭建如图7所示的实际环境和如图8所示的理想环境,机器人置于此已知环境中获取训练样本。对于图6(a)把目标置于机器人周围不同的位置(方位角we[-90。,90。],声纳测距范围为03米),根据障碍物、目标点、墙的不同分布可以得到不同的测量样本点,其中一部分样本如表5所示。表5环境与子行为匹配度训练部分样本<table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table>因此最后导航系统实际输出到移动机器人的控制量转角^和运动速度V为<formula>formulaseeoriginaldocumentpage15</formula>(3)其中《,v,表示所设计的多输出支持向量机奔向目标子行为模糊控制器输出,《,^表示所设计的多输出支持向量避障子行为模糊控制器的输出,《,表示所设计的多输出支持向量沿墙走子行为模糊控制器的输出。实验结果与分析为验证本发明提出的导航控制方法的有效性,以Pioneer2-DXE移动机器人为对象,对两个不同环境下3个目标位置进行了导航控制实验,其中图8至图10中,图(a)中机器人的运动轨迹为八*算法的标准规划路径;图(b)为对标准规划路径分成若干子目标后的跟踪实验结果(即此时环境为已知);图(c)为假定环境未知,不依赖于规划路径,直接根据初始位置和目标位置信息情况下,本发明方法的导航控制轨迹,以验证方法的可靠性和自适应性(八*算法是一种经典的路径搜索方法,在起始节点和目标节点之间人为的设置很多节点(在程序里给出节点位置信息)起到路标作用,也就是很多个子目标,子目标越多,表明告诉机器人的信息就越多,这样可以认为环境就为己知了,可以通过给定子目标的方位和坐标来实现;而未知环境即只给出起始点和目标节点,不给出中间节点的位置,因此,对于机器人来说,是一个未知环境)。从实验结果看,本导航方法对已知路径具有很高的精度和可靠性,三种情况均能够精确逼近标准规划路径。在未知环境下,本导航方法也表现出了非常好的准确度和对环境的适应性,均能够最终达到目标位置,在环境2中,由于通往目标位置过程中回形区域的出现,造成机器人出现回退行为,路径优化性较差,但是本导航方法最终仍能摆脱局部陷阱影响,最终达到目标位置,因此本导航方法对不同环境具有很好的适应能力和可靠性。权利要求1.一种未知环境下移动机器人多行为融合自动导航方法,其特征在于,包括以下步骤1)根据目标和移动机器人的相对位置实时获取当前的方位角,根据移动机器人周围障碍物状况实时获取多个距离参数;2)基于奔向目标、沿墙走和避障三个子行为的多输出支持向量机模糊控制器根据获取的方位角和多个距离参数输出转角值θi和速度值vi,i=1,2,3;3)基于奔向目标、沿墙走和避障三个子行为的多输出支持向量机环境辨识控制器根据方位角和多个距离参数输入信号,输出三个子行为的权重参数wi,i=1,2,3;4)按照下式计算移动机器人当前用于导航的转角值θ和速度值v<mathsid="math0001"num="0001"><math><![CDATA[<mrow><mi>&theta;</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>3</mn></munderover><msub><mi>w</mi><mi>i</mi></msub><mo>&times;</mo><msub><mi>&theta;</mi><mi>i</mi></msub><mo>,</mo></mrow>]]></math>id="icf0001"file="A2008101431340002C1.tif"wi="24"he="10"top="107"left="79"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths><mathsid="math0002"num="0002"><math><![CDATA[<mrow><mi>v</mi><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>3</mn></munderover><msub><mi>w</mi><mi>i</mi></msub><mo>&times;</mo><msub><mi>v</mi><mi>i</mi></msub><mo>;</mo></mrow>]]></math>id="icf0002"file="A2008101431340002C2.tif"wi="23"he="10"top="107"left="108"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/></maths>所述的步骤2)中,采用电子罗盘获取移动机器人与目标点之间的方位角ω,采用8个环状配置的超声波测距传感器获取8个距离参数d1~d8;其中{d1,d2,d3}为左向距离,{d4,d5}为前向距离,{d6,d7,d8}为右向距离;所述的多输出支持向量机模糊控制器的障碍信号左向障碍Left_obs,前向障碍Front_obs和右向障碍Right_obs定义为Left_obs=Min{d1,d2,d3};Front_obs=Min{d4,d5};Right_obs=Min{d6,d7,d8};对于所述的多输出支持向量机模糊控制器,沿墙走和避障子行为的输入为左向障碍Left_obs、前向障碍Front_obs和右向障碍Right_obs,奔向目标子行为的输入为方位角ω;控制器的输出为两个,转角值θi和速度值vi,i=1,2,3,i为1、2、3分别对应奔向目标、沿墙走和避障三个子行为;左向障碍Left_obs,前向障碍Front_obs,右向障碍Right_obs采用{远,近,很近}三个模糊语言变量组成的模糊集合表示,方位角ω采用{大左,中左,左,向前,右,中右,大右}七个模糊语言变量表示;行为模糊控制器的输出模糊集合转角θi用模糊集合{负大,负中,负小,零,正小,正中,正大}表示,速度vi用模糊集合{快,中,慢}表示;对于所述的多输出支持向量机模糊控制器,利用多输出支持向量机回归,将模糊专家知识确定的规则作为样本,在允许误差范围内进行函数逼近,选出成为支持向量的样本,从而剔除掉规则库中的冗余规则,得到拟合函数。2.根据权利要求l所述的未知环境下移动机器人多行为融合自动导航方法,其特征在于,所述的多输出支持向量机环境辨识控制器的输入为距离参数(dl,d2,d3,d4,d5,d6,d7,d8》和方位角^;输出层为当前环境分别与三个子行为的匹配度/(m=1,2,3),匹配度之和等于l,训练时首先获取环境信息作为输入,并根据专家经验为每个子行为分配的与当前环境的匹配度的值作为多输出支持向量机环境辨识控制器的期望输出,由此得到一系列的训练样本并对该多输出支持向量机环境辨识控制器进行训练;训练完成所得到的网络结构即为所述的多输出支持向量机环境辨识控制器;则三个子行为的权重参数w,,i=l,2,3为<formula>formulaseeoriginaldocumentpage3</formula>全文摘要本发明公开了一种未知环境下移动机器人多行为融合自动导航方法,其特征在于,包括以下步骤1)根据目标和移动机器人的相对位置实时获取当前的方位角,根据移动机器人周围障碍物状况实时获取多个距离参数;2)多输出支持向量机模糊控制器根据获取的方位角和多个距离参数输出转角值θ<sub>i</sub>和速度值v<sub>i</sub>,i=1,2,3;3)多输出支持向量机环境辨识控制器根据方位角和多个距离参数输入信号,输出三个子行为的权重参数w<sub>i</sub>,i=1,2,3;4)按照上式计算移动机器人当前用于导航的转角值θ和速度值v,本发明采用智能控制策略,自适应强,导航可靠性高,效果优良。文档编号G05B13/02GK101354587SQ20081014313公开日2009年1月28日申请日期2008年9月4日优先权日2008年9月4日发明者余洪山,孙程鹏,伟宁,江朱,杨民生,王耀南,许海霞,霞邓申请人:湖南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1