基于深度信念网络的机器人避障行为学习和目标搜索方法与流程

文档序号:13983323阅读:187来源:国知局

本发明涉及机器学习、模式识别技术领域,特别是涉及一种基于深度信念网络(deepbeliefnetwork,dbn)的机器人在非结构环境下的自动避障行为学习和目标搜索方法。



背景技术:

自动目标搜索是当前人类环境中各类机器人,比如社交机器人、服务机器人、搜索和救援机器人等在非结构环境中良好运行的必要技能。这种技能需要机器人具备其他很多基础能力,包括目标识别、自动避障、路径规划和导航等。其中实现机器人的自动避障学习能力和在未知环境中从开始点到目的地进行路径规划能力是关键。虽然以上功能模块在计算机视觉和机器人研究领域研究都很活跃,但通过自动避障能力的学习进行目标识别、搜索和靠近在机器人系统上完整实现的研究却相对较少,而且仅使用单rgb-d摄像头进行机器人自动避障能力学习的研究也相对较少。



技术实现要素:

发明目的:为了克服现有技术中存在的不足,本发明提供一种可以使机器人移动基体在完全未知的环境中完成从开始点到目标点的路径规划的基于深度信念网络的机器人避障行为学习和目标搜索方法。

技术方案:为实现上述目的,本发明的基于深度信念网络的机器人避障行为学习和目标搜索方法如下:机器人包括机器人移动基体以及安装在机器人移动基体上的rgb-d摄像头,具体步骤如下:

步骤1:操控机器人在环境中进行避障运动,实时获取rgb-d摄像头视野内的rgb图像数据、深度图像数据以及机器人移动基体的线速度和角速度数据;

步骤2:根据步骤1获取的数据进行网络训练,构造深度信念网络模型,使机器人获取自动避障能力;

步骤3:将步骤1获取的rgb图像数据与目标模板进行匹配,确定机器人是否搜索到目标,若搜索到目标,跳转至步骤4,若未搜索到目标,机器人通过自动避障在环境中随机搜索;

步骤4:当机器人搜索到目标时,在无障碍物的情况下直接靠近目标;若在靠近目标的过程中遇到障碍物时,使用路径规划算法结合自动避障功能重新进行路径规划靠近目标;若目标丢失,回到步骤3进行随机搜索。

进一步地,所述步骤1的具体方法为:机器人被动控制在环境中进行顺时针方向与逆时针方向的自动避障与随机搜索,并在此过程中实时获取rgb-d摄像头视野内的rgb图像数据、深度图像数据以及机器人移动基体的线速度和角速度数据。

进一步地,步骤2具体包括以下几个步骤:

步骤2.1:以步骤1获取的顺时针方向的深度图像信息作为深度信念网络的输入,以对应的机器人移动基体的线速度和角速度作为输出,进行网络训练,获取网络模型dbn1;

步骤2.2:以步骤1获取的逆时针方向的深度图像信息作为深度信念网络的输入,以对应的机器人移动基体的线速度和角速度作为输出,进行网络训练,获取网络模型dbn1;

步骤2.3:当有网络输入时,分别通过网络模型dbn1和网络模型dbn2进行网络学习,获取两组线速度和角速度决策;

步骤2.4:将步骤2.3获取的两组决策进行综合,获取最终的线速度和角速度。

进一步地,对步骤2.3获取的两组决策进行综合,获取最终的线速度和角速度的方法为:以网络模型dbn1的线速度vl与角速度θl、网络模型dbn2的线速度vr与角速度0r、以及变量d作为输入变量,以最终的线速度v2和角速度θ2作为输出变量;将vl与vr中的较小值赋予v2;若θl与θr中较大的值大于d,则将θl与θr中较大的值赋予θ2与d;若d同时大于θl与θr,则将d乘以小于1的常数后的值赋予d。

进一步地,步骤3具体包括以下步骤:

步骤3.1:将步骤1获取的rgb图像数据通过surf算法进行特征提取;

步骤3.2:将步骤3.1获取的rgb图像数据的特征与已有的目标模板进行匹配;

步骤3.3:若有与目标模板相匹配的特征,则认为机器人已搜索到目标,跳转至步骤4;若没有与目标模板相匹配的特征,则机器人通过自动避障在环境中随机搜索。

根据权利要求1所述的基于深度信念网络的机器人避障行为学习和目标搜索方法,其特征在于:步骤4具体包括以下步骤:

步骤4.1:利用步骤1获取的深度图像数据计算目标相对机器人的坐标位置;

步骤4.2:在没有障碍物的情况下,机器人直接向目标靠近;若遇到障碍物,跳转到步骤4.3;若目标丢失,跳回步骤3进行随机搜索;

步骤4.3:当遇到障碍物时,使用深度信念网络模型得到一组线速度和角速度决策t2;使用路径规划算法得到一组线速度和角速度决策t1;综合决策t1和决策t2,进行带有避障功能的重新路径规划。

进一步地,综合决策t1和t2的方法为:将决策t1的线速度v1和决策t2的线速度v2中较小的值输出作为机器人线速度的值;计算比例ratio=v2/max(v1,v2),机器人的输出角速度θ=ratio×θ1+(1-ratio)×θ2,其中θ1为决策t1的角速度的值,θ2为决策t2的角速度的值。

有益效果:本发明的基于深度信念网络的机器人避障行为学习和目标搜索方法采用深度信念网络模型进行自动避障能力学习和使用基于bug算法的改进路径规划算法完成自动目标搜索,其具有以下几个优点:

(1)完整功能的实现仅使用单rgb-d摄像头作为输入传感器,在实际应用中具有很高的成本可行性;

(2)结合深度图像数据、对应的线速度和角速度及深度信念网络对图像高层特征建模的能力,使得机器人具有很好的自动避障学习能力和对环境的泛化能力;

(3)基于bug算法,结合自动避障的改进路径规划算法使得机器人可以在未知环境中从开始点顺利导航到目标所在位置。

附图说明

附图1为基于深度信念网络的机器人避障行为学习和目标搜索方法的流程图。

具体实施方式

下面结合附图对本发明作更进一步的说明。

如附图1所示的基于深度信念网络的机器人避障行为学习和目标搜索方法,机器人包括机器人移动基体以及安装在机器人移动基体上的rgb-d摄像头,具体步骤如下:

步骤1:操控机器人在环境中进行避障运动,实时获取rgb-d摄像头视野内的rgb图像数据、深度图像数据以及机器人移动基体的线速度和角速度数据;具体操作为:机器人被动控制在环境中进行顺时针方向与逆时针方向的自动避障与随机搜索,并在此过程中实时获取rgb-d摄像头视野内的rgb图像数据、深度图像数据以及机器人移动基体的线速度和角速度数据。

步骤2:根据步骤1获取的数据进行网络训练,构造深度信念网络模型,使机器人获取自动避障能力;

步骤3:将步骤1获取的rgb图像数据与目标模板进行匹配,确定机器人是否搜索到目标,若搜索到目标,跳转至步骤4,若未搜索到目标,机器人通过自动避障在环境中随机搜索;

步骤4:当机器人搜索到目标时,在无障碍物的情况下直接靠近目标;若在靠近目标的过程中遇到障碍物时,使用基于bug算法的改进路径规划算法结合自动避障功能重新进行路径规划靠近目标;若目标丢失,回到步骤3进行随机搜索。

步骤2具体包括以下几个步骤:

步骤2.1:以步骤1获取的顺时针方向的深度图像信息作为深度信念网络的输入,以对应的机器人移动基体的线速度和角速度作为输出,进行网络训练,获取网络模型dbn1;

步骤2.2:以步骤1获取的逆时针方向的深度图像信息作为深度信念网络的输入,以对应的机器人移动基体的线速度和角速度作为输出,进行网络训练,获取网络模型dbn1;

步骤2.3:当有网络输入时,分别通过网络模型dbn1和网络模型dbn2进行网络学习,获取两组线速度和角速度决策;

步骤2.4:将步骤2.3获取的两组决策进行综合,获取最终的线速度和角速度。具体方法为:以网络模型dbn1的线速度vl与角速度θl、网络模型dbn2的线速度vr与角速度θr、以及变量d作为输入变量,以最终的线速度v2和角速度θ2作为输出变量;将vl与vr中的较小值赋予v2;若θl与θr中较大的值大于d,则将θl与θr中较大的值赋予θ2与d;若d同时大于θl与θr,则将d乘以小于1的常数(本实施中乘以0.999)后的值赋予d。

具体程序如下:

步骤3具体包括以下步骤:

步骤3.1:将步骤1获取的rgb图像数据通过surf算法进行特征提取;

步骤3.2:将步骤3.1获取的rgb图像数据的特征与已有的目标模板进行匹配;

步骤3.3:若有与目标模板相匹配的特征,则认为机器人已搜索到目标,跳转至步骤4;若没有与目标模板相匹配的特征,则机器人通过自动避障在环境中随机搜索。

步骤4具体包括以下步骤:

步骤4.1:利用步骤1获取的深度图像数据计算目标相对机器人的坐标位置;

步骤4.2:在没有障碍物的情况下,机器人直接向目标靠近;若遇到障碍物,跳转到步骤4.3;若目标丢失,跳回步骤3进行随机搜索;

步骤4.3:当遇到障碍物时,使用深度信念网络模型得到一组线速度和角速度决策t2;使用路径规划算法得到一组线速度和角速度决策t1;综合决策t1和决策t2,进行带有避障功能的重新路径规划。

综合决策t1和t2的方法为:将决策t1的线速度v1和决策t2的线速度v2中较小的值输出作为机器人线速度的值;计算比例ratio=v2/max(v1,v2),机器人的输出角速度θ=ratio×θ1+(1-ratio)×θ2,其中θ1为决策t1的角速度的值,θ2为决策t2的角速度的值。

步骤3与步骤4的实现算法如下:

本发明的基于深度信念网络的机器人避障行为学习和目标搜索方法采用深度信念网络模型进行自动避障能力学习和使用基于bug算法的改进路径规划算法完成自动目标搜索,其具有以下几个优点:

(1)完整功能的实现仅使用单rgb-d摄像头作为输入传感器,在实际应用中具有很高的成本可行性;

(2)结合深度图像数据、对应的线速度和角速度及深度信念网络对图像高层特征建模的能力,使得机器人具有很好的自动避障学习能力和对环境的泛化能力;

(3)基于bug算法,结合自动避障的改进路径规划算法使得机器人可以在未知环境中从开始点顺利导航到目标所在位置。

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1