一种基于LSTM网络的移动机器人软地面通过性预测方法与流程

文档序号:17327442发布日期:2019-04-05 21:52阅读:198来源:国知局
一种基于LSTM网络的移动机器人软地面通过性预测方法与流程

本发明涉及一种移动机器人的松软地面通过性预测方法,属于机器人驱动运动学与动力学研究领域。



背景技术:

移动机器人(小车)的软地面通过性是指它能够以一定的速度顺利通过松软路面(如泥泞、滩涂、沙地及雪地等)的能力。目前,轮式机器人以其独特的优越性已广泛应用于星球探测、灾后搜救、地面运输、以及地质勘探中,但松软土壤或地面使得机器人易发生沉陷、滑转等,降低了机器人的牵引性或动力性,进而产生运动或转向受限、甚至无法移动等通过失效的现象,严重阻碍了其实际应用。因此,移动机器人的软地面通过性评价和预测,已成为越来越受人们关注的一个问题,不仅为高通过性移动机器人设计和改进提供了一种评估手段,同时还可在实际行驶中避免运动受阻或减少其发生的概率,从而保障机器人活动的顺利进行。

针对移动机器人的软地面通过性问题,现有的方法大多数还处于通过性问题评价研究中:如采用以牵引系数作为单一的地面通过性评价指标,以衡量机器人在该地面上的牵引能力;又如以驱动效率作为单一的评价指标,以车轮滑转引起的功率损失大小作为间接的通过性判断;再如以一定工况下上机器人运动的最大纵向速度作为动力性的表征。然而,通过性不仅受实时的土壤特性影响,还与机器人自身运动状态有关,单一的指标并不能完全衡量移动机器人的通过性能或评价精度较低。

同时,由于不同土壤的特性不同,移动机器人在不同地面上的通过性并不一致,因此还需对下一时刻的通过性进行实时预判,由判断结果做出及时的校准和应对措施,以避免车轮滑转、沉陷情况。然而,现有的通过性指标仍是静态、离散的评估,并不能做到实时的预测和判断,难以准确地给出一段时间内的具体可通过度情况,无法真正地避免运动受阻,要提高机器人的通过能力,就必须攻克这一技术难题。



技术实现要素:

为了解决背景技术中的问题,本发明提供了一种基于lstm(longshort-termmemory)递归神经网络的移动机器人软地面通过性预测方法,能够在综合考虑移动机器人的动力性、灵活性、经济性条件下,准确地预测一段时刻内机器人是否能够通过松软地面,以此实现在不同土壤条件下,能够准确预估能否通过的功能。

为解决上述技术问题,本发明技术解决方案如下:

一种基于lstm网络的移动机器人软地面通过性预测方法,包括如下步骤:

步骤一:实时测量和记录移动机器人的三种通过性指标数据,包括牵引系数、驱动效率、纵向速度,将它们作为模型的输入数据;同时,人为观测的当前工况下的地面可通过度情况,将其作为输入数据的标签;

步骤二:基于lstm单元,构建面向移动机器人的软地面通过性网络预测模型;并将步骤一中得到的大量带标签数据送入此模型进行训练;

步骤三:调整步骤二中的模型参数并多次训练,直至得到稳定收敛的通过性预测模型;该模型将能够依据新输入的三个指标,给出相应的可通过度预测值。

作为本发明进一步技术方案,所述步骤一中的三种通过性指标的测量或计算方法如下:牵引系数π定义为机器人单位重量下的挂钩牵引力,即,其中,d和fz分别为移动机器人的挂钩牵引力和垂直载荷,它们均可由安装于机器人驱动轮上的车轮力传感器测得;驱动效率e定义为驱动轮上电机的输出功率与输入功率之比,即,其中,驱动扭矩t由车轮力传感器直接测得,车轮角速度可通过车轮力传感器内置的旋转编码器得输出进行微分计算获得;移动机器人的水平方面的前进速度v即为纵向速度,可由安装于机器人底盘中心位置上的惯性测量单元实时给出。

作为本发明进一步技术方案,所述步骤一中的三种通过性指标数据的采集具有以下技术特征:应采取相同的时间窗口,且在一个时间窗口t内的数据作为一个实际采样样本,采样频率设为1hz,并在当前地面工况下采集足够多的样本数据,样本数大于2000个,以保证模型的准确度;人为观测的机器人软地面可通过度采用0或1形式编码,即机器人能够通过该地面记为1,不能通过(如发生沉陷、打滑)则记为0。

作为本发明进一步技术方案,所述步骤二中的通过性网络预测模型采用基于lstm模块的深度学习算法框架,该算法架构具体步骤为:

步骤2.1,对步骤一中得到的通过性指标数据进行预处理,将每个样本内的每个时刻t的数据接入一个lstm单元,每个lstm单元为含有遗忘门、输入门、输出门的标准递归神经网络模块;

步骤2.2,将步骤2.1中的大量lstm单元设计为双层结构形式lstm网络,第一层lstm网络用于初级的特征提取,第二层进行深层的有效特征提取,三个通过性指标数据将分别对应于三组相同结构的lstm网络;

步骤2.3,将步骤2.2得到各指标的特征数据接入一个级联层,该层将各自指标的特征值进行重新排列整合,得到融合后的特征向量;

步骤2.4,将步骤2.3得到的特征向量接入一个全连接层,进行进一步的参数调优和处理;

步骤2.5,将步骤2.4的输出数据接入一个softmax回归分类器,该分类器用于将特征值变换为可用于分类的0或1输出,实现通过性预测的功能。

作为本发明进一步技术方案,所述步骤二的子步骤2.1中采用的lstm单元可以根据规则来判断输入的信息是否有用,核心在于用‘门’来控制单元的状态c。在当前t时刻,遗忘门ft负责控制上一时刻的ct-1有多少信息保存到当前时刻的ct;输入门it选择当前时刻的即时状态ct*有多少信息输入到当前单元;输出门ot控制当前状态ct有多少信息作为该时刻的隐层输出ht;即时备选状态ct*由当前t时刻网络的输入xt和上一时刻的隐层输出ht-1共同决定,它们的计算公式分别为

其中,w和b分别为权重矩阵和偏置项,其下标fioc分别代表遗忘门、输入门、输出门、备选状态;为激活函数,‘门’状态的激活采用sigmoid函数,即时状态ct*的激活采用tanh函数。最终,当前时刻lstm单元的隐层输出ht由输出门ot与当前单元状态ct共同决定;当前状态ct的输出可由遗忘门ft、上一时刻状态ct-1、输入门it、即时状态ct*共同决定;而lstm单元在下一时刻的即时状态输出可由隐层输出ht、输出层权值矩阵w、以及偏置项b共同决定,它们的计算公式分别为

式中,符号表示按元素乘。

所述步骤二的子步骤2.3中的级联层融合后得到特征值采用一维特征向量形式,表示为:

式中,分别表示对应于第i个样本的牵引系数特征值、驱动效率特征、纵向速度特征,它们均为标量值。

作为本发明进一步技术方案,所述步骤二的子步骤2.4中的全连接层输出在每个时刻t是相互独立的,在每个时刻t,全连接层的输出同样可表示为的形式,其中xt来自前一层的输入。

作为本发明进一步技术方案,所述步骤二的子步骤2.5中softmax回归分类器计算第j个类别的概率估计公式为

式中,表示由两个类别参数构成的矩阵,类别j的取值为1或2。此时,表示来自上一层网络的第i个样本的输入特征值,为第i个样本下机器人是否通过的标签值,它们可共同记作样本对

作为本发明进一步技术方案,所述步骤二和步骤三的lstm网络训练中,本发明采用损失函数进行计算,损失函数为与softmax回归分类器相匹配的交叉熵代价函数,其计算公式为:

式中,n为样本数,表示第i个样本属于第j类的真值,为softmax函数分类器得到的预测值。

作为本发明进一步技术方案,所述步骤三中的模型参数调整具有以下特征:首先,模型求解方法选用的为动量随机梯度下降法;其次,设置初始学习速率为0.1,初始最大迭代周期为50;再次,选用十折交叉验证方式进行调校。

本发明所述的移动机器人是指广泛应用于野外作业或松软土壤上(泥泞、滩涂、沙地及雪地)行驶的轮式移动机器人,如常见的电动小车、星球探测车、沙漠探测平台、以及无人越野车辆等,可应用于前轮驱动、四轮驱动或以轮式为主的履带式机器人。

相对于现有技术,本发明的有益效果在于:

本发明提供了一种基于lstm网络的移动机器人软地面通过性预测方法,能够在综合考虑机器人的动力性、灵活性、经济性条件下,提前预估机器人能否顺利通过松软地面的功能,即避免松软地面的发生滑转、沉陷等问题。传统的移动机构通过性问题多是采用单一的评价指标来衡量其通过能力,且不具有预估、判断功能,本发明通过设计合理的lstm递归神经网络,能较好的融合牵引系数、驱动效率、实时速度三种指标,同时实时的处理连续时间序列数据,进而给出机器人可通过度的有效判断。

附图说明

图1为本发明的算法框架和原理。

图2为本发明步骤二中设计的lstm网络模型。

图3为本发明lstm网络单元的结构图。

图4为本发明移动机器人在不同地面的数据采集示意图。

图5为本发明移动机器人在三种松软地面的通过性模型预测结果示例。

具体实施方式

下面结合附图和具体实施方式,进一步阐述本发明,但本发明的保护范围不局限于所述实施案例。

如图1所示,一种基于lstm网络的移动机器人软地面通过性预测方法,包括如下步骤:

步骤一:实时测量和记录移动机器人的三种通过性指示数据,包括牵引系数、驱动效率、纵向速度,将它们作为模型的输入数据;同时,人为观测的当前工况下的地面可通过度情况,将其作为输入数据的标签。

步骤二:基于lstm递归神经网络单元,构建面向移动机器人的软地面通过性网络预测模型;并将步骤一中得到的大量带标签数据送入此模型进行训练。

步骤三:调整步骤二中的模型参数并多次训练,直至得到稳定收敛的通过性预测模型;该模型将能够依据新输入的三个指标,给出相应的可通过度预测值。

所述步骤一中的三种通过性指标的测量或计算方法如下:牵引系数π定义为机器人单位重量下的挂钩牵引力,即,其中,d和fz分别为移动机器人的挂钩牵引力和垂直载荷,它们均可由安装于机器人驱动轮上的车轮力传感器测得;驱动效率e定义为驱动轮上电机的输出功率与输入功率之比,即,其中,驱动扭矩t由车轮力传感器直接测得,车轮角速度可通过车轮力传感器内置的旋转编码器得输出进行微分计算获得;移动机器人的水平方面的前进速度即为纵向速度,可由安装于机器人底盘中心位置上的惯性测量单元实时给出。

在本发明一个较佳的实例中,具体的传感器数据传输和读取可采用如下方式实现:车轮力传感器的微控制单元能够将测量的挂钩牵引力、垂直载荷,以及编码器的角度输出数据一起打包,通过蓝牙方式发送给上位机;惯性测量单元的输出数据则通过自身的usb串口与上位机直接通讯。安装于上位机的labview软件可读取每一时刻的数据,并在后台添加波形图标模块,使得其前面板能够显示出数值的波形图。

所述步骤一中的三个通过性指标的数据采集应采取相同的时间窗口,且在一个时间窗口t内的数据作为一个实际采样样本,采样频率设为1hz,并在当前地面工况下的样本数至少为2000个,以保证模型的准确度;人为观测的机器人软地面可通过度采用0或1形式编码,即机器人能够通过该地面记为1,不能通过(如发生沉陷、打滑)则记为0。

在本发明一个较佳的实例中,为了能够达到较优的效果,本发明方法描述的数据格式可采用以下设置:三个通过性指标的时间窗口t设定为1min,此时的第i个样本的输入数据可分别表示为

,采集的样本总数为4000个,其中80%数据用于网络模型的训练,剩余20%的数据用于测试验证。

所述步骤二中的通过性预测模型采用基于lstm模块的深度学习算法框架,该算法架构按照以下形式进行设计,如图2所示:

步骤2.1,对步骤一中得到的通过性指标数据进行预处理,将每个样本内的每个时刻t的数据接入一个lstm单元,每个lstm单元为含有遗忘门、输入门、输出门的标准递归神经网络模块;

步骤2.2,将步骤2.1中的大量lstm单元设计为双层结构形式lstm网络,第一层lstm网络用于初级的特征提取,第二层进行深层的有效特征提取,三个通过性指标数据将分别对应于三组相同结构的lstm网络;

步骤2.3,将步骤2.2得到各指标的特征数据接入一个级联层,该层将各自指标的特征值进行重新排列整合,得到融合后的特征向量;

步骤2.4,将步骤2.3得到的特征向量接入一个全连接层,进行进一步的参数调优和处理;

步骤2.5,将步骤2.4的输出数据接入一个softmax回归分类器,该分类器用于将特征值变换为可用于分类的0或1输出,实现通过性预测的功能。

如图3所示,每个lstm单元可以根据规则来判断输入的信息是否有用,核心在于用‘门’来控制单元的状态。在当前t时刻,遗忘门ft负责控制上一时刻的ct-1有多少信息保存到当前时刻的ct;输入门it选择当前时刻的即时状态ct*有多少信息输入到当前单元;输出门ot控制当前状态ct有多少信息作为该时刻的隐层输出ht;即时备选状态ct*由当前t时刻网络的输入xt和上一时刻的隐层输出ht-1共同决定,它们的计算公式分别为

其中,w和b分别为权重矩阵和偏置项,其下标fioc分别代表遗忘门、输入门、输出门、备选状态;为激活函数,‘门’状态的激活采用sigmoid函数,即时状态ct*的激活采用tanh函数。最终,当前时刻lstm单元的隐层输出ht由输出门ot与当前单元状态ct共同决定;当前状态ct的输出可由遗忘门ft、上一时刻状态ct-1、输入门it、即时状态ct*共同决定;而lstm单元在下一时刻的即时状态输出可由隐层输出ht、输出层权值矩阵w、以及偏置项b共同决定,它们的计算公式分别为

式中,符号表示按元素乘。

所述步骤二的子步骤2.3中的级联层融合后得到特征值采用一维特征向量形式,表示为:

式中,分别表示对应于第i个样本的牵引系数特征值、驱动效率特征、纵向速度特征,它们均为标量值。

所述步骤二的子步骤2.4中的全连接层输出在每个时刻t是相互独立的,在每个时刻t,全连接层的输出同样可表示为的形式,其中xt来自前一层的输入。

所述步骤二的子步骤2.5中softmax函数计算第个类别的概率估计公式为

式中,表示由两个类别参数构成的矩阵,类别j的取值为1或2。此时,表示来自上一层网络的第i个样本的输入特征值,为第i个样本下机器人是否通过的标签值,它们可共同记作样本对

所述步骤二和步骤三的lstm网络训练中,本发明采用的损失函数为与softmax回归分类器相匹配的交叉熵代价函数,其计算公式为:

式中,n为样本数,表示第i个样本属于第j类的真值,为softmax函数分类器得到的预测值。

所述步骤三中的模型参数调整具有以下特征:首先,模型求解方法选用的为动量随机梯度下降法;其次,设置初始学习速率为0.1,初始最大迭代周期为50;再次,选用十折交叉验证方式进行调校。

在本发明一个较佳的实例中,本发明的网络算法模型架构可基于tensorflow环境来实现lstm网络的构建,超参数调节设置包括:输入时间步长60、输入特征维为3、动量随机梯度采用adam优化器、lstm单元输入层节点数100、lstm单元32、softmax层节点数为3,采用的便携式硬件平台具备一块intel(r)core(tm)i7-7700的中央处理器(cpu)、主频为3.60ghz、缓存ram16.0gb,能够满足训练要求。

本发明一个较佳的实际测试过程如图4所示,由于不同类型的地面具有较大的特征差异,本发明选用了三种不同的地块进行测试方法的有效性,包含干沙地、草地、泥地,且移动机器人行驶路径沿着近似直线为较佳;为提高实际的预测效果,移动机器人的通过性数据采集可在同一地块内进行数据,同一地块下的训练数据采集区面积3倍于实际测试区域面积。如图5所示为三个不同地块的实际测试区的通过性预测结果;从结果看,移动机器人在这些地面上行驶时,模型给出的实时通过性预测准确率较高。

以上所述为本发明的一个实施例子,并不用于限制本发明。凡在本发明的原则之内,所做的等同替换,均应包含在本发明的保护范围之内。本发明未做详细阐述的内容属于本专业领域技术人员公知的已有技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1