一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法

文档序号：34238195发布日期：2023-05-24 23:44阅读：48来源：国知局

本发明属于足式机器人驾驶操作，具体涉及一种归约量化六足机器人驾驶员驾驶决策经验的深度神经网络训练方法。

背景技术：

1、与传统的轮式、履带式等移动方式相比，足式移动机构与地面具有非连续作用点，能够适应几何和物理特征突变的地形环境，代表了复杂化境下移动机构的发展趋势，六足机器人移动平台具有稳定性好、负载能力强、地形适应性强等优点，因而是复杂环境中足式移动系统的最佳选择。然而，在面临复杂多变的环境下的物资输送、抢险救灾等任务时，目前其操纵控制过程仍需要由驾驶员全程参与完成，并要求驾驶员必需充分调动六足机器人自身多维度运动能力，予以保证其达到地形通过性的需求，操纵流程极其复杂繁琐，极大地增加了驾驶员的负担，并且易使驾驶员产生疲劳，进而发生安全事故。因此，如何使训练六足机器人，使其具备一定的自主行为决策智能，成为该领域需要解决的重点问题。

2、大尺度六足机器人的自主行为决策是一个多变量、强耦合、动态非线性的多解数学问题，现有的方法包括基于规则的决策和基于强化学习的决策，前者的灵活性不足，后者则很难在参数调整层面之上的逻辑层面改善系统性能，导致其难以应对复杂多变的工况。因此，如何量化归约六足驾驶员驾驶决策经验，并将其嵌入到机器人系统的决策层，是提升大尺度六足机器人的自主决策能力方面亟待解决的难题。

3、深度神经网络对于建立非线性动态系统的模型具有一定优势，然而，对于复杂的多输入/出的非线性决策问题，以传统结构方式建立的神经网络，会导致其隐含层数和维数急剧增加，其收敛的时间将大幅上升，且由于其网络结构交叉复杂难以解读，使得对其进一步优化迭代的难度增加。因此，本发明设计了一种功能层次清晰、便于分步调试的驾驶员决策神经网络结构，提出了一种以分层逐步寻优方式得到驾驶员决策模型的训练方法。

技术实现思路

1、本发明的目的是提供一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法，解决六足机器人驾驶员驾驶决策经验量化建模的问题，将其嵌入到机器人系统的决策层后，可提升大尺度六足机器人的自主决策能力。

2、本发明为解决上述问题所采取的方案为：一种基于深度神经网络的六足机器人驾驶员决策模型分层训练，所述方法的具体实现过程为：

3、步骤一、生成局部地形信息矩阵：

4、获取六足机器人面临的局部地的数字高程地图，以足式机器人足端的包络正方形作为单位网格对局部地形划分，将每个单位网格的中心点坐标(xi,yi)和单位网格的平均高度hi作为一个地形环境信息单元(xi,yi,hi)，所有地形环境信息单元组成局部地形信息矩阵。

5、步骤二、生成决策模型各层网络的训练数据集：

6、生成决策模型各层网络的训练数据集：定义机器人6个足端和形心在地面投影点所在的环境信息单元，为机器人当前位置的地形特征矩阵；依据以功能层划分的深度神经网络结构，当驾驶员在给定的训练地形进行驾驶决策时，采集记录各功能层的驾驶员操作指令，并与机器人当前位置的地形特征矩阵映射匹配，形成训练样本，驾驶通过训练地形全程的训练样本构成训练数据集，其中每个训练样本包含地形坐标信息和该地形坐标下驾驶员决策指令两个维度的数据。

7、步骤三：以分层训练、逐步寻优方式得到六足机器人驾驶员决策模型：

8、以分层训练、逐步方向寻优方式得到六足机器人驾驶员决策模型：以求解交叉熵的方式建立本损失函数，利用步骤2得到的训练数据集，采用梯度下降法逐层对神经网络参数(权重值与偏置值)反向寻优，使三个判断层和三个指令层的损失函数达到最小，以分层逐步寻优的方式得到六足机器人驾驶员决策模型。

9、进一步的，根据权利要求1所述的深度神经网络结构，其特征在于其隐含层依据六足机器人驾驶决策特点分为两个独立的功能层次，即判断层和指令层，其中判断层还包括3个子功能层次，即方向判断层、距离判断层和速度判断层，判断层各子功能层并行连接，指令层还包括3个子功能层次，即步态指令层、步幅/高指令层和机体位姿指令层，指令层各子功能层并行连接，判断层和指令层串行连接，环境信息以局部地形信息矩阵的形式从输入层流入判断层后，继续流入指令层，最后从输出层输出决策指令。

10、本发明的有益效果：

11、所述的一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法，一方面能够实现对驾驶员决策经验的有效归约与量化；另一方面，本发明设计的神经网络结构符合驾驶员的决策逻辑，其输出结果具有可解释性和可追溯性，能有效保证驾驶员和机器人的安全性；最后，本发明采用分层训练、反向寻优的训练方法，可有效提高神经网络模型的收敛速度及模型的准确度，从有效提升六足机器人的自主决策能力。

技术特征：

1.一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法，其特征在于：一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法包括以下几个步骤：

2.根据权利要求1所述的深度神经网络结构，其特征在于其隐含层依据六足机器人驾驶决策特点分为两个独立的功能层次，即判断层和指令层，其中判断层还包括3个子功能层次，即方向判断层、距离判断层和速度判断层，判断层各子功能层并行连接，指令层还包括3个子功能层次，即步态指令层、步幅/高指令层和机体位姿指令层，指令层各子功能层并行连接，判断层和指令层串行连接，环境信息以局部地形信息矩阵的形式从输入层流入判断层后，继续流入指令层，最后从输出层输出决策指令。

技术总结
本发明属于足式机器人驾驶操作技术领域。本发明公开了一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法，解决六足机器人驾驶员决策经验量化建模的问题。本发明所述的一种基于深度神经网络的六足机器人驾驶员决策模型分层训练方法，采用一种功能层次清晰、便于分步调试的深度神经网络结构，并采用梯度下降法逐层对神经网络参数进行训练，以分层、逐步、反向寻优的方式得到六足机器人驾驶员决策的神经网络模型。本发明可有效提升传统神经网络对高维非线性多输入/出决策模型训练的收敛速度和模型输出结果的可解释性，用该方法得到的驾驶员决策模型可大大提升六足机器人的自主决策水平。

技术研发人员：尤波,陈潇磊,李佳钰,董正
受保护的技术使用者：哈尔滨理工大学
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尤波陈潇磊李佳钰董正
技术所有人：哈尔滨理工大学
我是此专利的发明人

上一篇：一种带分散功能的污泥给料装置的制作方法
上一篇：一种基于两阶段注意力机制的软件定义网络流量预测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。