变电站巡检机器人辅助避障训练方法、设备及介质与流程

文档序号:20919981发布日期:2020-05-29 14:01阅读:来源:国知局

技术特征:

1.一种变电站巡检机器人辅助避障训练方法,其特征在于,包括:

接收第一图像并形成第一数据集,所述第一图像与变电站内的设备、仪表和障碍物相关;

使用所述第一数据集训练教师网络,以获取所述教师网络的温度参数,所述温度参数值与所述教师网络的训练难度有关;

根据所述温度参数,通过知识蒸馏神经网络,训练学生网络,得到第一学生网络;

使用第二数据集训练所述第一学生网络,直至达到第一目标避障率,以使所述机器人进行避障,所述第二数据集包括所述第一图像和通过所述机器人的图像传感器收集的第二图像。

2.根据权利要求1所述的方法,其特征在于,所述使用第二数据集训练所述第一学生网络,直至达到第一目标避障率,以使所述机器人进行避障之后,还包括:

多个所述机器人接收所述第一学生网络,所述多个所述机器人分别通过各自获取的所述第二图像和所述第一图像,训练所述第一学生网络,直至达到第二目标避障率,以辅助所述机器人进行避障,其中,多个所述机器人位于变电站的不同区域。

3.根据权利要求2所述的方法,其特征在于,所述多个所述机器人接收所述第一学生网络,所述多个所述机器人分别通过各自获取的所述第二图像和所述第一图像,训练所述第一学生网络,包括:

所述机器人对所述第一学生网络训练预设时间后,分别接收多个所述机器人各自的所述第一学生网络,合并多个所述第一学生网络,得到第二学生网络;

将所述第二学生网络发送到多个所述机器人中,并使多个所述机器人分别通过各自获取的所述第二图像和所述第一图像,训练所述第二学生网络。

4.根据权利要求1所述的方法,其特征在于,所述接收第一图像并形成第一数据集,包括:

标识所述第一图像的指定区域,所述指定区域与变电站内的设备、仪表和障碍物相关;

标识完成后,将所述第一数据集分为训练集和测试集。

5.根据权利要求4所述的方法,其特征在于,所述根据所述温度参数,通过知识蒸馏神经网络,训练学生网络,包括:

将所述教师网络通过所述温度参数进行计算,得到软目标;

将所述学生网络通过所述温度参数进行计算,得到第一结果,并将所述第一结果与所述软目标的交叉熵函数,作为所述学生网络的损失值的一部分;

将所述学生网络直接获得的第二结果与硬目标的交叉熵函数,作为所述学生网络的损失值的另一部分,所述硬目标包括所述指定区域在图像中的位置信息。

6.根据权利要求1所述的方法,其特征在于,所述使用第二数据集训练所述第一学生网络之前,还包括:

使用图像处理算法对所述第二数据集内的第一图片和第二图片进行处理,得到每个所述第一图片和所述第二图片的余弦相似度;

将所述余弦相似度与预设阈值进行比较,确定所述第二数据集中的未识别图像,统计所述未识别图像的数量;

通过所述未识别图像的数量,使用算法计算是否剔除所述未识别图像。

7.根据权利要求1所述的方法,其特征在于,所述学生网络包括所述教师网络的部分神经网络层和部分神经元。

8.一种变电站巡检机器人辅助避障训练设备,其特征在于,包括:至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

接收第一图像并形成第一数据集,所述第一图像与变电站内的设备、仪表和障碍物相关;

使用所述第一数据集训练教师网络,以获取所述教师网络的温度参数,所述温度参数值与所述教师网络的训练难度有关;

根据所述温度参数,通过知识蒸馏神经网络,训练学生网络,得到第一学生网络;

使用第二数据集训练所述第一学生网络,直至达到第一目标避障率,以使所述机器人进行避障,所述第二数据集包括所述第一图像和通过所述机器人的图像传感器收集的第二图像。

9.一种变电站巡检机器人辅助避障训练的非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:

接收第一图像并形成第一数据集,所述第一图像与变电站内的设备、仪表和障碍物相关;

使用所述第一数据集训练教师网络,以获取所述教师网络的温度参数,所述温度参数值与所述教师网络的训练难度有关;

根据所述温度参数,通过知识蒸馏神经网络,训练学生网络,得到第一学生网络;

使用第二数据集训练所述第一学生网络,直至达到第一目标避障率,以使所述机器人进行避障,所述第二数据集包括所述第一图像和通过所述机器人的图像传感器收集的第二图像。


技术总结
本发明涉及变电站巡检机器人辅助避障训练方法、设备及介质,方法包括:接收第一图像并形成第一数据集,所述第一图像与变电站内的设备、仪表和障碍物相关;使用所述第一数据集训练教师网络,以获取所述教师网络的温度参数,所述温度参数值与所述教师网络的训练难度有关;根据所述温度参数,通过知识蒸馏神经网络,训练学生网络,得到第一学生网络;使用第二数据集训练所述第一学生网络,直至达到第一目标避障率,以使所述机器人进行避障。本发明采用知识蒸馏和教师网络训练学生网络,提高学生网络的泛化能力,通过多个机器人对学生网络进行多场景的训练,并进行集成,提高了学生网络的环境适应能力和准确率。

技术研发人员:张继勇;庄浩;刘鑫;连理国;王世杰
受保护的技术使用者:华瑞新智科技(北京)有限公司
技术研发日:2019.12.31
技术公布日:2020.05.29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1