一种接触网悬挂部件快速定位方法与流程

文档序号：14489337阅读：166来源：国知局

本发明涉及图像识别技术领域，特别是一种接触网悬挂部件快速定位方法。

背景技术：

当前接触网悬挂多部件定位主要存在如下的缺点：(1)定位精度低，通过图像识别定位部件传统采用特征提取+svm分类器算法，其中特征提取采用人工设定的特征，图像背景复杂情况下，人工特征区分度不够高；随着样本的增加，svm分类能力下降，综合影响定位精度；(2)定位时间太长，随着样本的增加，svm中支持向量的个数也在增加，导致定位时间加长；(3)一个定位模型不能较好的同时定位多个目标，理论上，一个部件比如绝缘子和线夹，形状差别很大，要想精度高的定位到两个目标，需要训练两种定位模型，如果定位20个以上，需要更多模型，不能做到有效的同时定位。

技术实现要素：

为解决上述问题，本发明提供了一种接触网悬挂部件快速定位方法，包括如下步骤：

步骤一：预先设定适用于接触网悬挂部件的卷积神经网络模型；

步骤二：把预先做好的样本图像送入卷积神经网网络进行训练，得到权值文件，所述权值文件是权值矩阵与偏置向量的取值文件；

步骤三：输入待识别的图像，并解码为原始灰度图像；

步骤四：加载卷积神经网络模型，利用卷积神经网络结构提取输入图像的图像特征；

步骤五：加载神经网网络的权值文件和配置文件；

步骤六：将输入图像划分成n*n的网格，把目标在全图的真实矩形框的中心转换为对应n*n的格子位置中心；所述n为整数；

步骤七：对于每个n*n网格，随机取两个长宽比固定的矩形框，所述两个矩形框位置位于网格内,且具有一定的重叠区域；

步骤八：判断步骤七中两个矩形框内的物体类别和置信度，如果满足预先设定的阈值，认为两个矩形框为定位目标，如果两个目标为同一个类别，合并矩形框，并确定矩形框的位置和类别信息。

进一步的，权值矩阵与偏置向量取值介于0-1之间。

进一步的，步骤三中，图像格式为jpg格式。

进一步的，步骤三中，图像输入尺寸为512*512或者256*256或者600*600。

进一步的，步骤六、步骤七中，n为7。

进一步的，步骤二中，抽样层计算时，抽样核为3*3。

本发明的有益效果为：

(1)同时定位的目标种类多，最多可以同时定位1000种目标。

(2)效率高。采用一个模型，一张图像的所有零部件都能定位，且定位速度快，定位一张6600*2900图像目标，在gpu硬件下，只需要10毫秒。

(3)对环境要求低，支持晚上和白天应用场景。

(4)支持面阵和线阵图像格式。

附图说明

图1为本发明流程图。

具体实施方式

如图1所示，本发明包括如下步骤：

步骤一：预先设定适用于接触网悬挂部件的卷积神经网络模型。

接触网悬挂部件属于铁路领域的电气部件，如绝缘子部件、绝缘子底座部件、支撑装置连接件。其特点在于零部件较小、零部件布局比较稀疏，图像成像为灰度图像，考虑这些特点，我们根据googlenet网络定制一个属于接触网悬挂部件的卷积神经网络模型。

步骤二：把预先做好的样本图像送入卷积神经网网络进行训练，得到权值文件。

所述样本图像应该涵盖所有接触网悬挂部件。

权值文件是权值矩阵与偏置向量的取值文件，权值矩阵与偏置向量初始值为0-1之间的随机值，经训练后得到稳定的、介于0-1之间的数。

本发明采用googlenet定制深度网络模型。

卷积神经网络(convolutionalneuralnetworks-简称cnn)一般由卷积层和抽样层交叉构成，卷积层用于提取图像特征；抽样层用于保持局部特征的稳定性,本发明采用cnn作为神经网络。

cnn一般包含卷积层和抽样层，其中卷积层指通过卷积核和上层输出做点积运算，卷积运算如下公式：

x2＝f(x1·w+b)；

其中x2为当前层神经网络的卷积输出，x1为上层的神经网络输出，w为权值矩阵，b为偏置向量；

w、b初始值为0-1之间的随机值，f为激活函数，一般为sigmoid函数，函数形式如下式

抽样层计算是指抽样核在图像区域内滑动时，计算滑动窗口内点最大值，本发明抽样核为3*3。采用此尺寸的抽样核能够防止太大丢失图像信息的问题。

步骤三：输入待识别的图像，并解码为原始灰度图像。

图像格式为jpg编码，图像输入尺寸可为512*512、256*256,600*600或者其他。经实验证明，优选为512*512。

步骤四：加载卷积神经网络模型，利用卷积神经网络结构提取输入图像的图像特征。

步骤五：加载神经网网络的权值文件和配置文件。

配置文件主要指网络模型的参数，包括网络的层数，网络由多少卷积层和抽样层构成等，配置文件手动构造。

步骤六：将输入图像划分成n*n的网格，把目标在全图的真实矩形框的中心转换为对应n*n的格子位置中心。

设目标x为中心，w为图片宽度，那么目标所在的n*n格子的序号可标记为：index_x＝x/(w/n)，x方向的偏移为x/(w/n)的余数。

本例中，n为7。

步骤七：对于每个n*n网格，随机取两个长宽比固定的矩形框，所述两个矩形框位置位于网格内,且具有一定的重叠区域。

步骤八：判断步骤八中两个矩形框内的物体类别和置信度，如果满足预先设定的阈值，认为两个矩形框为定位目标，如果两个目标为同一个类别，合并矩形框，并确定矩形框的位置和类别信息。

如图中，右下角网格中两个矩形框内的物体类别识别出来，都是绝缘子，则合并这两个矩形框，将该网格所处位置的物体标记为绝缘子。

技术特征：

技术总结
本发明提供了一种接触网悬挂部件快速定位方法。该方法利用神经网络模型对接触网悬挂部件进行识别。识别图像时，将把图像划分成若干的网格，对于每个网格，随机取两个长宽比固定的矩形框，判断2个矩形框内的物体类别和置信度，如果满足一个阈值，认为两个矩形框为定位目标，如果两个目标为同一个类别，合并矩形框，并范围矩形框的位置和类别信息。本发明采用一个模型就能对一张图像的所有零部件都能定位、定位速度快、支持晚上和白天应用场景。

技术研发人员：张楠;王瑞锋
受保护的技术使用者：成都唐源电气股份有限公司
技术研发日：2017.12.15
技术公布日：2018.05.22

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张楠;王瑞锋
技术所有人：成都唐源电气股份有限公司
我是此专利的发明人

上一篇：样本架存储装置的制作方法
上一篇：一种电动移液器的固定装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。