一种接触网悬挂部件快速定位方法与流程

文档序号:14489337阅读:166来源:国知局

本发明涉及图像识别技术领域,特别是一种接触网悬挂部件快速定位方法。



背景技术:

当前接触网悬挂多部件定位主要存在如下的缺点:(1)定位精度低,通过图像识别定位部件传统采用特征提取+svm分类器算法,其中特征提取采用人工设定的特征,图像背景复杂情况下,人工特征区分度不够高;随着样本的增加,svm分类能力下降,综合影响定位精度;(2)定位时间太长,随着样本的增加,svm中支持向量的个数也在增加,导致定位时间加长;(3)一个定位模型不能较好的同时定位多个目标,理论上,一个部件比如绝缘子和线夹,形状差别很大,要想精度高的定位到两个目标,需要训练两种定位模型,如果定位20个以上,需要更多模型,不能做到有效的同时定位。



技术实现要素:

为解决上述问题,本发明提供了一种接触网悬挂部件快速定位方法,包括如下步骤:

步骤一:预先设定适用于接触网悬挂部件的卷积神经网络模型;

步骤二:把预先做好的样本图像送入卷积神经网网络进行训练,得到权值文件,所述权值文件是权值矩阵与偏置向量的取值文件;

步骤三:输入待识别的图像,并解码为原始灰度图像;

步骤四:加载卷积神经网络模型,利用卷积神经网络结构提取输入图像的图像特征;

步骤五:加载神经网网络的权值文件和配置文件;

步骤六:将输入图像划分成n*n的网格,把目标在全图的真实矩形框的中心转换为对应n*n的格子位置中心;所述n为整数;

步骤七:对于每个n*n网格,随机取两个长宽比固定的矩形框,所述两个矩形框位置位于网格内,且具有一定的重叠区域;

步骤八:判断步骤七中两个矩形框内的物体类别和置信度,如果满足预先设定的阈值,认为两个矩形框为定位目标,如果两个目标为同一个类别,合并矩形框,并确定矩形框的位置和类别信息。

进一步的,权值矩阵与偏置向量取值介于0-1之间。

进一步的,步骤三中,图像格式为jpg格式。

进一步的,步骤三中,图像输入尺寸为512*512或者256*256或者600*600。

进一步的,步骤六、步骤七中,n为7。

进一步的,步骤二中,抽样层计算时,抽样核为3*3。

本发明的有益效果为:

(1)同时定位的目标种类多,最多可以同时定位1000种目标。

(2)效率高。采用一个模型,一张图像的所有零部件都能定位,且定位速度快,定位一张6600*2900图像目标,在gpu硬件下,只需要10毫秒。

(3)对环境要求低,支持晚上和白天应用场景。

(4)支持面阵和线阵图像格式。

附图说明

图1为本发明流程图。

具体实施方式

如图1所示,本发明包括如下步骤:

步骤一:预先设定适用于接触网悬挂部件的卷积神经网络模型。

接触网悬挂部件属于铁路领域的电气部件,如绝缘子部件、绝缘子底座部件、支撑装置连接件。其特点在于零部件较小、零部件布局比较稀疏,图像成像为灰度图像,考虑这些特点,我们根据googlenet网络定制一个属于接触网悬挂部件的卷积神经网络模型。

步骤二:把预先做好的样本图像送入卷积神经网网络进行训练,得到权值文件。

所述样本图像应该涵盖所有接触网悬挂部件。

权值文件是权值矩阵与偏置向量的取值文件,权值矩阵与偏置向量初始值为0-1之间的随机值,经训练后得到稳定的、介于0-1之间的数。

本发明采用googlenet定制深度网络模型。

卷积神经网络(convolutionalneuralnetworks-简称cnn)一般由卷积层和抽样层交叉构成,卷积层用于提取图像特征;抽样层用于保持局部特征的稳定性,本发明采用cnn作为神经网络。

cnn一般包含卷积层和抽样层,其中卷积层指通过卷积核和上层输出做点积运算,卷积运算如下公式:

x2=f(x1·w+b);

其中x2为当前层神经网络的卷积输出,x1为上层的神经网络输出,w为权值矩阵,b为偏置向量;

w、b初始值为0-1之间的随机值,f为激活函数,一般为sigmoid函数,函数形式如下式

抽样层计算是指抽样核在图像区域内滑动时,计算滑动窗口内点最大值,本发明抽样核为3*3。采用此尺寸的抽样核能够防止太大丢失图像信息的问题。

步骤三:输入待识别的图像,并解码为原始灰度图像。

图像格式为jpg编码,图像输入尺寸可为512*512、256*256,600*600或者其他。经实验证明,优选为512*512。

步骤四:加载卷积神经网络模型,利用卷积神经网络结构提取输入图像的图像特征。

步骤五:加载神经网网络的权值文件和配置文件。

配置文件主要指网络模型的参数,包括网络的层数,网络由多少卷积层和抽样层构成等,配置文件手动构造。

步骤六:将输入图像划分成n*n的网格,把目标在全图的真实矩形框的中心转换为对应n*n的格子位置中心。

设目标x为中心,w为图片宽度,那么目标所在的n*n格子的序号可标记为:index_x=x/(w/n),x方向的偏移为x/(w/n)的余数。

本例中,n为7。

步骤七:对于每个n*n网格,随机取两个长宽比固定的矩形框,所述两个矩形框位置位于网格内,且具有一定的重叠区域。

步骤八:判断步骤八中两个矩形框内的物体类别和置信度,如果满足预先设定的阈值,认为两个矩形框为定位目标,如果两个目标为同一个类别,合并矩形框,并确定矩形框的位置和类别信息。

如图中,右下角网格中两个矩形框内的物体类别识别出来,都是绝缘子,则合并这两个矩形框,将该网格所处位置的物体标记为绝缘子。



技术特征:

技术总结
本发明提供了一种接触网悬挂部件快速定位方法。该方法利用神经网络模型对接触网悬挂部件进行识别。识别图像时,将把图像划分成若干的网格,对于每个网格,随机取两个长宽比固定的矩形框,判断2个矩形框内的物体类别和置信度,如果满足一个阈值,认为两个矩形框为定位目标,如果两个目标为同一个类别,合并矩形框,并范围矩形框的位置和类别信息。本发明采用一个模型就能对一张图像的所有零部件都能定位、定位速度快、支持晚上和白天应用场景。

技术研发人员:张楠;王瑞锋
受保护的技术使用者:成都唐源电气股份有限公司
技术研发日:2017.12.15
技术公布日:2018.05.22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1