一种基于融合特征和SVM结合的羊角弓区域定位方法与流程

文档序号:16694389发布日期:2019-01-22 19:20阅读:329来源:国知局
一种基于融合特征和SVM结合的羊角弓区域定位方法与流程

本发明属于交通安全工程技术领域,特别是一种基于融合特征和svm结合的羊角弓区域定位方法。



背景技术:

羊角弓位于滑板两侧,用于改善受流质量,如果羊角缺失,会造成受电弓受力不均匀,进而出现滑板断裂等严重事故,羊角弓的工作状态检测对受电弓-接触网系统的替换、维护维修具有重要意义。

国外对接触网检测系统的研究起步较早,经过多年探索实践,拥有了较为完整的故障检测体系、故障处理体系和故障评价体系。国外对接触网检测系统的研究侧重点各不相同,法国深入研究了弓网动态弹性检测系统的相关技术,德国对检测弓网接触压力形成了较完善的检测体系,日本的弓网离线、接触线磨耗检测技术较为成熟。国内对羊角弓缺陷的研究较少,主要以人工检测方法为主。西南交大的朱晓恒针对采集的受电弓图像,采用图像二值法对羊角弓区域进行对比分析,能够初步判定缺陷状态。莫圣阳团队基于3d视觉检测技术进行了受电弓滑板磨耗的研究,采用高速三维相机、激光发射器,构建出了三维机器视觉系统。总体来说,现有的羊角弓区域定位方法实现复杂,准确率不高,需要寻求一种简单有效的羊角弓区域定位方法。



技术实现要素:

本发明的目的在于提供一种基于融合特征和svm结合的羊角弓区域定位方法,用以简单准确地对羊角弓区域进行定位。

实现本发明目的的技术解决方案为:一种基于融合特征和svm结合的羊角弓区域定位方法,包括以下步骤:

步骤1、训练样本收集:训练样本包括正样本和负样本,正样本的图片是羊角弓正常状态,负样本的图片是羊角弓缺失状态或者是随机裁取的未知物体;

步骤2、lbp特征提取:计算步骤1收集的训练样本中每个像素点的像素值与其邻域的关系,构成局部二进制模式直方图,来提取lbp特征;

步骤3、hog特征提取:将步骤1收集的训练样本,分割成包含多个像素点的单元,然后对每个单元中每个像素点的边缘或者梯度求取方向直方图,整合所有的方向直方图,构成hog特征描述器;

步骤4、特征融合:将步骤2提取的lbp特征和步骤3提取的hog特征,使用串行融合技术进行融合,生成lbp-hog融合特征方向直方图;

步骤5、svm分类器训练:将步骤4获得的lbp-hog融合特征送到svm分类器中进行训练,获取训练参数;

步骤6、多尺度滑动窗口扫描定位:采用多尺度滑动窗口扫描目标图像,通过步骤5中训练好的svm分类器进行预测,实现羊角弓区域的定位。

进一步地,步骤2中所述的计算步骤1收集的训练样本中每个像素点的像素值与其邻域的关系,构成局部二进制模式直方图,来提取lbp特征,具体如下:

步骤2.1、将步骤1收集的图像分成4×4区域;

步骤2.2、对于区域内的每个像素点,选定其灰度值作为lbp算子的阈值,将3×3邻域内的其他像素点的灰度值与lbp算子的阈值进行比对,灰度值比阈值大的像素点置为1,灰度值比阈值小的像素点置为0;然后将3×3邻域内的8个点生成一个8位二进制数,将二进制数转换为十进制数,即得到每个像素点的lbp值;

步骤2.3、计算每个区域的直方图,即每个lbp值出现的频率,得到16个lbp直方图;

步骤2.4、将16个直方图用统一的直方图进行描述;特征图大小为80×60像素,将其分成4×4块,生成的向量为4×4×256=4096维。

进一步地,步骤3中所述的将步骤1收集的训练样本,分割成包含若干像素点的单元,然后对每个单元中每个像素点的边缘或者梯度求取方向直方图,整合所有的方向直方图,构成hog特征描述器,具体如下:

步骤3.1、编辑图像的gamma曲线,公式为:

i(x,y)=i(x,y)gamma(1)

其中i(x,y)表示每个像素点的像素值,gamma=1/2;

步骤3.2、计算图像中每个像素点横纵坐标的梯度方向值,进而获取该像素点的梯度;

设定gx为x方向梯度,gy为y方向梯度,[-1,0,1]为中心模版算子,像素点(x,y)的灰度值为h(x,y),则像素点(x,y)的梯度公式为:

gx(x,y)=h(x+1,y)-h(x-1,y)(2)

gy(x,y)=h(x,y+1)-h(x,y-1)(3)

设定g(x,y)为像素点(x,y)的灰度大小,θ为像素点(x,y)的灰度方向,则:

步骤3.3、将整幅图像分割成单元格,每个单元格大小是10×10像素;梯度直方图选用9个区间,统计每个像素点的梯度权值,绘制每个单元格的梯度直方图,得到9维特征向量的梯度直方图;将每2×2个单元格合并成一个块,归一化每个单元格的特征向量,则每个块的特征向量维数为2×2×9=36;

步骤3.4、将整幅图像的hog特征进行合并,得到整幅图像hog特征;由于每个单元格的大小是10×10,一个块包含2×2个单元格,所以整幅图像的hog特征的维数为9×4×(8-1)×(6-1)=1260。

进一步地,步骤4中所述的将步骤2提取的lbp特征和步骤3提取的hog特征,使用串行融合技术进行融合,生成lbp-hog融合特征方向直方图,具体如下:

设定lbp特征空间为a,hog特征空间为b,存在两个特征向量α∈a和β∈b,采用串行融合,得到:

其中,γ为融合后的特征向量,θ为权重系数;

设定融合后的矩阵维数为f,则:

f=dim(a)+dim(b)(7)

采用串行融合技术对羊角弓特征进行融合,生成lbp-hog特征方向直方图;由lbp特征向量的维数4096,hog特征向量的维数1260,可得融合后的lbp-hog特征向量维数为5356。

进一步地,步骤5中所述的将步骤4获得的lbp-hog融合特征送到svm分类器中进行训练,获取训练参数,具体如下:

设定训练样本的数量为900个,将900个lbp-hog融合特征送入svm分类器进行训练,在正训练的过程中,分别把900个样本分为两组,每组包括300个正样本和600个负样本,训练阶段如下:

把第一组的300个正样本与600个负样本放入svm训练后,接着用第二组的样本集对svm进行测试,得到测试结果,把测试结果中误判为正样本的数据放入第一组的负样本中;重新进行svm分类器的训练和测试过程,把测试结果中误判为正样本的数据放入第一组的负样本中,重复上述过程,得到一个最终的svm分类器。

进一步地,步骤6中所述的采用多尺度滑动窗口扫描目标图像,通过步骤5中训练好的svm分类器进行预测,实现羊角弓区域的定位,具体如下:

对目标图像进行二值化,得出0和255两种灰度值,由于背景色是黑色,羊角弓颜色是白色,所以检测的目标是灰度值为255的区域;选用大小为k×l的窗口,窗口内图像的像素灰度值为h(xi,yj),则灰度值为255的占比为:

式中,η为预判断的阈值,取值为η=0.5;对灰度值为255的占比大于0.5的窗口区域进行lbp-hog特征提取,然后通过训练好的svm分类器进行预测,得到候选矩形窗口;采用多尺度滑动窗口进行检测,当检测到多个目标时,合并候选窗口,最终提取出羊角弓区域。

本发明与现有技术相比,其显著优点为:(1)将lbp特征和hog特征的融合特征送到svm分类器进行训练,使得定位的准确率大大提高;(2)具有定位准确率高、易于实施的优点。

附图说明

图1是本发明中基于融合特征和svm结合的羊角弓区域定位方法的流程示意图。

图2是本发明中的正样本示例图。

图3是本发明中的负样本示例图。

图4是本发明中lbp-hog特征图。

图5是本发明中候选窗口合并示意图。

具体实施方式

结合图1,本发明中所提出的基于融合特征和svm结合的羊角弓区域定位方法,包括以下步骤:

步骤1、训练样本收集:训练样本包括正样本和负样本,正样本的图片是羊角弓正常状态,如图2所示,负样本的图片是羊角弓缺失状态或者是随机裁取的未知物体,如图3所示。

步骤2、lbp特征提取:计算步骤1收集的训练样本中每个像素点的像素值与其邻域的关系,构成局部二进制模式直方图,来提取lbp特征。具体如下:

步骤2.1、将步骤1收集的图像分成4×4区域;

步骤2.2、对于区域内的每个像素点,选定其灰度值作为lbp算子的阈值,将3×3邻域内的其他像素点的灰度值与阈值进行比对,灰度值比阈值大的像素点置为1,灰度值比阈值小的像素点置为0,然后将3×3邻域内的8个点生成一个8位二进制数,将二进制数转换为十进制数,即得到该每个像素点的lbp值;

步骤2.3、计算每个区域的直方图,即每个lbp值出现的频率,得到16个lbp直方图;

步骤2.4、将16个直方图用统一的直方图进行描述。

进一步地,本专利使用的特征图大小为80×60,分成4×4块,生成的向量为4×4×256=4096维。

步骤3、hog特征提取:将步骤1收集的训练样本,分割成包含若干像素点的单元,然后对每个单元中每个像素点的边缘或者梯度求取方向直方图,整合所有的方向直方图,构成hog特征描述器。具体如下:

步骤3.1、为了实现输入图像的颜色空间标准化,编辑图像的gamma曲线,降低光照变化对图像空间的影响,更好地增强图像对比度。gamma压缩公式如下所示:

i(x,y)=i(x,y)gamma(1)

其中i(x,y)表示每个像素点的像素值,gamma=1/2;

步骤3.2、计算图像中每个像素点横纵坐标的梯度方向值,进而获取该像素点的梯度;

设定gx为x方向梯度,gy为y方向梯度,[-1,0,1]为中心模版算子,像素点(x,y)的灰度值为h(x,y),则像素点(x,y)的梯度公式为:

gx(x,y)=h(x+1,y)-h(x-1,y)(2)

gy(x,y)=h(x,y+1)-h(x,y-1)(3)

设定g(x,y)为像素点(x,y)的灰度大小,θ为像素点(x,y)的灰度方向,则:

步骤3.3、将整幅图像分割成单元格,每个单元格大小是10×10像素;梯度直方图选用9个区间,统计每个像素点的梯度权值,绘制每个单元格的梯度直方图,得到9维特征向量的梯度直方图;将每2×2个单元格合并成一个块,归一化每个单元格的特征向量,则每个块的特征向量维数为2×2×9=36;

步骤3.4、将整幅图像的hog特征进行合并,得到整幅图像hog特征;

进一步地,本专利选用的单元格大小是10×10,一个块包含2×2个单元格,再把块进行合并,最终图像的hog特征的维数为9×4×(8-1)×(6-1)=1260。

步骤4、特征融合:将步骤2提取的lbp特征和步骤3提取的hog特征,使用串行融合技术进行融合,生成lbp-hog融合特征方向直方图。具体如下:

设定lbp特征空间为a,hog特征空间为b,存在两个特征向量α∈a和β∈b,采用串行融合,得到:

其中,γ为融合后的特征向量,θ为权重系数;

设定融合后的矩阵维数为f,则:

f=dim(a)+dim(b)(7)

采用串行融合技术对羊角弓特征进行融合,生成的lbp-hog特征方向直方图过程如图4所示。

进一步地,相机采集的大小为80×60图片,选择10×10大小的单元格,单元格合并成大小是2×2的块,lbp特征向量的维数是4×4×256=4096,hog特征向量的维数是9×4×7×5=1260,可得融合后的lbp-hog特征向量维数为5356维。

步骤5、svm分类器训练:将步骤4获得的lbp-hog融合特征送到svm分类器中,进行训练,获取训练参数。具体如下:

设定训练样本的数量为900,将900个lbp-hog融合特征送入svm分类器进行训练,在正训练的过程中,分别把900个样本分为两组,每组包括300个正样本和600个负样本,训练阶段如下:

把第一组的300个正样本与600个负样本放入svm训练后,接着用第二组的样本集对svm进行测试,得到测试结果,把测试结果中误判为正样本的数据放入第一组的负样本中;重新进行svm分类器的训练和测试过程,把测试结果中误判为正样本的数据放入第一组的负样本中,重复上述过程,最终得到一个精确的svm分类器。

步骤6、多尺度滑动窗口扫描定位:采用多尺度滑动窗口扫描目标图像,通过步骤5中训练好的svm分类器进行预测,实现羊角弓区域的定位。具体如下:

为减少多余计算,对目标图像进行二值化,得出0和255两种灰度值,由于背景色是黑色,羊角弓颜色是白色,所以检测的目标是灰度值为255的区域;选用大小为k×l的窗口,窗口内图像的像素灰度值为h(xi,yj),则灰度值为255的占比为:

式中,η为预判断的阈值,取值为η=0.5;对灰度值为255的占比大于0.5的窗口区域进行lbp-hog特征提取,然后通过训练好的svm分类器进行预测,得到候选矩形窗口;采用多尺度滑动窗口进行检测,当检测到多个目标时,合并候选窗口,如图5所示,红色部分是合并后的窗口,最终提取出羊角弓区域。

实施例1

本实施例为基于融合特征和svm结合的羊角弓区域定位方法。

表1hog特征识别结果表

结合表1,在hog特征提取的过程中可以发现,滑动窗口移动的步长大小,单元格(cell)大小、区域块(block)大小,会对检测精度产生影响,结果多次实验后,发现2×2大小的区域块(block),10×10大小的单元格(cell),移动步长为width/4时,hog特征识别效果比较好,识别结果如表1所示,其中误检率是检测错误的图片数/图片总数,漏检率是漏检的图片数/图片总数。

表2不同特征提取方法检测结果对比表

结合表2,采集5660张图片,分别用lbp特征提取方法、hog特征提取方法和本发明基于融合特征和svm结合的羊角弓区域定位方法进行羊角弓的定位识别,识别结果表2所示。可以看出,与lbp特征提取方法和hog特征提取方法两种算法相比较,本发明基于融合特征和svm结合的羊角弓区域定位方法准确率更高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1