一种基于最大稳定极值区域和遗传优化SVM的交通标志识别方法与流程

文档序号:14725692发布日期:2018-06-19 06:51阅读:152来源:国知局

本发明属于图像处理技术领域,应用在智能交通场景中。运用基于MSER最大稳定极值区域的交通标志提取算法,来分割提取源自自然场景下含有交通标志的RGB图像。之后,运用分块HOG梯度方向直方图对交通标志的特征进行提取。利用基于自适应交叉变异的改进遗传优化最优参数搜索算法,找出SVM分类器中最优的惩罚参数g与核函数参数c来构造针对这一问题的最优SVM分类器,用以识别图像中的交通标志。



背景技术:

图像处理技术是智能交通领域中重要的组成部分,高效准确的自动化交通标志识别能够引导交通参与者规范地参与交通行为,减轻驾驶员信息处理压力,从而降低事故发生概率。目前,交通标识识别(Traffic Sign Recognition,TSR)系统主要是通过安装在车辆上的摄像机采集道路上的交通标识信息,传送到图像处理模块进行标志检测和识别,之后系统将根据识别的结果做出不同的应对措施。检测阶段需要根据交通标识的颜色和形状特征,从采集的图像中寻找和定位包含交通标识的感兴趣区域。识别阶段要对感兴趣区域,用不同的方法提取特征,并用合适的分类算法对这些感兴趣区域进行分类,得到交通标识的类型信息。

随着研究的深入,涌现出很多交通标志自动识别的方法理论。目前大多数的识别理论在检测阶段都采用颜色信息作为图像分割的方法,但是,颜色信息在受到强光、弱光、阴霾、雾气、标志自身颜色剥蚀等情况的影响下效果会变差。另外,尽管交通标识通常具有醒目的颜色,肉眼易于辨识,但是在现代化的城市场景下(比如炫彩灯光、墙面颜色等),使得交通标识与背景颜色难以区分,从而在标志检测过程中不易发现标识区域。在识别阶段,大部分现有的系统由使用手工标记的真实图像训练的分类器组成,这是一个重复耗时,并且容易出错的处理过程。为此,要尽量规避这种人工操作和手工标记训练。同时,由于交通标志识别系统对检测识别的实时性要求较高,尤其在道路状况复杂、车速较高的情况下,系统需要在尽可能短的时间内做出识别,并将结果通知驾驶员,以便驾驶员有充足的时间做出反应。因此,鉴于颜色识别在复杂环境应用的弊端,手工标记的易错性和机器训练的大量耗时,以及系统对实时性的要求,没有一种性能更为均衡,效果更加稳定的算法,来实现交通标志的智能识别。



技术实现要素:

本发明着眼于交通标志识别中的几个重要性能指标,提出了一种基于最大稳定极值区域和遗传优化SVM的交通标志识别方法,目的在于优化现有方法的性能,克服已有技术的不足。主要运用最大稳定极值区域等方法,对含有交通标志的图片进行提取分割,将初始的普通RGB照片,预处理成利于识别检测的二值图像;之后利用分块HOG进行特征提取;最后利用基于自适应交叉变异的改进遗传优化最优参数搜索算法,计算出SVM分类器中的最优参数,运用优化后的分类器对图像中的交通标志进行分类和识别。

本发明的技术方案:

基于最大稳定极值区域和SVM的交通标志识别方法,步骤如下:

步骤1.颜色转换:采用最大稳定极值区域(MSER)算法对兴趣区域进行检测,并对图像进行灰度化处理。

步骤2.边缘检测:计算兴趣区域中每个像素的水平和垂直一阶梯度,并将其作为HOG特征向量对兴趣区域进行边缘检测。并运用分块HOG来降低维度开销,提高运算效率。

步骤3.分类识别:运用利用基于自适应交叉变异的改进遗传优化最优参数搜索算法,找出SVM分类器中最优的惩罚参数g与核函数参数c来构造针对这一问题的最优SVM分类器。并利用SVM分类器对兴趣区域的形状进行分类并识别。并按照数据库中的标准图像,输出所识别的交通标志。

本发明的有益效果:本发明所提出的基于最大稳定极值区域和遗传优化SVM的交通标志识别方法,突出发挥了最大稳定极值区域算法的稳定性和鲁棒性,并运用分块HOG特征向量作为兴趣区域边缘检测和图像分割的方法,该方法能够在一定程度上抑制平移和旋转带来的影响,由于其对于光照的变化不敏感,因此还能降低图像因光照强度变化带来的干扰。同时,分块HOG相比传统HOG维度大幅降低,运算开销减小,效率提升。在分类识别阶段使用遗传优化SVM分类器,避免了人工标记的易错性和机器训练的大量耗时,综合各方法的优势,较好地平衡了准确性和实时性的要求,实现了交通标志的自动检测和识别。

附图说明

图1是本发明交通标志识别方法的流程图

图2是本发明的实例识别流程的效果图

具体实施方式

以下结合附图和技术方案,进一步说明本发明的具体实施方式。

针对上述3个步骤,对每一个步骤进行以下具体说明:

步骤1:颜色转换

1.1图像归一化:由于交通标志多为红色和蓝色,首先运用公式

对红色和蓝色部分进行统计,选取较大的一个作为阈值,对图片进行红/蓝归一化处理。

1.2确定MSER区域

归一化处理后会产生多个MESR区域,运用一下原则排除干扰区域。

1)面积偏大和偏小的区域需要清除,因为面积偏大的区域极有可能是路边形状规则的物体,面积偏小的区域可能是噪声,兴趣区域占整幅图像的比例在0.2%到4%之间是相对合理的。

2)同时,对于长宽比例过大或者过小的区域进行清除,确定交通标志区域为正方形,这里的长宽比例范围在0.6到1.4之间;

3)判断该兴趣区域面积与该嵌套区域中上一个被判定为稳定区域面积的变化率,如果变化率小于某一较小的阈值,则可能存在重复区域,需要清除,根据实验此处阈值设定为2;

4)计算每个MSER的中心坐标,并以此为中心计算在一个较小范围内是否存在多个MSER区域,如果存在,则说明有多个MSER区域重叠,则将多余的MSER区域清除;

步骤2:边缘检测

基于HOG的特征提取,其首先将图像分割成多个小的连通域,然后计算这些小的连通域的各个像素点的梯度信息。

2.1 CELL细胞划分

将图像划分为多个小的连通域,每一个连通域都是一个CELL单元,其中4个CELL将构成一个新的BLOCK单元。

2.2计算图像各个像素点的梯度信息。

计算图像中每个像素点梯度的幅度和角度值,其计算公式为:

变量θ(x,y)表示的是梯度的角度;变量m(x,y)表示的是梯度的幅度;变量H(x,y)表示的是图像横向梯度;变量V(x,y)表示的是图像纵向梯息。

2.3图像的方向梯度的统计

根据2.2可以获得梯度θ(x,y)的方向信息,其取值范围是-90度到90度之间。然后根据θ(x,y)的取值范围将其平均划分9等分,最后根据CELL梯度的方向数据计算相应的权值m(x,y)。因此,通过上述计算过程,可以得到一个维度为9的特征向量,而一个BLOCK由四个CELL构成,因此,每个BLOCK的特征向量维度为36。

2.4特征标准化处理

有采集得到的交通标志图像存在各种干扰,因此需要对梯度信息进行标准化处理。即将CELL放入到对应的BLOCK中,然后对每个BLOCK进行标准化处理,公式为:

这里,v是标准化之前的向量,ε是一个很小的标准化常量,以防除数为0。

2.5 HOG积分图

根据上述四个步骤,将图像中任意一点(x,y),使用H(x,y)=[H(x,y)1,…,H(x,y)9]T来表示其对应的9个方向梯度信息。因此其HOG特征值可以通过如下的公式得到:

根据公式(5)可知,对图像的所有像素点进行处理,得到完整图像的HOG积分图。在获得HOG积分图之后,再通过如下的计算公式获得HOG积分。

那么对于图像中任意的CELL,通过公式(6)来计算其对应的四个顶点的HOG积分值,即A1,A2,A3,A4,那么其相应的HOG向量可以表示为:

HOG=A4+A1-A2-A3 (7)

通过上述HOG向量的计算步骤可知,HOG特征向量的提取主要是基于局部图像得到的,因此其具体更强的抗干扰能力。

2.6基于分块HOG的特征提取

以40×40大小的交通标志图像为例,将其中8×8大小的图像构造一个CELL,每四个CELL构成一个BLOCK,由于每个CELL具有9维特征向量,所以每个BLOCK中含有36维特征向量,那么以每个步长为8个像素进行扫描,此时图像的水平向和垂直向将有4个扫描窗口,总共16个带有重叠的块。而一个BLOCK具有36维特征向量,那么40×40大小的交通标志图像将具有576维特征向量。通过HOG特征对整个图像进行特征提取,其得到的特征向量的维数较大,会影响识别算法的运行效率。为此运用分块HOG,来降低特征向量的维度。

通常兴趣区域面积通常不会很大,所以将其分为4行4列的16个子图,然后对16子图分别进行HOG特征提取。采用这种方式,可以减少由于重叠而产生的大量的特征向量,从而降低最终的HOG特征向量维数。

步骤3.分类识别

由于Libsvm工具箱可以进行快速的多目标预测和分类功能,更适合此类问题的解决,所以我们使用Libsvm工具箱来实现SVM训练预测模型。但Libsvm工具箱默认的参数有着进一步优化的空间,因为,不同的惩罚参数g,核函数参数c以及核函数的选择对识别效果有着明显的性能影响。因此需要计算出适应这类问题的最优SVM参数。

这里运用基于自适应交叉变异的改进遗传优化最优参数搜索算法,来计算出最优的惩罚参数g和核函数参数c,构造最优的SVM分类器。

3.1交叉概率的自适应调整以及变异概率的自适应调整

遗传算法中交叉概率PC和变异概率Pm的值的设置在很大程度上会影响遗传算法的收敛性和最优解和真实最优解的接近度。通常情况下,交叉概率PC的值越大,那么新个体产生速度将越快,而交叉概率PC的值过大会使高适应个体结构被快速破坏。对于变异概率Pm,如果Pm的值过小,就不容易生成新个体;如果Pm的值过大,算法就等同于随机搜索算法。这里用能够自适应调整的交叉概率和变异概率来确保群体的多样性:

其中:变量λ1,λ2,λ3,λ4的含义表示0~1的常数,变量fmax的含义表示适应值的最大值,变量的含义表示适应值的平均值,变量f′的含义表示较大的交叉适应值,变量f的含义表示变异个体的适应值。

3.2交叉算子的改进

交叉算子能保证个体中的部分优良性能够顺利遗传下去,因此本文使用的方法是在染色体二进制编码的时候,随机选择两个交叉点,然后把交叉点之间的染色体进行交换。在实数编码时,使用算术交叉算子,算术交叉算子可以表示为:

其中是交叉后的个体,是交叉前的个体,是0~1的随机数。

3.3变异算子的改进

变异操作能保持种群的多样性,对最优解的求解非常重要。本文在二进制编码时使用了基本位变异操作,而在实数编码时使用了非均匀变异。非均匀变异中使用的新基因值x′k为:

其中是范围内的随机数;是范围内的随机数。

3.4遗传优化适应度函数的建立

根据上述改进遗传算法的原理,建立如下的优化目标函数:

Fobj=funcSVM(g,c,P) (12)

其中g为惩罚参数,c为核函数参数,P为测试样本,Fobj为对应的识别率。这两个参数通过改进遗传算法进行最优搜索。其对应的适应度函数则可以表示为:

通过改进遗传优化,可以得到参数g最优值为0.0068,参数c最优值为4.9951。此时,将SVM支持向量机的参数做最优值设置便可以获得最优SVM。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1