一种基于多特征融合的车牌汉字识别方法

文档序号：8259574阅读：210来源：国知局

一种基于多特征融合的车牌汉字识别方法
【技术领域】
[0001] 本发明涉及图像处理技术领域，具体是一种基于多特征融合的车牌汉字识别方法。
【背景技术】
[0002] 车牌字符识别是车牌识别系统的最后一步，也是至关重要的一步，它直接影响着整个系统的识别准确率和效率。对于车牌字母数字部分的识别，国内外已有很多成熟的方法，可以达到很高的准确率。而对于车牌的汉字部分，由于实际环境中采集的车牌图像，汉字部分往往具有结构复杂、笔划繁多、分辨率较低、笔划断裂、部分变浅或缺失、边缘模糊、字符倾斜等特点，使得汉字识别变得很困难，基于现有的字母数字识别方法，无法达到满意的准确率。因此，准确识别车牌汉字字符，成为国内车牌识别系统的难点。
[0003] 车牌汉字识别通常采用三种识别方法，分别是基于模板匹配的方法、基于神经网络的方法、基于支持向量机（SVM)的方法。依据模式识别理论可知，影响识别准确率的最大因素，不是选择的哪种分类方法，而是选择的目标特征，只要汉字字符特征选择的合适，上述三种方法均能达到不错的分类效果。因此，如何选择汉字字符特征，成为决定车牌汉字识别成败的关键。
[0004] 目前，常用的车牌汉字特征主要有以下几类：
[0005] (1)全局特征，该类特征采用全局变换来获取字符的整体特征，使用有序的整体特征或者子集特征来构成特征向量，常见的特征有GABOR变换特征、矩特征、投影特征、笔划密度特征、HARR特征、HOG特征等。这些特征的优点是对局部变化不敏感，抗干扰能力强；其缺点是容易忽略某些重要的局部特征，无法区分相似的字符。
[0006] (2)局部特征，该类特征采用在字符的多个局部区域内，计算相应的特征，使用串联的有序局部特征构成最终的特征向量，主要包括局部灰度特征、LBP特征、穿线特征、SIFT 特征等。该类特征的优点是区分字符的能力强；其缺点是抗干扰能力弱，运算相对较慢。

【发明内容】

[0007] 本发明的目的在于针对使用全局特征或局部特征识别汉字的缺点，提供一种基于多特征融合的车牌汉字识别方法，通过融合多种特征，可以更加精确地识别汉字，同时对于字符的图像质量要求更低。
[0008] 本发明的技术方案为：
[0009] 一种基于多特征融合的车牌汉字识别方法，包括以下步骤：
[0010] (1)对收集的若干训练图像进行预处理，得到若干训练样本；
[0011] ⑵分别获取训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量；
[0012] (3)串联训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量，形成训练样本的汉字融合特征向量；
[0013] (4)将所有训练样本的汉字融合特征向量输入SVM分类器，完成对SVM分类器的训练；
[0014] (5)对待测车牌汉字图像进行预处理，得到测试样本；
[0015] (6)分别获取测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量；
[0016] (7)串联测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量，形成测试样本的汉字融合特征向量；
[0017] (8)将测试样本的汉字融合特征向量输入训练完成的SVM分类器，识别得到待测车牌汉字图像中的汉字。
[0018] 所述的基于多特征融合的车牌汉字识别方法，步骤（2)中，获取训练样本的汉字边缘特征向量，具体包括以下步骤：
[0019] (21)利用以下公式，计算训练样本全图每一个像素的梯度幅值和方向角度：
【主权项】
1. 一种基于多特征融合的车牌汉字识别方法，其特征在于，包括以下步骤： (1) 对收集的若干训练图像进行预处理，得到若干训练样本； (2) 分别获取训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量； (3) 串联训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量，形成训练样本的汉字融合特征向量； (4) 将所有训练样本的汉字融合特征向量输入SVM分类器，完成对SVM分类器的训练； (5) 对待测车牌汉字图像进行预处理，得到测试样本； (6) 分别获取测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量； (7) 串联测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量，形成测试样本的汉字融合特征向量； (8) 将测试样本的汉字融合特征向量输入训练完成的SVM分类器，识别得到待测车牌汉字图像中的汉字。
2. 根据权利要求1所述的基于多特征融合的车牌汉字识别方法，其特征在于，步骤（2) 中，获取训练样本的汉字边缘特征向量，具体包括以下步骤： (21) 利用以下公式，计算训练样本全图每一个像素的梯度幅值和方向角度：
其中，M(x，y)表示像素（x，y)的梯度幅值，a(x，y)表示像素（x，y)的方向角度，g(x，y)表示像素（x，y)的灰度值； (22) 利用以下公式，对步骤（21)计算出的方向角度进行校正：
其中，a' (x，y)表示校正后的方向角度； (23) 基于像素的方向角度，统计每个晶胞的4维梯度方向直方图，每个晶胞由若干像素构成； (24) 将4个晶胞的梯度方向直方图串联起来，构成一个区块的梯度方向直方图； (25) 将所有区块的梯度方向直方图归一化后串联起来，形成训练样本的汉字边缘特征向量。
3. 根据权利要求1所述的基于多特征融合的车牌汉字识别方法，其特征在于，步骤（2) 中，获取训练样本的汉字灰度特征向量，具体包括以下步骤： (31)借助HARR特征模板，分别将训练样本按照五种方式进行划分，即分别将训练样本划分为左右两个局部区域、上下两个局部区域、左中右三个局部区域、上中下三个局部区域、左上、左下、右上、右下四个局部区域，得到14个局部区域子图； (32) 利用最大类间距算法，获取训练样本的二值图像； (33) 基于训练样本的二值图像，统计得到全图前景目标点所占的比例； (34) 基于训练样本的二值图像，分别统计得到14个局部区域子图前景目标点所占的比例； (35) 将得到的各个比例值串联起来，形成训练样本的汉字灰度特征向量。
4.根据权利要求1所述的基于多特征融合的车牌汉字识别方法，其特征在于，步骤（2) 中，获取训练样本的汉字纹理特征向量，具体包括以下步骤： (41) 借助HARR特征模板，分别将训练样本按照五种方式进行划分，即分别将训练样本划分为左右两个局部区域、上下两个局部区域、左中右三个局部区域、上中下三个局部区域、左上、左下、右上、右下四个局部区域，得到14个局部区域子图； (42) 利用以下公式，对训练样本进行LBP特征变换，得到训练样本的LBP特征图：
其中，LBPp,,(x。，y。）表示当前像素（x。，y。）的LBP变换特征，g(x。，y。）表示当前像素 (x。，y。）的灰度值，g(xn，yn)表示邻域像素（xn，yn)的灰度值，p表示邻域像素的数目，r表示邻域半径； (43) 基于训练样本的LBP特征图，统计得到全图的9维灰度直方图； (44) 基于训练样本的LBP特征图，分别统计得到14个局部区域子图的9维灰度直方图； (45) 将得到的各个9维灰度直方图串联起来，形成训练样本的汉字纹理特征向量。
【专利摘要】本发明提供一种基于多特征融合的车牌汉字识别方法，包括以下步骤：待测图像归一化；改进HOG特征，获取待测图像的汉字边缘特征；获取待测图像的汉字灰度特征；基于LBP特征理论，获取待测图像的汉字纹理特征；融合待测图像的汉字边缘特征、灰度特征、纹理特征，获取待测图像的融合特征向量；基于SVM分类器，预测分类结果。本发明综合利用了汉字的全局特征和局部特征，识别更加准确，对于低质量图像和强干扰图像，具有较强的鲁棒性。
【IPC分类】G06K9-62, G08G1-017
【公开号】CN104573707
【申请号】CN201410788657
【发明人】张卡, 何佳, 聂勇, 郑浩
【申请人】安徽清新互联信息科技有限公司
【公开日】2015年4月29日
【申请日】2014年12月17日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张卡;何佳;聂勇;郑浩;
技术所有人：安徽清新互联信息科技有限公司;
我是此专利的发明人

上一篇：组合降采样极限学习机的制作方法
上一篇：一种物体图像识别方法及其系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。