一种基于多特征融合的车牌汉字识别方法

文档序号:8259574阅读:210来源:国知局
一种基于多特征融合的车牌汉字识别方法
【技术领域】
[0001] 本发明涉及图像处理技术领域,具体是一种基于多特征融合的车牌汉字识别方 法。
【背景技术】
[0002] 车牌字符识别是车牌识别系统的最后一步,也是至关重要的一步,它直接影响着 整个系统的识别准确率和效率。对于车牌字母数字部分的识别,国内外已有很多成熟的方 法,可以达到很高的准确率。而对于车牌的汉字部分,由于实际环境中采集的车牌图像,汉 字部分往往具有结构复杂、笔划繁多、分辨率较低、笔划断裂、部分变浅或缺失、边缘模糊、 字符倾斜等特点,使得汉字识别变得很困难,基于现有的字母数字识别方法,无法达到满意 的准确率。因此,准确识别车牌汉字字符,成为国内车牌识别系统的难点。
[0003] 车牌汉字识别通常采用三种识别方法,分别是基于模板匹配的方法、基于神经网 络的方法、基于支持向量机(SVM)的方法。依据模式识别理论可知,影响识别准确率的最大 因素,不是选择的哪种分类方法,而是选择的目标特征,只要汉字字符特征选择的合适,上 述三种方法均能达到不错的分类效果。因此,如何选择汉字字符特征,成为决定车牌汉字识 别成败的关键。
[0004] 目前,常用的车牌汉字特征主要有以下几类:
[0005] (1)全局特征,该类特征采用全局变换来获取字符的整体特征,使用有序的整体特 征或者子集特征来构成特征向量,常见的特征有GABOR变换特征、矩特征、投影特征、笔划 密度特征、HARR特征、HOG特征等。这些特征的优点是对局部变化不敏感,抗干扰能力强; 其缺点是容易忽略某些重要的局部特征,无法区分相似的字符。
[0006] (2)局部特征,该类特征采用在字符的多个局部区域内,计算相应的特征,使用串 联的有序局部特征构成最终的特征向量,主要包括局部灰度特征、LBP特征、穿线特征、SIFT 特征等。该类特征的优点是区分字符的能力强;其缺点是抗干扰能力弱,运算相对较慢。

【发明内容】

[0007] 本发明的目的在于针对使用全局特征或局部特征识别汉字的缺点,提供一种基于 多特征融合的车牌汉字识别方法,通过融合多种特征,可以更加精确地识别汉字,同时对于 字符的图像质量要求更低。
[0008] 本发明的技术方案为:
[0009] 一种基于多特征融合的车牌汉字识别方法,包括以下步骤:
[0010] (1)对收集的若干训练图像进行预处理,得到若干训练样本;
[0011] ⑵分别获取训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向 量;
[0012] (3)串联训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量, 形成训练样本的汉字融合特征向量;
[0013] (4)将所有训练样本的汉字融合特征向量输入SVM分类器,完成对SVM分类器的训 练;
[0014] (5)对待测车牌汉字图像进行预处理,得到测试样本;
[0015] (6)分别获取测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向 量;
[0016] (7)串联测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量, 形成测试样本的汉字融合特征向量;
[0017] (8)将测试样本的汉字融合特征向量输入训练完成的SVM分类器,识别得到待测 车牌汉字图像中的汉字。
[0018] 所述的基于多特征融合的车牌汉字识别方法,步骤(2)中,获取训练样本的汉字 边缘特征向量,具体包括以下步骤:
[0019] (21)利用以下公式,计算训练样本全图每一个像素的梯度幅值和方向角度:
【主权项】
1. 一种基于多特征融合的车牌汉字识别方法,其特征在于,包括以下步骤: (1) 对收集的若干训练图像进行预处理,得到若干训练样本; (2) 分别获取训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量; (3) 串联训练样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量,形成 训练样本的汉字融合特征向量; (4) 将所有训练样本的汉字融合特征向量输入SVM分类器,完成对SVM分类器的训练; (5) 对待测车牌汉字图像进行预处理,得到测试样本; (6) 分别获取测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量; (7) 串联测试样本的汉字边缘特征向量、汉字灰度特征向量、汉字纹理特征向量,形成 测试样本的汉字融合特征向量; (8) 将测试样本的汉字融合特征向量输入训练完成的SVM分类器,识别得到待测车牌 汉字图像中的汉字。
2. 根据权利要求1所述的基于多特征融合的车牌汉字识别方法,其特征在于,步骤(2) 中,获取训练样本的汉字边缘特征向量,具体包括以下步骤: (21) 利用以下公式,计算训练样本全图每一个像素的梯度幅值和方向角度:
其中,M(x,y)表示像素(x,y)的梯度幅值,a(x,y)表示像素(x,y)的方向角度,g(x,y)表示像素(x,y)的灰度值; (22) 利用以下公式,对步骤(21)计算出的方向角度进行校正:
其中,a' (x,y)表示校正后的方向角度; (23) 基于像素的方向角度,统计每个晶胞的4维梯度方向直方图,每个晶胞由若干像 素构成; (24) 将4个晶胞的梯度方向直方图串联起来,构成一个区块的梯度方向直方图; (25) 将所有区块的梯度方向直方图归一化后串联起来,形成训练样本的汉字边缘特征 向量。
3. 根据权利要求1所述的基于多特征融合的车牌汉字识别方法,其特征在于,步骤(2) 中,获取训练样本的汉字灰度特征向量,具体包括以下步骤: (31)借助HARR特征模板,分别将训练样本按照五种方式进行划分,即分别将训练样 本划分为左右两个局部区域、上下两个局部区域、左中右三个局部区域、上中下三个局部区 域、左上、左下、右上、右下四个局部区域,得到14个局部区域子图; (32) 利用最大类间距算法,获取训练样本的二值图像; (33) 基于训练样本的二值图像,统计得到全图前景目标点所占的比例; (34) 基于训练样本的二值图像,分别统计得到14个局部区域子图前景目标点所占的 比例; (35) 将得到的各个比例值串联起来,形成训练样本的汉字灰度特征向量。
4.根据权利要求1所述的基于多特征融合的车牌汉字识别方法,其特征在于,步骤(2) 中,获取训练样本的汉字纹理特征向量,具体包括以下步骤: (41) 借助HARR特征模板,分别将训练样本按照五种方式进行划分,即分别将训练样 本划分为左右两个局部区域、上下两个局部区域、左中右三个局部区域、上中下三个局部区 域、左上、左下、右上、右下四个局部区域,得到14个局部区域子图; (42) 利用以下公式,对训练样本进行LBP特征变换,得到训练样本的LBP特征图:
其中,LBPp,,(x。,y。)表示当前像素(x。,y。)的LBP变换特征,g(x。,y。)表示当前像素 (x。,y。)的灰度值,g(xn,yn)表示邻域像素(xn,yn)的灰度值,p表示邻域像素的数目,r表 示邻域半径; (43) 基于训练样本的LBP特征图,统计得到全图的9维灰度直方图; (44) 基于训练样本的LBP特征图,分别统计得到14个局部区域子图的9维灰度直方 图; (45) 将得到的各个9维灰度直方图串联起来,形成训练样本的汉字纹理特征向量。
【专利摘要】本发明提供一种基于多特征融合的车牌汉字识别方法,包括以下步骤:待测图像归一化;改进HOG特征,获取待测图像的汉字边缘特征;获取待测图像的汉字灰度特征;基于LBP特征理论,获取待测图像的汉字纹理特征;融合待测图像的汉字边缘特征、灰度特征、纹理特征,获取待测图像的融合特征向量;基于SVM分类器,预测分类结果。本发明综合利用了汉字的全局特征和局部特征,识别更加准确,对于低质量图像和强干扰图像,具有较强的鲁棒性。
【IPC分类】G06K9-62, G08G1-017
【公开号】CN104573707
【申请号】CN201410788657
【发明人】张卡, 何佳, 聂勇, 郑浩
【申请人】安徽清新互联信息科技有限公司
【公开日】2015年4月29日
【申请日】2014年12月17日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1