一种基于互信息与特征提取的车牌识别方法

文档序号:9751254阅读:819来源:国知局
一种基于互信息与特征提取的车牌识别方法
【技术领域】
[0001] 本发明公开一种车牌识别方法,特别是一种基于互信息与特征提取的车牌识别方 法。
【背景技术】
[0002] 车牌识别系统经过多年的发展,已经是一项较为成熟的技术,但由于外界环境光 线变化、季节环境等变化及车牌本身比较模糊等条件的影响,使得车牌识别系统一直是一 个有解但一直不能解决得很好的问题,而且现有技术中的许多方法都计算复杂,并没有考 虑到实时处理的环境。虽然目前国内外都有一些实用的车牌识别系统面市,但是,这些系统 的识别率都因获取条件的不良变化有很大降低,至今车牌自动识别技术尚未达到很完善的 程度,仍需进一步的研究与完善。车牌识别系统将向着不断提高适应性和实时性的方向发 展。另外,我国车牌的类型复杂也为识别带来了困难。
[0003] 目前,我国车牌主要具有以下特点:
[0004] (1)我国车牌类型可分为蓝底白字、黑底白字、黄底黑字以及白底黑字四种类型。
[0005] (2)我国车牌上的汉字部分一般都表示不同省份自治区直辖市的简称(总共31 个),设置在车牌的第一个字符。其中,黑底车牌还包含了使馆汽车号牌和摩托车号牌,其机 动车登记编号的简称汉字为"使"。
[0006] (3) 2013年5月,新式武警车牌与军用车牌正式启用,新式武警车牌的第二个字符 块将原来的小写数字改成汉字(例如:WJ01. 12345改成WJ京.12345)。军用车牌的第一个 字符由原来的汉字改成字母(例如:海A. 12345改成HA. 12345)。因此,第一个字符包含了 31个汉字和10个字母(即由原来7个军区汉字简称以及"军"、"海"、"空"组成的10个汉 字变成10个字母简称)。
[0007] (4)在车牌中第二个字符位置一般为26个字母。
[0008] (5)蓝底车牌与黑底车牌的第三个字符到第七个字符一般为数字与字母,其中,黑 牌的第七个字符还包含了领馆车的"领"与港澳台车牌的"港澳台"。黄底车牌与白底车牌 的第三个与第四个字符为数字与字母,第五个与第七个字符一般为数字,其中黄底车牌的 第七个字符还包含教练汽车号牌和摩托车号牌的机动车登记编号中使用汉字简称"学"字, 挂车号牌的机动车登记编号中使用汉字简称"挂"字,试验车的临时行驶车号牌的机动车登 记编号中使用汉字简称"试"字,以及特型车的临时行驶车号牌的机动车登记编号中使用汉 字简称"超"字等;白底车牌的第七个字符还包含警用车牌的"警"字。
[0009] (6)我国车牌上还存在一些字符结构特征比较相似的字符(如阿拉伯数字"2"与 英文字母"Z"、"8"和"B"、"5"和"S"、"0"和"Q"等)这些特征都会给车牌字符识别带来 困扰,其通常被称为"易混字符"。
[0010] 正因为我国车牌的这种特殊性,使得我国车牌的识别与国外相比更具挑战性。国 内许多学者针对我国车牌的特点提出了很多有效的车牌识别方法。现有技术中车牌识别方 法主要分为三大类:基于模板匹配、特征统计匹配与基于分类器的字符识别。 toon] 模板匹配算法结构设计简单,易于实现,但识别结果受分割出的二值图像质量的 影响,如果字符倾斜、断裂、模糊或是光照不均等,均会造成字符识别错误;字符的统计特征 算法本身比较复杂,将字符点矩阵看作是一个整体,根据每个字符的笔画特征点不同,将字 符分解为横、坚、撇、捺等一种或几种的组合,经过统计从而得到相应的特征,在实际的应用 中,由于外部原因造成的字符模糊、倾斜等情况,导致了部分字符无法正确识别;机器学习 受这些影响较小,但其本身结构复杂,对字符的特征提取方法要求较高,样本选取困难,且 训练速度慢,难于收敛,所以这三类方法各有利弊。

【发明内容】

[0012] 针对上述提到的现有技术中的车牌识别方法各自存在的弊端,本发明针对我国车 牌特征以及字符特征,采用不同的识别方法来提高其识别效果。首先,我国车牌拥有蓝底、 黑底、白底与黄底四种类型,根据不同的车牌颜色以及我国车牌的编号特征进行模板库的 分类,分别建立汉字模板库、数字字母模板库、数字模板库以及字母模板库等。其次,车牌中 的汉字常常出现粘连、模糊不清、缺失等情况,本发明采用多模板互信息匹配,能很好解决 其问题。对于字母与数字的识别,如果同样采用多模板互信息匹配,则大大增加了其计算复 杂度。在实际应用中,字母与数字比汉字更加清晰完整,但字母与数字拥有很多的相似字 符,仅采用互信息匹配已无法满足易混字符(即相似字符,如〇与D)的判别,所以本发明对 字母与数字采用单模板互信息匹配与易混字特征提取的方法进行判别。这样将模板分成不 同的库以及不同的字符采用不同的识别方案,不仅大大提高了速度,又提高了正确识别率, 真正解决了实际应用场景的技术问题。
[0013] 本发明解决其技术问题采用的技术方案是:一种基于互信息与特征提取的车牌识 别方法,该车牌识别方法包括下述步骤:
[0014] 步骤S1 :第一个字符识别,如果是白牌,则判断是否为警用车牌,如果是警用车 牌,则同黄牌、黑牌与蓝牌一样选用32个汉字多模板库,进行多模板互信息匹配,不是警用 车牌,则选择军用车牌的10个单模板字母库,采用互信息单模板匹配与易混字特征提取;
[0015] 步骤S2 :第二个字符识别,选择26个字母的单模板库,采用互信息单模板匹配与 易混字特征提取方法;
[0016] 步骤S3 :第三个字符与第四个字符识别,选用24个字母与10个数字的单模板库, 进行互信息单模板匹配与易混字特征提取。
[0017] 步骤S4 :第五个字符与第六个字符识别,如果为蓝牌与黑牌,则选用24个字母与 10个数字的单模板库,如果是黄牌与白牌,则选用10个数字的单模板库,同样采用互信息 单模板匹配与易混字特征提取;
[0018] 步骤S5 :第七个字符识别,如果是蓝牌,则选用24个字母与10个数字的单模板 库,如果是黄牌,则选择10个数字的单模板与3个汉字多模板库,如果是黑牌,则选择10个 数字与24个字母的单模板库与"港澳台领"的多模板库,同样采用互信息与易混字特征提 取方法。
[0019] 本发明解决其技术问题采用的技术方案进一步还包括:
[0020] 所述的步骤S1中所述的多模板互信息匹配识别一个待识别字符,其主要步骤如 下:
[0021] a.首先计算待识别字符与字符库中每个模板的互信息,并求得最大互信息;
[0022] b.互信息计算公式为:I(A,B) = H(A)+H⑶-H(AB),其中,Η =,对于输入的二值图像I (X,y),其熵可得,Η⑷ =_(pA(0) log2pA(0)+pA⑴log2pA(l)),同理,模板库中第i个模板的熵为:Η⑴=- (Pi (0) log2Pl (0) +Pl (1) log2Pl (1)),则可得待识别字符与第i个模板互信息为:Η (A,i) = - (pA, i (0) 1呢逆^(0)+?^(1)1呢逆^(1)),其中,?^(0)表示待识别字符与模板字符像素点都为0的 概率;
[0023] c.将待识别字符判为互信息最大的模板所属的那一类。
[0024] 所述的步骤S1中所述的单模板互信息与易混字特征提取方法的主要步骤包括:
[0025] 1)对待识别字符进行单模板互信息识别,每个字符只对应一个模板;
[0026] 2)如果经过单模板互信息匹配判别的字符属于易混字符,则进行易混字符特征提 取判别,并输出判别结果;如果不属于易混字符,则输出单模板互信息的判别结果。
[0027] 所述的易混字符的特征提取判别方法实现步骤如下:首先,根据单模板互信息匹 配判别的结果,进行不同的特征提取,然后将其特征与模板库对应的特征求欧氏距离,将其 判为欧氏距离最小的那一类。
[0028] 所述的特征提取的统计特征包括:①中间部分的白像素和,基于32*16大小的字 符模板,其区域范围为:左上坐标为(6, 10),右下坐标为(10, 20);②右下角部分的白像素 和,基于32*16大小的字符模板,其区域范围为:左上坐标为(10, 16),右下坐标为(16, 32); ③下半部分白像素和,基于32*16大小的字符模板,其区域范围为:左上坐标为(1,16),右 下坐
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1