一种基于决策树和svm的车牌相似字符识别方法
【专利摘要】本发明提供了一种基于决策树和SVM的车牌相似字符识别方法及其在车牌识别系统中的应用。首先按位置将车牌字符分为三类,即中文、字母、字母数字,构建决策树的第一层决策结点,其次,按字符相似程度分为九类,即0DQ、2Z、4A、5S、7T、8B、CG、EF、非相似字符,构建决策树的第二层决策结点,再次将0DQ分为二类,即0D、Q,构建决策树的第三层结点,最后每个决策结点采用不同的特征并结合线性SVM训练决策模型。该方法有效的解决了车牌识别系统中,相似字符识别容易出错的问题,大大提高了车牌识别系统的准确性和稳定性。
【专利说明】-种基于决策树和SVM的车牌相似字符识别方法
【技术领域】
[0001] 本发明属于计算机视觉领域,特别涉及一种基于决策树和SVM的车牌相似字符识 别方法,及该方法在车牌识别系统中的应用。 技术背景
[0002] 随着基于计算机视觉技术的车牌识别算法的日益成熟,车牌识别的应用场景也越 来越广泛,包括各种停车场、卡口、电子警察、甚至街道小区的监控设备,如果对这些场景进 行布控,那么公安便能更好地掌握肇事车辆的轨迹,为破案提供了极大的便利。当然,这对 车牌识别的准确率和鲁棒性也提出了极高的要求,要求车牌识别技术能在不同的场景下保 持高的准确率。
[0003] 传统的字符识别方法采用模板匹配结合相似字符局部特征,用相似字符之间的细 微差异来区分相似字符,如〇、D之间仅左上角、左下角部分特征不同,8和B之间仅左半部 分特征不同,这种方法很直观,容易理解,但在实际应用中这种方法效果并不理想,因为现 实场景中,由于拍摄角度、光照、牌照印刷质量、字符切分等原因,导致这种细微差别变得非 常不明显。
[0004] 针对传统车牌识别技术中字符识别模块在拍摄角度较大、光照较差、牌照不清晰 等情况下,对相似字符识别率不高,本发明设计了一种基于决策树和SVM的车牌相似字符 识别方法,该方法能极大地提高相似字符识别的精度,从而保证整个车牌识别系统的准确 率。
【发明内容】
[0005] 本发明的目的是为了解决传统车牌识别技术中字符识别模块在拍摄角度较大、光 照较差、牌照不清楚、图像分辨率较低等情况下,相似字符识别容易出错的缺陷。本发明内 容如下:
[0006] 基于决策树和SVM的车牌相似字符识别方法,技术特征如下:
[0007] (1)、按照车牌位置分为三组,第一个字符中文(粤、湘、赣等)、第二个字符字母 (A?Z)、第三到七个字符字母和数字的组合(0?9、A?Z),构建第一层决策树。
[0008] (2)、按照字符相似程度分为八类,S卩0DQ、2Z、4A、5S、7T、8B、CG、EF,构建第二层决 策树。
[0009] (3)、将0DQ分为二类,即0D、Q,构建第三层决策树,以进一步提高0DQ的识别率。 [0010] (4)、对于第一层决策树,采用H0G特征结合线性SVM训练三个决策模型,即汉字模 型、字母模型和字母数字模型。对于第二层决策树,〇DQ、4A采用Gabor特征并用PCA降维, 2Z、5S、7T取图像上半部分,提取分块梯度方向特征,8B取图像左半部分,提取分块灰度统 计特征,CG取图像下半部分,提取分块灰度统计特征,EF提取图像下1/3部分,提取灰度特 征,全部采用线性SVM训练八个决策模型。对于第三层决策树,0D取左上1/3和左下1/3图 像提取分块灰度统计与梯度加权特征,并采用线性SVM训练1个决策模型。
[0011] (5)、分块梯度特征:首先将字符图像归一化到40X20(宽40、高20)大小,然后按 5 X 5的大小分块,即共分成8 X 4 = 32块,用sobel算子对每个小块分别计算水平梯度和垂 直梯度,并统计8个方向的梯度个数,即组成32X8 = 256维向量,作为该字符的特征。
[0012] ¢)、分块灰度统计特征:首先将字符图像归一化到40X20(宽40、高20)大小,然 后按5 X 5的大小分块,即共分成8 X 4 = 32块,计算每个子块的灰度直方图(8个bin),即 组成32X8 = 256维向量,作为该字符的特征。
【专利附图】
【附图说明】
[0013] 图1是本发明的基本流程图;
[0014] 图2是本发明的分块梯度特征提取流程图;
[0015] 图3是本发明的分块灰度统计特征提取流程图;
【具体实施方式】
[0016] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0017] 基于决策树和SVM的车牌字符识别【具体实施方式】如下:
[0018] 相似字符建模过程:
[0019] 1、第一层决策树:按照车牌字符位置,设置三个节点。第一个节点为中文字符 (粤、湘、赣等),用于构建汉字字符模型;第二个节点为字母(A?Z),用于构建字母模型; 第三个节点为字母与数字的组合(〇?9、A?Z),用于构建数字字母模型;本发明采用H0G 特征结合线性SVM作为各个节点的分类器。HOG特征的方向梯度信息能够非常好地区分不 同的字符,并且该特征具有较高的维数,对于类别数量较多的情况,该特征具有较好地表达 能力。线性支持向量机具有非常好地泛化能力,本发明采用一对一投票方式,进行多类别的 识别,并采用交叉验证技术获取最好的参数(惩罚因子),有效地保证了第一层各节点的识 别精度。
[0020] 2、第二层决策树:按照车牌字符相似程序,设置八个节点。第一个节点为0DQ,采 用Gabor特征并结合PCA降维,第二个节点为2Z,取图像上半部分,提取分块梯度特征,第三 个节点为4A,采用Gabor特征并结合PCA降维,第四个节点为5S,取图像上半部分,提取分 块梯度特征,第五个节点为7T,取图像上半部分,提取分块梯度特征,第六个节点为8B,取 图像左半部分,提取分块灰度统计特征,第七个节点为CG,取图像下半部分,提取分块灰度 统计特征,第八个节点为EF,取图像下1/3部分,提取灰度特征。为了保证泛化性,所有节点 均采用线性支持向量机进行训练,采用交叉验证技术获取最好的参数(惩罚因子)。
[0021] 3、第三层决策树,按照字符相似程度,设置一个节点。即0D,取左上1/3和左下1/3 图像提取分块灰度统计与梯度加权特征,为了保证泛化性,该节点采用线性支持向量机进 行训练,采用交叉验证技术获取最好的参数(惩罚因子)。
[0022] 字符特征的提取过程:
[0023] 1、分块梯度特征:首先将字符图像归一化到40X20(宽40、高20)大小,然后按 5 X 5的大小分块,即共分成8 X 4 = 32块,用sobel算子对每个小块分别计算水平梯度和垂 直梯度,并统计8个方向的梯度个数,即组成32X8 = 256维向量,作为该字符的特征。
[0024] 2、分块灰度统计特征:首先将字符图像归一化到40X20(宽40、高20)大小,然后 按5X5的大小分块,即共分成8X4 = 32块,计算每个子块的灰度直方图(8个bin),即组 成32X8 = 256维向量,作为该字符的特征。
[0025] 相似字符识别过程:
[0026] 输入字符图像,灰度化,根据字符位置及是否是相似字符,提取不同的特征,输入 到训练好的决策树+支持向量机模型中,得到识别结果。
[0027] 与传统的模板匹配结合字符局部特征的方法相比,本发明提供的基于决策树和 SVM的车牌相似字符识别方法具有更好的泛化性与鲁棒性,经过决策树的层层决策,即使对 于模糊、倾斜的字符也具有很好的识别能力。
【权利要求】
1. 一种基于决策树和SVM的车牌相似字符识别方法,其特征在于利用车牌字符结构和 字符特征构建多层决策树,以达到减少同一模型中字符类别数,提高整体识别率的目的;其 特征在于不同相似字符组,采用不同的特征并结合线性SVM训练决策模型,以达到提高相 似字符识别率,减少识别时间的目的。
2. 根据权利要求1所述的方法,其特征在于按照车牌位置分为三组,第一个字符中文 (粤、湘、赣等)、第二个字符字母(A?Z)、第三到七个字符字母和数字的组合(0?9、A? Z),构建第一层决策树。
3. 根据权利要求1所述的方法,其特征在于按照字符相似程度分为八类,即0DQ、2Z、 4A、5S、7T、8B、CG、EF,构建第二层决策树。
4. 根据权利要求1所述的方法,其特征在于将0DQ分为二类,即0D、Q,构建第三层决策 树,以进一步提商0DQ的识别率。
5. 根据权利要求1所述的方法,其特征在于对于第一层决策树,采用HOG特征结合线性 SVM训练三个决策模型,即汉字模型、字母模型和字母数字模型;对于第二层决策树,0DQ、 4A采用Gabor特征并用PCA降维,2Z、5S、7T取图像上半部分,提取分块梯度方向特征,8B取 图像左半部分,提取分块灰度统计特征,CG取图像下半部分,提取分块灰度统计特征,EF提 取图像下1/3部分,提取灰度特征,全部采用线性SVM训练八个决策模型;对于第三层决策 树,0D取左上1/3和左下1/3图像提取分块灰度统计与梯度加权特征,并采用线性SVM训练 1个决策模型。
【文档编号】G06K9/00GK104156701SQ201410366528
【公开日】2014年11月19日 申请日期:2014年7月26日 优先权日:2014年7月26日
【发明者】吴志伟, 冯琰一, 张少文 申请人:佳都新太科技股份有限公司