一种基于模板匹配的字符识别方法

文档序号：6366385阅读：353来源：国知局

专利名称：一种基于模板匹配的字符识别方法
技术领域：
本发明属于模式识别与图像处理技术领域，具体涉及模板匹配识别，本方法用于对图像中的字符进行识别，从而将图像信息转化为文字信息。
背景技术：
字符识别是许多智能系统的关键组成部分。例如在车牌识别系统中，字符识别是最后一步。字符识别属于模式识别范畴，现有的模式识别在理论、方法与实践方法的成果，为字符识别提供了丰富的解决方法。
从统计模式识别的观点来看，字符的识别实际上一个模式分类的问题。国内外学者提出了许多不同的识别方案，大致可分为基于分类器的识别方法和基于模式/模板匹配的方法。从公开的论文来看，利用分类器进行识别的方法可以获得较好的识别结果。例如有 D. Llorens 等人提出的 “Car License Plates Extraction and Recognition Based onConnected Components Analysis and HMM Decoding”。但是分类器的方法需要大量的学习样本进行训练。同时，像ANN这样的分类算法存在收敛性和过学习的问题。模板匹配算法适用于没有旋转角的固定大小的单字符识别。通常采用的是对二值图像进行匹配。P. Comelli 等人在文献“Optical recognition of motor vehicle licenseplates. ”中提出了模板匹配在字符识别中的应用。从实时性、算法复杂性等角度考虑，模板匹配算法能够满足字符识别的任务。但是模板匹配也有其缺陷，即对同一类字符在不同图像中的尺度多变性以及光照多变性敏感，容易产生匹配偏差，因此，需要加入特殊处理手段。这也是在本发明中，着重解决的问题。

发明内容
针对现有技术存在的上述问题，本发明提出一种基于模板匹配的字符识别方法，该方法在传统的模板匹配算法基础上，加入多尺度和位移变换，以解决实际场景中存在的字符多样性问题。为了实现上述目标，本发明采用了如下技术手段一种基于模板匹配的字符识别方法，其特征在于，该方法包括下述步骤(I)获取待识别的单个字符图像；(2)首先获取待识别的字符图像中字符的原始尺度，并在原始尺度的基础上分别增加和减少F个像素作为两个新的尺度，分别以原始尺度和两个新的尺度在原始图像中截取包含字符的子图像，得到三个子图像；F的取值范围为I 3 ;(3)对步骤(2)得到的三个子图像进行二值化；(4)对步骤(3)中得到的二值化处理后的图像进行归一化，得到字符的三幅二值图像；(5)将步骤(4)中得到的归一化后的同一字符的三幅二值图像分别与模板库中的每一个标准模板字符图像进行模板匹配，得到相关系数值；(6)将步骤(5)中得到27个相关系数值按大小进行排序，选择最大的相关系数值对应的标准模板字符图像，以该标准模板字符图像所对应的字符类别作为待识别字符图像的字符类别，完成识别过程。在实际应用中，本发明具有如下有益效果I、本发明采用的模板匹配方法，通过计算待识别字符与标准模板字符图像之间的相关系数值来度量它们的相似程度。相对于利用分类器识别的方法，不需要采集大量的字符样本，同时对不同的字符有较好的适应性；2、本发明的字符识别方法中，采用多尺度和多位移的模板匹配，相对于传统的模板匹配，克服了字符的尺度和位置的多样性带来的匹配误差，对实际场景的复杂性较为鲁棒;3、本发明的字符识别方法中，采用了局部OTSU阈值分割，相对于传统的全局OTSU阈值分割，能够较完整地提取字符区域，从而可以得到更为准确的相关系数值；4、本发明的字符识别方法，由于采用了模板匹配的算法，因而实时性较好，能应用于对实时性要求较高的工程项目中。

图I是本发明方法的流程示意图；图2是字符上下文尺度推断流程图；图3是局部OTSU分割子区域选取；图4是全局OTSU分割与局部OTSU分割结果对比；图5是本发明方法流程图。
具体实施例方式如图I所示，本发明方法首先要构建模板库，其过程为根据待识别字符的类型，采集一批已知类别的字符图像，将它们二值化，并具有同样大小的尺度，作为标准模板字符图像，标准模板字符的字体与待识别字符的字体相同。如果待识别字符为印刷体，相应地，采集的字符也为标准的印刷体字符图像；如果待识别字符为手写体，则采集已知字符类别的手写体字符图像作为标准模板字符图像。标准模板字符图像构成模板库，模板库中标准模板字符图像个数由待识别字符本身可能包含的字符数决定，如待识别字符为英文字母，模板库为26个字母。模板库可以根据需要不断更新。本发明提供的基于模板匹配的字符识别方法，其过程为(I)获取待识别的字符图像输入一幅图像，提取出图像中的字符区域，得到若干个独立的单个字符图像。这里约定下文中提到的字符是指字符区域，而字符图像指的是仅包含字符区域的图像。(2)图像尺度变换在实际场景中获取到的图像中的字符角度、距离以及所处的天气、光照条件存在差异。虽然可以通过尺度归一化将待识别字符大小变换到标准模板字符图像的大小，但是字符的笔画粗细却是不尽相同，因此用一个固定的尺度去获取不同的字符显然是不可靠的。故而引入多尺度匹配，即对同一幅字符图像，获得其多个尺度下的图像副本。首先获得待识别的字符图像中字符的原始尺度。如果识别单个字符，则字符的原始尺度等同于输入的字符图像的大小。如果识别一组连续排列的字符串中的每个字符(这种情况更为常见)，则根据先验知识和字符间的上下文关系得到的一组字符尺度数值进行推断，得到一个最佳的“原始尺度”。具体的处理过程如下所述。 I)筛选可能的字符区域。对图像进行二值化，然后对二值图像进行标记，得到若干连通域。定义连通域的高度和宽度为该连通域的外接矩形的高度和宽度。如果连通域的高度与该字符图像的高度之差小于等于Clis1,宽度之差小于dis2，这里的Clis1的范围在(0，2]之间、Clis2的范围在(0，4]之间，满足以上条件的连通域才有可能是字符，则该连通域作为候选连通域。2)寻找最优高度和宽度统计所有候选的连通域的各个高度值出现的次数，然后按高度值的大小顺序，将每个连通域的高度值出现的次数和它前后相邻的高度值出现的次数进行累加，得到一组新的计数值，取计数值最大者所对应的连通域的高度作为最优高度。然后根据该最优高度值对应的连通域，确定最优宽度。举例说明从(I)中筛选出7个连续字符，高度分别为{15，16，17，19，21，22，22}，则按上述处理统计高度累加值为{2，3，3，3，4，3}，可以看出高度为21的累加次数为最大值4，因此21为最优高度；3)判断每个字符是否需要调整。对待识别的字符图像进行二值分割及标记，获取字符的连通域，将该连通域的面积最大的外接矩形的高度与上述最优高度进行比较，如果该连通域的面积最大的外接矩形的高度与上述最优高度相等，再将该连通域的面积最大的外接矩形的宽高比与上述最优宽高比进行比较，如果仍然相等，则将该连通域的面积最大的外接矩形的高度和宽度作为待识别的字符图像的高度和宽度，否则将待识别的字符图像的高度及宽度值调整为最优高度及最优宽度；最优宽高比是指最优宽度与最优高度之比。由于字符“ I”的外接矩形宽度比其他字符的宽度要短，因此字符“ I”不受该条件约束。上述流程如图2所示。当确定了“原始尺度”之后，在基础上分别增加和减少I到3个像素(经验值为I像素)作为两个新的尺度。以这三个尺度在原始图像中截取包含字符的子图像。(3)图像二值化由于我们事先准备好的标准模板字符图像是二值图像，因此需要对待识别字符图像进行二值分割。采用OTSU分割作为对图像进行二值化的算法，其原理是以最佳门限将图像灰度直方图分割成两部分，使两部分类间方差取最大值，即分离性最大。具体计算过程如下所述设图像最大灰度值为M，第i级灰度的像素点数目为叫，总像素# = YjUi，则第i级
i=l
灰度出现的概率为Pi =叫/N。类间方差为o2(k)= [μ · ω (k) - μ (k)) ]2/ { ω (k) · (1-ω (k))}其中，ke [O,Μ]为图像的灰度级范围， = 乃为灰度级低于k的部分所占的
i=0比例
权利要求
1.一种基于模板匹配的字符识别方法，其特征在于，该方法包括下述步骤 (1)获取待识别的单个字符图像； (2)首先获取待识别的字符图像中字符的原始尺度，并在原始尺度的基础上分別増加和減少F个像素作为两个新的尺度，分别以原始尺度和两个新的尺度在原始图像中截取包含字符的子图像，得到三个子图像；F的取值范围为I 3 ; (3)对步骤⑵得到的三个子图像进行ニ值化； (4)对步骤(3)中得到的ニ值化处理后的图像进行归ー化，得到字符的三幅ニ值图像； (5)将步骤(4)中得到的归ー化后的同一字符的三幅ニ值图像分别与模板库中的每ー个标准模板字符图像进行模板匹配，得到相关系数值； (6)将步骤(5)中得到27个相关系数值按大小进行排序，选择最大的相关系数值对应的标准模板字符图像，以该标准模板字符图像所对应的字符类别作为待识别字符图像的字符类别，完成识别过程。
2.根据权利要求I所述的基于模板匹配的字符识别方法，其特征在于，步骤(5)中的模板库的构建过程为根据待识别字符的类型，采集已知类别的字符图像，将它们ニ值化，并具有同样大小的尺度，作为标准模板字符图像，标准模板字符的字体与待识别字符的字体相同，所有的标准模板字符图像构成模板库。
3.根据权利要求I所述的基于模板匹配的字符识别方法，其特征在于，步骤(2)获取待识别的字符图像中字符的原始尺度的过程为如果待识别的字符图像中只有单个字符，则字符的原始尺度等同于输入的字符图像的大小；如果识别一组连续排列的字符串中的每个字符，则根据先验知识和字符间的上下文关系得到的一组字符尺度数值进行推断，得到一个最佳的原始尺度。
4.根据权利要求3所述的基于模板匹配的字符识别方法，其特征在干，如果识别ー组连续排列的字符串中的每个字符，获取待识别的字符图像中字符的原始尺度的具体过程如下 (4. I)筛选可能的字符区域对待识别的字符图像进行ニ值化，然后对ニ值图像进行标记，得到若干连通域，定义连通域的高度和宽度为该连通域的外接矩形的高度和宽度，如果连通域的高度与该字符图像的高度之差小于等于diSl，且宽度之差小于dis2，由该连通域才有可能是字符，则该连通域作为候选连通域；其中diSl的取值范围在(O，2]之间、Clis2的取值范围在(O，4]之间； (4. 2)寻找最优高度和宽度统计所有候选的连通域的各个高度值出现的次数，然后按高度值的大小顺序，将每个连通域的高度值出现的次数和它前后相邻的高度值出现的次数进行累加，得到ー组新的计数值，取计数值最大者所对应的连通域的高度作为最优高度；然后根据该最优高度值对应的连通域，确定最优宽度； (4. 3)判断每个字符是否需要调整对待识别的字符图像进行ニ值分割及标记，获取字符的连通域，将该连通域的面积最大的外接矩形的高度与上述最优高度进行比较，如果该连通域的面积最大的外接矩形的高度与上述最优高度相等，再将该连通域的面积最大的外接矩形的宽高比与上述最优宽高比进行比较，如果仍然相等，则将该连通域的面积最大的外接矩形的高度和宽度作为待识别的字符图像的高度和宽度，否则将待识别的字符图像的高度及宽度值调整为最优高度及最优宽度，由此得到待识别的字符图像中字符的原始尺度；所述最优宽高比是指最优宽度与最优高度之比。
5.根据权利要求I所述的基于模板匹配的字符识别方法，其特征在于，步骤(3)对三个子图像进行ニ值化的具体过程为在待识别的字符图像的行和列上分別取起始坐标( , y0)和終止坐标(X1, yi)，获得包含字符区域的局部图像，计算该局部图像的OTSU阈值，作为待识别的字符图像的ニ值分割门限，再利用该ニ值分割门限对待识别的字符图像进行ニ值化；设定Xtl值的大小为待识别的字符图像高度的1/4，X1值得大小为待识别的字符图像高度值的3/4 ；y0的取值范围为0 待识别的字符图像宽度的l/8，yi的取值范围为待识别的字符图像宽度的7/8 待识别的字符图像宽度。
6.根据权利要求I所述的基于模板匹配的字符识别方法，其特征在于，步骤(4)按照下述过程进行归一化经过步骤(3)中对图像ニ值化后，得到同一字符的三幅ニ值图像，然后，采用线性插值方法对这三幅ニ值图像进行尺度缩放，分别将它们的大小归ー化至标准模板字符图像的尺度。
7.根据权利要求I所述的基于模板匹配的字符识别方法，其特征在于，步骤(5)按照下述过程进行模板匹配将标准模板字符图像分别在这三幅待识别字符图像上在水平方向、垂直方向和对角线方向上以I像素的位移量滑动，一共平移9个位置，对平移过程中标准模板字符图像与待识别字符图像的重叠区域分别进行模板匹配，计算它们的相关系数，一共产生27个相关系数的值；相关系数值R(x，y)作为模板匹配的度量值，其计算公式为
全文摘要
一种基于模板匹配的字符识别方法，属于模式识别与图像处理技术领域，具体涉及图像匹配及识别，本方法可以对字符图像进行识别。目的是开发一种简单快速有效的字符识别方法，从而能够获取图像中的字符信息。本发明主要包含如下几个处理单元图像尺度变换、图像二值化、图像归一化、模板匹配及字符判别。在整个处理过程中，对OTSU分割、图像缩放、上下文信息、模板匹配等方法进行了综合的应用。本发明可以(但不限于)应用于实时的车牌识别系统中的字符识别模块。
文档编号G06K9/00GK102663377SQ20121006786
公开日2012年9月12日申请日期2012年3月15日优先权日2012年3月15日
发明者党小迪, 唐为林, 宋萌萌, 朱秀峰, 李驰, 桑农, 江曼, 王军, 王岳环申请人:华中科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王岳环;唐为林;桑农;李驰;朱秀峰;宋萌萌;江曼;党小迪;王军
技术所有人：华中科技大学
我是此专利的发明人

上一篇：移动设备的界面布局方法及装置的制作方法
上一篇：发电调度多Agent的可视化系统及其可视化方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。