一种相似字符的识别方法及系统与流程

文档序号：11520274阅读：258来源：国知局

本发明实施例涉及图像识别技术领域，尤其涉及一种相似字符的识别方法及系统。

背景技术：

纸币作为流通币，在人们的日常生活中起着举足轻重的作用。为了方便统一管理以及防止假钞的流通，每张纸币都印制了独一无二的编号，即冠字号。纸币的冠字号一般由数字0-9以及字母a-z组合而成。

现在的存取款机以及验钞机一般都可以识别冠字号，在冠字号识别处理中，字符特征的提取非常重要，但是相似字符(例如1和i)的特征相似度极高，使得相似字符的识别难度增加。现有的相似字符的识别方案有采用模板匹配算法进行识别的，还有采用固定行和固定列提取相似字符图像的特征区域的方法进行识别的；其中，所述采用模板匹配算法进行相似字符识别的方案存在时间复杂度较高的缺陷；所述采用固定行和固定列提取相似字符图像的特征区域进行识别的方法存在算法不利于维护和优化的缺陷，尤其当图像出现的位置发生改变或者图像中有噪声的情况下，不利于特征区域的提取。

综上所述，现有的相似字符的识别方案存在识别率不高的问题。

技术实现要素：

本发明实施例提供了一种相似字符的识别方法及系统，以提高相似字符的识别准确度。

第一方面，本发明实施例提供了一种相似字符的识别方法，该方法包括：

获取待识别字符图像；

对所述待识别字符图像进行识别，得到初步识别结果；

判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组；

若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别；

若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别。

进一步地，所述预设的第一相似字符组包括：i、1、z和2；

所述若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别，包括：

沿第一设定方向，将所述待识别字符图像平均分成上、中和下三块；

计算所述上块图像每列的像素点数之和；

计算所述上块图像每行的像素点数之和；

将所述每列的像素点数之和以及所述每行的像素点数之和与预设的列像素点数模板以及行像素点数模板进行比对，确定所述字符为i、1、z或2。

进一步地，所述预设的第二相似字符组包括：b、8、d、o和0；

所述若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别，包括：

沿第二设定方向，将所述待识别字符图像平均分成左、右两块；

使用hough变换直线检测方法检测所述左块图像的左边界是否为直线，并计算直线的长度；

若所述左块图像的左边界为直线且直线的长度达到设定阈值，则识别所述字符为b或者d。

进一步地，使用hough变换直线检测方法检测所述左块图像的左边界是否为直线之前，还包括：设置所述hough变换直线检测算法中直线的角度为90°。

进一步地，所述待识别字符图像为归一化后的二值化字符图像。

第二方面，本发明实施例还提供了一种相似字符的识别系统，该系统包括：

获取模块，用于获取待识别字符图像；

初步识别模块，用于对所述待识别字符图像进行识别，得到初步识别结果；

判断模块，用于判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组；

二次识别模块，用于若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别；若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别。

进一步地，所述预设的第一相似字符组包括：i、1、z和2；

所述二次识别模块具体包括：

第一图像分块单元，用于沿第一设定方向，将所述待识别字符图像平均分成上、中和下三块；

第一计算单元，用于计算所述上块图像每列的像素点数之和；

第二计算单元，用于计算所述上块图像每行的像素点数之和；

比对单元，用于将所述每列的像素点数之和以及所述每行的像素点数之和与预设的列像素点数模板以及行像素点数模板进行比对，确定所述字符为i、1、z或2。

进一步地，所述预设的第二相似字符组包括：b、8、d、o和0；

所述二次识别模块具体包括：

第二图像分块单元，用于沿第二设定方向，将所述待识别字符图像平均分成左、右两块；

检测单元，用于使用hough变换直线检测方法检测所述左块图像的左边界是否为直线，并计算直线的长度；

识别单元，用于若所述左块图像的左边界为直线且直线的长度达到设定阈值，则识别所述字符为b或者d。

进一步地，使用hough变换直线检测方法检测所述左块图像的左边界是否为直线之前，所述检测单元还用于：

设置所述hough变换直线检测算法中直线的角度为90°。

进一步地，所述待识别字符图像为归一化后的二值化字符图像。

本发明实施例提供的一种相似字符的识别方法，通过获取待识别字符图像；并对所述待识别字符图像进行识别，得到初步识别结果；然后判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组；若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别；若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别的技术手段，实现了对相似字符的二次识别，提高了相似字符的识别准确度。

附图说明

图1是本发明实施例一提供的一种相似字符的识别方法流程示意图；

图2是本发明实施例一提供的冠字号的灰度图像；

图3是本发明实施例一提供的冠字号二值化图像；

图4是本发明实施例一提供的归一化后的单个二值化字符图像；

图5是本发明实施例一提供的第一相似字符组的特征差异示意图；

图6是本发明实施例一提供的第二相似字符组的特征差异示意图；

图7是本发明实施例二提供的一种相似字符的识别方法流程示意图；

图8是本发明实施例三提供的一种相似字符的识别方法流程示意图；

图9是本发明实施例四提供的一种相似字符的识别系统结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各项步骤的顺序可以被重新安排。当其步骤完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1为本发明实施例一提供的一种相似字符的识别方法流程图，该方法可适用于对冠字号或者车牌号等包含字母与数字组合的物品进行相似字符识别的情况，可以由相似字符的识别系统来执行。该系统可通过硬件和/或软件的方式实现。该方法具体包括如下步骤：

步骤110、获取待识别字符图像。

其中，所述待识别字符具体可以是纸币上的冠字号，还可以是汽车牌照上的数字或字母；获取待识别字符图像的方式有很多种，本实施例不对其进行限定，例如可以是通过图像采集传感器自动获取待识别字符的图像，还可以是通过扫描仪扫描得到字符图像。

在图像处理领域，为了减少运算量以及方便后续的图像识别，通常情况下，会对获取到的彩色字符图像进行灰度化以及二值化处理。在彩色图像中的每个像素的颜色有r(红)、g(绿)、b(蓝)三个分量决定，而每个分量有255种值可取，这样一个像素点可以有1600多万(255*255*255)种颜色的变化范围。而灰度图像是r、g、b三个分量相同的一种特殊的彩色图像，其一个像素点的变化范围为255种，所以在数字图像处理中，一般先将各种格式的图像转变成灰度图像以使后续图像的计算量变得少一些。灰度图像的描述与彩色图像一样仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。具体可以参见图2所示的冠字号的灰度图像。

图像的二值化处理就是将图像上各种等级的灰度值全部置为0或255，也就是将整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中，二值图像占有非常重要的地位，要进行二值图像的处理与分析，首先要把灰度图像二值化，得到二值化图像，这样子有利于在对图像做进一步处理时，图像的集合性质只与像素值为0或255的点的位置有关，不再涉及像素的多级值，使处理变得简单，而且数据的处理和压缩量小。具体参见图3所示的冠字号二值化图像。

示例性地，步骤110中获取的待识别字符图像具体指归一化后的二值化字符图像，具体参见图4所示的归一化后的单个二值化字符图像。图像归一化是指对图像进行一系列标准的处理变换，使之变换为一固定标准形式的过程。

步骤120、对所述待识别字符图像进行识别，得到初步识别结果。

其中，可以通过预先训练的分类器模型对所述待识别字符图像进行识别，还可以通过神经网络的方法对所述待识别字符图像进行识别；现有技术中成熟的图像识别算法都可以用于本实施例中对所述待识别字符图像进行识别。

步骤130、判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组。

现有的字符识别算法大部分是基于图像的区域特征进行识别的，然而有一些相似字符的区域特征很相似，因此导致相似字符的误识别，例如将z识别为2，将i识别1等。

步骤140、若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别。

示例性地，所述预设的第一相似字符组包括i、1、z和2，这些相似字符明显的特征差异在于字符的最上端，具体参见图5所示的第一相似字符组的特征差异示意图。i的最上端是一水平的横线，而1的最上端是一与水平方向成一定角度的斜线，z的最上端是一接近水平的直线，而2的最上端是弧形的，因此可以利用这些相似字符之间微小的特征差异对相似字符进行二次识别，再次确认字符的识别结果，提高相似字符的识别准确度。

步骤150、若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别。

示例性地，所述预设的第二相似字符组包括b、8、d、o和0，这些相似字符明显的特征差异在于字符的最左端，具体参见图6所示的第二相似字符组的特征差异示意图。b的最左端是一垂直的竖线，而8的最左端是弧形的；d的最左端是一垂直的竖线，而o和0的最左端是弧形的，因此可以利用这些相似字符之间微小的特征差异对相似字符进行二次识别，再次确认字符的识别结果，提高相似字符的识别准确度。

本实施例提供的一种相似字符的识别方法，通过获取待识别字符图像；并对所述待识别字符图像进行识别，得到初步识别结果；然后判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组；若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别；若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别的技术手段，实现了对相似字符的二次识别，提高了相似字符的识别准确度，同时有助于识别算法的后续维护，且该识别算法的时间复杂度较低。

实施例二

图7为本发明实施例二提供的一种相似字符的识别方法流程示意图，在实施例一的基础上，本实施例对所述预设的第一相似字符组进行了具体化，并优化了第一相似字符组的二次识别方案。具体参见图7所示，该方法具体包括如下：

步骤710、获取待识别字符图像。

步骤720、对所述待识别字符图像进行识别，得到初步识别结果。

步骤730、判断所述初步识别结果是否落入预设的第一相似字符组i、1、z和2中，若是，则执行步骤740。

步骤740、沿第一设定方向，将所述待识别字符图像平均分成上、中和下三块。

由于第一相似字符组i、1、z和2中的各字符，明显的特征差异在于字符的最上端，因此，优选地，所述第一设定方向为横向，通过将待识别字符图像的左上角确定为坐标原点，通过建立坐标系将所述待识别字符图像平均分成上、中和下三块，具体可以参见实施例一中图5所示的第一相似字符组的特征差异示意图。

步骤750、计算所述上块图像每列的像素点数之和。

由于i的最上端是一水平的横线，而1的最上端是一与水平方向成一定角度的斜线，z的最上端是一接近水平的直线，而2的最上端是弧形的，因此字符i和1的特征差异以及字符z和2的特征差异可以通过统计上块图像每列的像素点数之和进行区分。例如初步识别结果为字符i，为了验证初步识别结果的准确性，对待识别字符到底是i还是1进行二次识别，例如经统计，待识别字符图像的上块图像每列的像素点数之和为0，5，10，0，通过与预设的列像素点数模板进行比对，可确定所述待识别字符为1，因为1的每列像素点数之和会呈现一个上升的趋势，而i的每列像素点数之和会呈现一个平稳的趋势，例如可以是0，10，10，0。同样的道理，应用于字符z和2的识别，例如，初步识别结果为字符z，通过统计待识别字符上块图像每列的像素点数之和为：0，5，10，5，0，则可以确定所述待识别字符为2，非z，因为z的上块图像每列的像素点数之和呈现一个平稳的趋势，而不是抛物线形。

步骤760、计算所述上块图像每行的像素点数之和。

进一步地，为了提高相似字符的识别准确度，还可以在列投影特征的基础上，结合行投影特征进行进一步确认。例如字符i的上块图像每行的像素点数之和呈现一个尖峰形，例如可以是0，10，0，0；而字符1的上块图像每行的像素点数之和呈现一个脉冲形，例如0，5，5，0。

步骤770、将所述每列的像素点数之和以及所述每行的像素点数之和与预设的列像素点数模板以及行像素点数模板进行比对，确定所述字符为i、1、z或2。

本实施例提供的一种相似字符的识别方法，在上述实施例技术方案的基础上，通过对所述预设的第一相似字符组进行具体化，并结合相似字符的上块图像的行列投影特征，实现了对相似字符i和1以及相似字符z和2进行二次识别，提高了相似字符i和1以及相似字符z和2的识别准确度；同时根据先验知识，通过对相似字符图像进行分块处理，并统计上块图像的行列投影特征，进而基于图像的行列投影特征对相似字符进行二次识别，提高了识别算法的时间复杂度，同时有助于识别算法后续的维护。

实施例三

图8为本发明实施例三提供的一种相似字符的识别方法流程示意图，在上述实施例的基础上，本实施例所述预设的第二相似字符组进行了具体化，并优化了第二相似字符组的二次识别方案，具体参见图8所示，该方法具体如下：

步骤810、获取待识别字符图像。

步骤820、对所述待识别字符图像进行识别，得到初步识别结果。

步骤830、判断所述初步识别结果是否落入预设的第二相似字符组b、8、d、o和0中，若是，则执行步骤840。

步骤840、沿第二设定方向，将所述待识别字符图像平均分成左和右两块。

因为字符b的最左端是一垂直的竖线，而字符8的最左端是弧形的；字符d的最左端是一垂直的竖线，而字符o和0的最左端是弧形的，因此相似字符b和8以及相似字符d、o和0明显的特征差异在于字符的最左端，因此，优选地，所述第二设定方向为纵向，通过将待识别字符图像的左上角确定为坐标原点，通过建立坐标系将所述待识别字符图像平均分成左和右两块，具体可以参见实施例一中图6所示的第二相似字符组的特征差异示意图。例如，初次识别结果为8，通过对字符图像左块的图像特征进行二次识别，确定所述待识别字符倒是8还是b；如果初次识别的结果是d，同样进行二次识别，确定所述待识别字符倒是d还是0或者o，提高了相似字符的识别准确度。

步骤850、使用hough变换直线检测方法检测所述左块图像的左边界是否为直线，并计算直线的长度。

进一步地，使用hough变换直线检测方法检测所述左块图像的左边界是否为直线之前，还包括：设置所述hough变换直线检测算法中直线的角度为90°。由先验知识可知，在本实施例中使用hough变换直线检测方法检测的是垂直的直线，因此可以直接设置hough变换直线检测算法中直线的角度为90°，而不用去设定一个角度范围，让hough变换直线检测算法自行找到合适的角度，进而提高算法的运算效率。

步骤860、若所述左块图像的左边界为直线且直线的长度达到设定阈值，则识别所述字符为b或者d。

本实施例提供的一种相似字符的识别方法，在上述实施例技术方案的基础上，通过对所述预设的第二相似字符组进行具体化，根据先验知识结合相似字符的左块图像的特征区域，通过hough变换直线检测方法检测所述左块图像的左边界是否为直线，并计算直线的长度，进而确定所述待识别字符为b还是8，为d还是o或0，提高了相似字符b和8以及相似字符d、o和0的识别准确度，同时有助于识别算法的后续维护，且该识别算法的时间复杂度较低，简单易于实现。

实施例四

图9为本发明实施例四提供的一种相似字符的识别系统的结构示意图，具体参见图9所示，该系统具体包括如下：

获取模块910、初步识别模块920、判断模块930和二次识别模块940；

其中，获取模块910，用于获取待识别字符图像；初步识别模块920，用于对所述待识别字符图像进行识别，得到初步识别结果；判断模块930，用于判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组；二次识别模块940，用于若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别；若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别。

进一步地，所述预设的第一相似字符组包括：i、1、z和2；

二次识别模块940具体包括：

第一图像分块单元，用于沿第一设定方向，将所述待识别字符图像平均分成上、中和下三块；

第一计算单元，用于计算所述上块图像每列的像素点数之和；

第二计算单元，用于计算所述上块图像每行的像素点数之和；

进一步地，所述预设的第二相似字符组包括：b、8、d、o和0；

二次识别模块940具体包括：

第二图像分块单元，用于沿第二设定方向，将所述待识别字符图像平均分成左、右两块；

检测单元，用于使用hough变换直线检测方法检测所述左块图像的左边界是否为直线，并计算直线的长度；

识别单元，用于若所述左块图像的左边界为直线且直线的长度达到设定阈值，则识别所述字符为b或者d。

进一步地，使用hough变换直线检测方法检测所述左块图像的左边界是否为直线之前，所述检测单元还用于：设置所述hough变换直线检测算法中直线的角度为90°。

进一步地，所述待识别字符图像为归一化后的二值化字符图像。

本实施例提供的一种相似字符的识别系统，通过获取待识别字符图像；并对所述待识别字符图像进行识别，得到初步识别结果；然后判断所述初步识别结果是否落入预设的第一相似字符组或者第二相似字符组；若所述初步识别结果落入预设的第一相似字符组，则基于图像的行列投影特征对所述待识别字符图像进行二次识别；若所述初步识别结果落入预设的第二相似字符组，则使用hough变换直线检测方法对所述待识别字符图像进行二次识别的技术手段，实现了对相似字符的二次识别，提高了相似字符的识别准确度，同时有助于识别算法的后续维护，且该识别算法的时间复杂度较低。

上述产品可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的方法。

本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹婧蕾
技术所有人：深圳怡化电脑股份有限公司;深圳市怡化时代科技有限公司;深圳市怡化金融智能研究院
我是此专利的发明人

上一篇：一种实时杆号识别方法与流程
上一篇：一种基于图像特征提取的多特征融合秸秆焚烧火灾检测方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。