一种自动检测票据中字符类型的方法和系统的制作方法

文档序号：10725698阅读：223来源：国知局

一种自动检测票据中字符类型的方法和系统的制作方法
【专利摘要】本发明公开了一种自动检测票据中字符类型的方法和系统，该方法包括：A、获取票据的红外图像、彩色图像；B、二值化处理红外图像和彩色图像，输出对应的二值图像；C、定位二值图像中的字符区域；D、检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。用于对应执行该方法的系统。本发明通过一系列处理将字符提取出来，根据字符的轮廓的参数来进行特性分析，来区分手写体和打印体，判断方法原理简单，便于实现，节约时间和资源，不需要复杂的前期准备，同时提高辨识效率。
【专利说明】
一种自动检测票据中字符类型的方法和系统
技术领域
[0001]本发明涉及一种自动检测票据中字符类型的方法和系统，属于图像识别领域。
【背景技术】
[0002]银行或单位对票据的某些要素单元可以为人工填写也可以为机打，在字符识别中，打印体和手写体的识别方法差别很大，打印体字符的识别方法如果用于手写体字符识另IJ，准确率很差，而手写体字符的识别方法如果用于打印体字符识别也不合适，而且时间复杂度高和浪费资源，同时，银行和单位对写在票据上的笔的材质和颜色也有要求，采用不规范笔填写的必定为手写体，所以手写体字符和打印体字符的区分对于要素填写规范的检测也有很大意义。
[0003]现有技术区分大写金额为印刷体还是手写体。主要抽取了能区分印刷体字符和手写体字符的上下边界弯曲度特征、字符笔划宽度特征、连通域数目特征、横竖笔画特征共4组分类特征，同时构造分类器进行训练和识别来判断支票大写金额为印刷体还是手写体。该方法存在以下不足:(I)适用面窄，其方法仅适用于判断大写金额为印刷体还是手写体；
(2)在分割出大写金额后，判断大写金额为印刷体还是手写体的方法涉及到特征提取、训练，比较复杂，时间复杂度高，浪费资源；(3)在特征提取方面，该方法存在当图像整体颜色较浅时，会使得求出的横竖笔画特征值较小；当支票图像颜色很深时，会使求出的连通域数目特征值较小;容易导致误分类。

【发明内容】

[0004]为了解决上述问题，本发明通过提供一种自动检测票据中字符类型的方法和系统，提高手写和打印字的辨识率。
[0005]本发明采用的技术方案为一种自动检测票据中字符类型的方法，其特征在于，包括以下步骤:A、获取票据的红外图像、彩色图像;B、二值化处理红外图像和彩色图像，输出对应的二值图像;C、定位二值图像中的字符区域;D、检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。
[0006]优选地，步骤B还包括通过otsu算法对红外图像进行二值化处理。
[0007]优选地，步骤B还包括:获取票据代号，根据票据代号载入对应票据的格局信息，根据格局信息将彩色图像分割为红水线区和非填写区；其中，通过retinex算法对红水线区进行预处理以增强图像，然后通过固定阈值法对红水线区进行二值化处理;通过otsu算法对非填写区进行二值化处理。
[0008]优选地，步骤C还包括通过连通域标记算法定位字符区域。
[0009]优选地，所述外接矩形的参数包括Y坐标、高度、宽度和外接矩形间距。
[0010]优选地，步骤D通过比较外接矩阵的参数和设定的阈值，判断字符类型，字符类型包括打印字和手写字。
[0011]优选地，步骤D还包括误差判定，记录打印字和手写字的数量，计算两者比值，通过对比该比值与误差允许值，判断字符串的字符类型，其中，误差允许值为用于界定判断结果的设定值，字符串为外接矩形间距在一定范围内的字符集合。
[0012]本发明采用的技术方案的另一方面为一种自动检测票据中字符类型的系统，包括:图像接收模块，用于获取票据的红外图像、彩色图像；图像处理模块，用于二值化处理红外图像和彩色图像，输出对应的二值图像;字符定位模块，用于定位二值图像中的字符区域;字符处理模块，用于检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。
[0013]本发明的有益效果为通过提供一种自动检测票据中字符类型的方法和系统，利用票据在红外图像下，支票本身印刷字显示不强的特质，通过一系列处理将字符提取出来，根据字符的轮廓的参数来进行特性分析，来区分手写体和打印体，判断方法原理简单，便于实现，节约时间和资源，不需要复杂的前期准备，同时提高辨识效率。
【附图说明】
[0014]图1所示为基于本发明实施例的一种自动检测票据中字符类型的方法流程示意图；
图2所示为基于本发明实施例的票据字符检测流程图；
图3所示为基于本发明实施例的处理红水线区的流程图。
【具体实施方式】
[0015]以下结合实施例对本发明进行说明。
[0016]基于发明的第一实施例，如图1所示一种自动检测票据中字符类型的方法，包括以下步骤:A、获取票据的红外图像、彩色图像;B、二值化处理红外图像和彩色图像，输出对应的二值图像;C、定位二值图像中的字符区域;D、检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。
[0017]红外线照射到票据上，通过接收并感应反射的光线，形成票据的红外图像;通过普通彩色照相仪器获取票据的彩色图像;通过外部输入得到票据的代号，或者特征识别辨识票据。二值化处理图像，通过像素的属性定位出字符的位置，使用opencv提供的cvFindContoursO函数在二值图像中寻找各字符的轮廓，提取模式采用只提取最外层的轮廓，逼近方法采用将所有点由链码形式翻译为点序列形式，根据字符的属性生产外接矩形，根据外接矩形的参数判断这些字符属于何种类型。
[0018]步骤B还包括通过otsu算法对红外图像进行二值化处理。
[0019 ]最大类间方差法是一种自适应的阈值确定的方法，又叫大津法，简称OT SU。它是按图像的灰度特性，将图像分成背景和目标2部分。背景和目标之间的类间方差越大，说明构成图像的2部分的差别越大，当部分目标错分为背景或部分背景错分为目标都会导致2部分差别变小。因此，使类间方差最大的分割意味着错分概率最小。
[0020]作为特殊的产品，支票印刷具有特别的性质，支票原本已经印刷完成的字符如“中国银行票据”等，在红外图像的条件下，显示出来的字符是非常地淡，而客户填写或者打印上去的字是可以清楚显示出来的，唯一的缺点是显示的字符在有些情况下可能比较浅，此时就需要对浅色字符进行图像增强操作，在不影响背景颜色的情况下，使之变黑。针对这种情况，可以使用模糊去雾方法增强票据中字符的颜色，同时降低字符周围噪点的影响，然后再使用Otsu算法进行二值化处理。
[0021]因为使用红外图像处理相比处理彩色图像来说，不需要处理干扰，处理速度更为快捷，因此可以优先进行红外图像的处理，例如先获取红外图像，二值化处理之后，进行字符检测，如果检测存在字符，则直接进行字符判断，如果检测不到字符，则取消红外图像处理，改为进行彩色图像的处理。
[0022]作为本发明的一个实施例，如图2所示票据字符检测流程图:
S21、开始流程;S22、二值化红外图像;S23、判断红外图像是否有字，有则进入S24，没有则进入S25; S24、提取红外图像的字符;S241、判断字符类型；S25、载入彩色图像，并对其进行二值化处理;S251、提取彩色图像字符;S252、判断字符类型;S26、输出判断结果。
[0023]步骤B还包括获取票据代号，根据票据代号载入对应票据的格局信息，根据格局信息将彩色图像分割为红水线区和非填写区；
其中，通过retinex算法对红水线区进行预处理以增强图像，然后通过固定阈值法对红水线区进行二值化处理;通过otsu算法对非填写区进行二值化处理。
[0024]红水线为票据中部包含有若干红线组成的区域，非填写区为不符合填写规范的空间(例如票据的印刷字体上或者边缘)，由于红水线区内红线会对辨识其上的字造成干扰，因此与其他区域采用不同的处理方法，非填写区的目的在于降低处理的范围，通过票据模板所具有的位置信息，将待处理的图像分为红水线区和非填写区，其余部分则为正常需要处理的区域。
[0025]Retinex思想是人感知到某点的颜色和亮度并不仅仅取决于该点进入人眼的绝对光线，还和其周围的颜色和亮度有关。Retinex理论的基本内容是物体的颜色是由物体对长波(红)、中波(绿)和短波(蓝)光线的反射能力决定的，而不是由反射光强度的绝对值决定的；物体的色彩不受光照非均性的影响，具有一致性，即Retinex理论是以色感一致性(颜色恒常性)为基础的。观察者所看到的物体的图像S是由物体表面对入射光L反射得到的，反射率R由物体本身决定，不受入射光L变化。其公式为S(x，y)= R(x，y)* L(x，y)，式中S(x，y)代表被观察或照相机接收到的图像信号;L(x，y)代表环境光的照射分量；R(x，y)表示携带图像细节信息的目标物体的反射分量，L(x，y)。核心就是估测照度L，从图像S中估测L分量，并去除L分量，得到原始反射分量R。
[0026]作为本发明方案的一个实施例，如图3所示处理红水线区的流程图:
s31、遍历预处理后的图像，若某像素点的蓝色分量值小于阈值Blue T，且蓝色分量、绿色分量、红色分量两两组合，差值均小于阈值Each T时，将满足上述条件下的对应位置的像素点像素值设置为255，其他位置的像素值设置为O，此时粗略分割出红水线内的黑色字符，其中Blue T与Each T为设定的值；s32、对上一步骤得到的图像进行高斯滤波；s33、使用固定阈值法进行二值化处理；s34、对上一步骤得到的图像使用椭圆结构进行I次膨胀操作；s35、对上一步骤得到的图像进行开运算操作；s36、将s31得到的图像与s35的到的图像相与；s37、采用连通域标记算法标记上一步骤得到的图像中独立的小区域，并将小区域去除，此时精细的分割出红水线下的黑色字符。
[0027]通过otsu算法对非填写区进行二值化处理，因为这部分区域的背景颜色较淡，不需要复杂的处理，可以使用自适应色阶和对比度方法对非红水线处图像进行预处理操作，得到对比度增强图像，灰度化预处理后的图像，再通过Otsu算法进行二值化处理。
[0028]步骤C还包括通过连通域标记算法定位字符区域。
[0029]连通区域一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域。连通区域分析是指将图像中的各个连通区域找出并标记，一个连通区域是由具有相同像素值的相邻像素组成像素集合，因此，我们就可以通过这两个条件在图像中寻找连通区域，对于找到的每个连通区域，我们赋予其一个唯一的标识(Label)，以区别其他连通区域。
[0030]二值图像分析最重要的方法就是连通区域标记，它是所有二值图像分析的基础，它通过对二值图像中白色或黑色像素(目标)的标记，让每个单独的连通区域形成一个被标识的块，进一步的我们就可以获取这些块的轮廓、外接矩形、质心等几何参数。
[0031]外接矩形的参数包括Y坐标、高度、宽度和外接矩形间距。
[0032]Y坐标即矩形顶部坐标，高度为矩形底部到顶部的距离，宽度为矩形左右距离，矩形间距为字符矩形间距。
[0033]步骤D通过比较外接矩阵的参数和设定的阈值，判断字符类型，字符类型包括打印字和手写字。
[0034]比较各字符外接矩形的y坐标(判断字符矩形上边是否在一条直线上)、高度(判断字符矩形高度是否一样)、宽度(判断字符矩形宽度是否一样)、两字符间间距(判断各字符矩形间的间距是否一样)是否同时满足两两外接矩形y坐标之差不大于L，两两外接矩形高度之差不大于H，两两外接矩形宽度之差小于W，三字符中两间距之差小于S，其中L、H、W、S为设定值。
[0035]若满足，则记录此单字符为打印字体，并计数;若不满足，则记录此单字符为手写字体，并计数。
[0036]步骤D还包括误差判定，记录打印字和手写字的数量，计算两者比值，通过对比该比值与误差允许值，判断字符串的字符类型，其中，误差允许值为用于界定判断结果的设定值，字符串为外接矩形间距在一定范围内的字符集合。
[0037]由于个人手写字的字形的区别，设置误差允许值，即在一串字符中，大部分的字符被判断为手写或者打印，即认为该串字符均属于手写或者打印；而字符串的判断，以字符的外接矩形的距离判断，显然，当最后的一个字符与之前的一系列字符之间距离很大的时候，这个字符就很有可能属于另一个字符串。
[0038]—种自动检测票据中字符类型的系统，包括:图像接收模块，用于获取票据的红外图像、彩色图像；图像处理模块，用于二值化处理红外图像和彩色图像，输出对应的二值图像;字符定位模块，用于定位二值图像中的字符区域;字符处理模块，用于检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。
[0039]以上所述，只是本发明的较佳实施例而已，本发明并不局限于上述实施方式，只要其以相同的手段达到本发明的技术效果，都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
【主权项】
1.一种自动检测票据中字符类型的方法，其特征在于，包括以下步骤: A、获取票据的红外图像、彩色图像； B、二值化处理红外图像和彩色图像，输出对应的二值图像； C、定位二值图像中的字符区域； D、检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。2.根据权利要求1所述的一种自动检测票据中字符类型的方法，步骤B还包括通过otsu算法对红外图像进行二值化处理。3.根据权利要求1所述的一种自动检测票据中字符类型的方法，步骤B还包括: 获取票据代号，根据票据代号载入对应票据的格局信息，根据格局信息将彩色图像分割为红水线区和非填写区；其中，通过retinex算法对红水线区进行预处理以增强图像，然后通过固定阈值法对红水线区进行二值化处理；通过otsu算法对非填写区进行二值化处理。4.根据权利要求1所述的一种自动检测票据中字符类型的方法，步骤C还包括通过连通域标记算法定位字符区域。5.根据权利要求1所述的一种自动检测票据中字符类型的方法，所述外接矩形的参数包括Y坐标、高度、宽度和外接矩形间距。6.根据权利要求1或5所述的一种自动检测票据中字符类型的方法，步骤D通过比较外接矩阵的参数和设定的阈值，判断字符类型，字符类型包括打印字和手写字。7.根据权利要求6所述的一种自动检测票据中字符类型的方法，步骤D还包括误差判定，记录打印字和手写字的数量，计算两者比值，通过对比该比值与误差允许值，判断字符串的字符类型，其中，误差允许值为用于界定判断结果的设定值，字符串为外接矩形间距在一定范围内的字符集合。8.—种自动检测票据中字符类型的系统，其特征在于，包括: 图像接收模块，用于获取票据的红外图像、彩色图像；图像处理模块，用于二值化处理红外图像和彩色图像，输出对应的二值图像；字符定位模块，用于定位二值图像中的字符区域；字符处理模块，用于检测字符的轮廓并生成外接矩形，根据外接矩形的参数判断字符类型。
【文档编号】G06K9/20GK106096601SQ201610396818
【公开日】2016年11月9日
【申请日】2016年6月6日公开号201610396818.9, CN 106096601 A, CN 106096601A, CN 201610396818, CN-A-106096601, CN106096601 A, CN106096601A, CN201610396818, CN201610396818.9
【发明人】王佳, 易堃, 师改梅, 王树胜
【申请人】深圳辰通智能股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王佳;易堃;师改梅;王树胜;
技术所有人：深圳辰通智能股份有限公司;
我是此专利的发明人

上一篇：一种基于卷积神经网络的中文车牌识别方法
上一篇：基于指定图形辨别急救包与工具是否具有对应关系的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。