用于票据文档定位格的手写体标记符号检测方法

文档序号:6370957阅读:411来源:国知局
专利名称:用于票据文档定位格的手写体标记符号检测方法
技术领域
本发明涉及一种符号检测方法,尤其是一种用于票据文档定位格的手写体标记符号检测方法,属于图像处理的技术领域。
背景技术
在各类社会活动中,利用模式识别技术对各种票据进行自动分析、验证、检索和识另IJ,对于确保相关业务安全、提高工作效率、增加处理准确性都具有非常重要的现实意义。票据自动处理技术以其较高的学术价值和应用价值近年来受到国内外众多研究机构以及学者的广泛重视,该技术主要包含了两方面的内容,第一,票据图像版面的预处理,它是各类票据图像内容理解和识别的前提和基础;第二,对预处理后的图像内容进行分析和识别,它是检验票据自动处理技术性能好坏的标准。 表格型票据是一种结构化的特殊文档,输入的信息被规范在预先印制好的表格框线所指示的区域内,这些框线为票据文档要素区域的定位和识别提供了重要的辅助信息。然而在实际应用中,如何动态检测指定区域内容并获取特殊字符的识别结果,是表格型图像处理工作的难点。实际票据图像的扫描位置、背景、票面受污染程度等情况会造成许多干扰因素,这对于票据系统后期的自动识别处理产生较大的影响,因此准确可靠的框线检测结果,是票据处理方法的基础。票据图像的框线检测主要用到直线检测技术,目前常用的直线检测方法主要有基于Hough变换的方法、连通域分析法、矢量化方法以及通过对笔画和框线交叠处的局部图像区域进行分析从而完成框线检测等。以上方法具有定义简单,物理意义明确,易于检测、存储和处理等优点,在一定条件下可以快速、准确地提取直线。然而在上述传统方法的处理中,部分重要的局部边缘等细节特征难以被有效表达,以致复杂噪声背景下的框线检测工作时常失效。

发明内容
本发明的目的是克服现有技术中存在的不足,提供一种用于票据文档定位格的手写体标记符号检测方法,其操作方便,检测精度高,具有较好的通用性及鲁棒性。按照本发明提供的技术方案,一种用于票据文档定位格的手写体标记符号检测方法,包括如下步骤a、获取票据文档的图像;b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;C、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。所述步骤a中,利用摄像头拍摄票据文档,并以JPG方式存储票据文档图像。所述步骤b中,包括如下步骤bl、对票据文档图像进行灰度化,并对灰度化的票据文档图像进行反色处理;b2、对反色后的票据文档图像利用最大类间方差法进行二值分割,以形成所需的二值化图像;b3、对二值化后的票据文档图像利用有限脊波变换进行离散脊波变换,得到稀疏脊波系数,去除系数幅值较小的区域,再进行离散脊波反变换;
b4、对上述离散脊波反变换后的图像进行闭运算处理;b5、对上述进行闭运算处理后的图像进行链码跟踪,得到票据文档图像的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储。所述步骤c中,包括如下步骤Cl、最大封闭轮廓线的宽度是Width,轮廓线存储数组为BuffX、BuffY,投影后像素计数数组为Projline,投影角度范围为(-Angle,Angle),并建立正弦和余弦弧度表为SIN_T [i+Angle] = sin (iXO. I XPI/180), C0S_T [i+Angle] = cos (iXO. 1XPI/180),其中,PI为圆周率,i表示投影角,i G (-Angle, Angle);c2、在投影角度(-Angle,Angle)的范围内,根据投影公式C0S_T[i+Angle] XBuffX[i]+SIN_T[i+Angle] XBuffY[i]计算投影值并记为 Proj_idx,同时对计数数组Projline [Pro j_idx]进行累加;c3、取投影轴中点Proj_mid,在投影轴中点Projjnid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Pro j_Nul lZero_L和左侧最大投影值Pro j_NullZero_LMax ;同理,在投影轴中点Proj_mid的右侧按自右向左顺序,计算右侧第一个不为零的投影值Proj_NullZero_R及右侧最大投影值Pro j_NullZero_RMax ;c4、当 Pro j_Nul lZero_L 等于 int (C0S_T [i+Angle] X BuffX [i]+SIN_T[i+Angle] XBuffY[i])时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R 等于 int(C0S_T[i+Angle]XBuffX[i]+SIN_T[i+Angle]XBuffY[i]))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值Dl ;c5、将本次投影角度i下最佳边界点之间的跨度值Dl与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值Dl最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束;c6、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。所述步骤d中,包括如下步骤dl、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板;d2、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域;d3、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域;d4、提取出票据文档图像中打勾定位格区域。 所述步骤e包括如下步骤el、对提取的打勾定位格区域进行闭运算;e2、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像;e3、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮 廓,并对所述最大面积轮廓进行标记、存储;e4、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。
"0 0 0 0 0"
'0 110] 0 0 2 0 0所述卷积模板为 p I Ol ^ 0 2 2 0或A=O 2 4 2 O。
A= 020、— 0220 0 0 2 0 0
0I OJ 1_0 I I O」
= sin (i X0. I XPI/180), C0S_T[i+Angle] = cos (i X0. I XPI/180),其中,PI为圆周率,i表示投影角,i G (-Angle,Angle);此处,投影角度范围为(-Angle,Angle),投影角度范围可以票据文档图像进行确定,一般为(-20°,20° );c2、在投影角度(-Angle,Angle)的范围内,根据投影公式C0S_、T [i+Angle] XBuffX[i]+SIN_T [i+Angle] XBuffY[i]计算投影值并记为 Proj_idx,同时对计数数组Pr0jline[Pix)j_idX]进行累加;投影时,投影角度i在投影角度范围内遍历,投影角度i的遍历步长可以根据需要进行设置,步长较小时会增大计算量;此处,遍历是指投影角度i根据步长变化时取遍投影角度范围(-Angle,Angle)内的所有值;c3、取投影轴中点Proj_mid,在投影轴中点Projjnid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Pro j_Nul lZero_L和左侧最大投影值Pro j_NullZero_LMax ;同理,在投影轴中点Proj_mid的右侧按自右向左顺序,计算右侧第一个不为零的投影值Proj_NullZero_R及右侧最大投影值Pro j_NullZero_RMax ;c4、当 Pro j_Nul lZero_L 等于 int (C0S_T [i+Angle] X BuffX [i]+SIN_T[i+Angle] XBuffY[i])时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R 等于 int(C0S_T[i+Angle]XBuffX[i]+SIN_T[i+Angle]XBuffY[i]))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值Dl ; 一般地,跨度值Dl为左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax之间差值的绝对值;c5、将本次投影角度i下最佳边界点之间的跨度值Dl与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值Dl最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束;如图3和图4所示为票据文档的顶端存在干扰区域,由于干扰区域的存在,在计算宽度时,可能会存在跨度值Dl与跨度值D2,而跨度值D2明显存在干扰,因此选择较小的跨度值Dl能够较精确得到票据文档的宽度值;c6、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;图I中的先验信息包括票据模板等信息;所述步骤d包括如下步骤dl、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板;在实际运用中,可以预先存储大量的票据模板,当将待检测票据文档的最大封闭轮廓、角点坐标确定后,就能够从预先存储的票据模板中找到所需的票据模板,通过票据模板能够提取后续所需的区域;d2、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域;附图
中的银行票据图像中包含“币种”的五行方格区域,在具体应用中,根据票据模板能获取相应的方格区域,这些方格区域包括后续需要识别是否包括标记符号的区域;d3、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域;
通过对Sobel变换以削弱水平框线,再向垂直方向投影,通过投影分析后,判断所述方格区域是否包含文字,当方格区域中未包含文字时,此方格区域势必不会存在标记符号,因此将此方格区域删除,降低整个检测的计算量;d4、提取出票据文档图像中打勾定位格区域。通过上述操作后,提取出的打勾定位格区域包括打勾子识别区域为未打勾子识别区域,一般地,在票据文档中,在同时成双存在两个表格区域,通过在两个表格区域进行打标记选取相应的选项,因此,本发明实施例提出出的打勾子识别区域、未打勾子识别区域符号实际情况。如图5所示,图6中显示了打勾子识别区域,图7中显示了未打勾子识别区域。e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。所述步骤e包括如下步骤el、对提取的打勾定位格区域进行闭运算;当进行闭运算处理后,能消除图像边框边缘断边及分支点噪声干扰;e2、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像;对打勾定位格区域利用最大类间方差法进行阈值分割为图像处理领域常规的操作步骤,此处不再详述。e3、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮廓,并对所述最大面积轮廓进行标记、存储;e4、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。所述卷积模板与最大面积轮廓进行空间卷积时,能增强图像边缘以内的信号同时减弱边缘信号,当卷积后,打勾子识别区域的卷积值较大,未打勾子识别区域的卷积值较小;当打勾定位格区域分割出两个子区域后,能够根据卷积值来判断相应区域是否存在标记符号。而当两个子识别区域卷积值相同时,一般可以认为均不存在打勾区域,实际情况中,一般不会在同一行方格区域内同时存在两个打勾区域。由于不同人进行手写标记时情况各有不同,本发明实施例中通过利用卷积值进行判断具有通用性,符合实际情况。所述卷
权利要求
1.一种用于票据文档定位格的手写体标记符号检测方法,其特征是,所述手写体标记符号检测方法包括如下步骤 (a)、获取票据文档的图像; (b)、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储; (C)、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角; (d)、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域; (e)、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。
2.根据权利要求I所述的用于票据文档定位格的手写体标记符号检测方法,其特征是所述步骤(a)中,利用摄像头拍摄票据文档,并以JPG方式存储票据文档图像。
3.根据权利要求I所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(b)中,包括如下步骤 (bl)、对票据文档图像进行灰度化,并对灰度化的票据文档图像进行反色处理; (b2)、对反色后的票据文档图像利用最大类间方差法进行二值分割,以形成所需的二值化图像; (b3)、对二值化后的票据文档图像利用有限脊波变换进行离散脊波变换,得到稀疏脊波系数,去除系数幅值较小的区域,再进行离散脊波反变换; (b4 )、对上述离散脊波反变换后的图像进行闭运算处理; (b5)、对上述进行闭运算处理后的图像进行链码跟踪,得到票据文档图像的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储。
4.根据权利要求I所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(c)中,包括如下步骤 (Cl)、最大封闭轮廓线的宽度是Width,轮廓线存储数组为BuffX、BuffY,投影后像素计数数组为Projline,投影角度范围为(-Angle,Angle),并建立正弦和余弦弧度表为SIN_T[i+Angle] = sin (iXO. I XPI/180), C0S_T[i+Angle] = cos (iXO. 1XPI/180),其中,PI为圆周率,i表示投影角,i G (-Angle, Angle); (c2)、在投影角度(-Angle,Angle)的范围内,根据投影公式C0S_T [i+Angle] XBuffX[i]+SIN_T [i+Angle] XBuffY[i]计算投影值并记为 Proj_idx,同时对计数数组Projline [Pro j_idx]进行累加; (c3)、取投影轴中点Proj_mid,在投影轴中点Proj_mid的左侧按自左向右顺序,计算投影轴左侧第一个不为零的投影值Proj_NullZero_L和左侧最大投影值Pro j_NullZero_LMax ;同理,在投影轴中点Projjnid的右侧按自右向左顺序,计算右侧第一个不为零的投影值 Proj_NullZero_R 及右侧最大投影值 Pro j_NullZero_RMax ; (c4)、当 Proj_NullZero_L 等于 int(COS_T[i+Angle]XBuffX[i]+SIN_T[i+Angle] XBuffY[i])时,上述左侧边界点Proj_NullZero_LMax为最大峰值;同理,当Proj_NullZero_R 等于 int(COS_T[i+Angle]XBuffX[i]+SIN_T[i+Angle]XBuffY[i]))时,上述右侧边界点Proj_NullZero_RMax为最大峰值;其中int为取整运算;根据左侧边界点最大峰值Proj_NullZero_LMax、右侧边界点最大峰值Proj_NullZero_RMax计算得到跨度值Dl ; (c5)、将本次投影角度i下最佳边界点之间的跨度值Dl与前述存储的跨度值进行比较,当本次投影角度i下最佳边界点之间的跨度值Dl最小时,保存所述跨度值,并在投影角度范围内再次进行投影,直至投影结束; (c6)、投影循环结束后,根据比较结果得到所需的最佳边界点之间的跨度值D、角度坐标CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle为票据文档最大封闭轮廓的倾角。
5.根据权利要求I所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(d)中,包括如下步骤 (dl)、根据上述倾角将票据文档的图像旋转到水平正方位置,并根据票据文档的最大封闭轮廓及所述最大封闭轮廓对应的角点坐标确定所需的票据模板; (d2)、根据票据模板获取票据文档的框线分布比例,以从票据文档中分割出所需的方格区域; (d3)、对上述分割出的方格区域进行垂直方向的Sobel变换,再向垂直方向投影,以去除方格区域中未包含文字的区域; (d4)、提取出票据文档图像中打勾定位格区域。
6.根据权利要求I所述的用于票据文档定位格的手写体标记符号检测方法,其特征是,所述步骤(e)包括如下步骤 (el)、对提取的打勾定位格区域进行闭运算; (e2)、对上述闭运算后的打勾定位格区域进行最大类间方差法阈值分割,生成二值化图像; (e3)、对上述得到的二值化图像进行链码跟踪,获得打勾定位格区域的最大面积轮廓,并对所述最大面积轮廓进行标记、存储; (e4)、对上述打勾定位格区域的最大面积轮廓进行空间卷积,并根据所述卷积值判断打勾定位格区域是否存在手写体标记符号。
7.根据权利要求6所述的用于票据文档定位格的手写体标记符号检测方法,其特征 是,所述卷积模板为 p I Ol _ 0 2 2 0或A=O 2 4 2 O。
全文摘要
本发明涉及一种用于票据文档定位格的手写体标记符号检测方法,其包括如下步骤a、获取票据文档的图像;b、将所述票据文档图像进行多尺度脊波变换、闭运算及链码跟踪,以获得票据文档的最大封闭轮廓,并对所述最大封闭轮廓进行标记、存储;c、对上述最大封闭轮廓进行基于最优轴投影测度,以确定票据文档最大封闭轮廓的倾角;d、根据上述倾角将票据文档的图像旋转到水平正方位置,并将得到的票据文档图像与所需的票据模板比对,以分割提取出票据文档图像中打勾定位格区域;e、对提取的打勾定位格区域利用掩膜法进行检测,以确定票据文档的定位格是否包含标记符号。本发明操作方便,检测精度高,具有较好的通用性及鲁棒性。
文档编号G06K9/20GK102750531SQ201210182820
公开日2012年10月24日 申请日期2012年6月5日 优先权日2012年6月5日
发明者刘梓, 宋晓宁, 沈志明 申请人:江苏尚博信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1