一种版面类型的识别方法及系统的制作方法

文档序号:6512624阅读:295来源:国知局
一种版面类型的识别方法及系统的制作方法
【专利摘要】本发明公开了一种版面类型的识别方法及系统,首先提取待识别图像的版面特征,所述的版面特征是指图像的文本行信息;然后将待识别图像的版面特征与版面类型模板库中的所有模板图像的进行比较,计算待识别图像与所有模板图像的匹配度,将匹配度最高的模板图像的版面类型确定为待识别图像的版面类型。通过本发明所述的方法与系统,能够识别在图像只有打印区域文字不同时图像版面类型的识别,解决了现有技术中对该类图像不能够识别的缺陷,且效率较高,可以在消耗较少时间的情况下,大大提高版面类型判断的准确性。
【专利说明】一种版面类型的识别方法及系统
【技术领域】
[0001]本发明涉及文档图像的类型识别领域,具体涉及一种版面类型的识别方法及系统。
【背景技术】
[0002]随着科技的快速发展,在众多领域都需要应用到自动识别技术,例如在银行,银行有一种业务需求是对扫描好的表单图像进行自动类型判断和待识别区域自动识别。但是在进行自动类型判断时存在这样的一种情况:若干不同类型的表单除了打印区域的打印内容之外均相同。在这种情况下我们只能依据打印区域中打印内容的版面排布信息来区分不同的表单类型。那么如何提取打印区域的排布特征就成为识别表单类型的关键,但现有技术中还不存在利用版面排布信息进行表单类型判断的尝试。在现有技术中,当待识别的表单只有打印区域文字不同时,还无法对这类表单进行区分,而是将其归为一类表单。

【发明内容】

[0003]针对现有技术中存在的缺陷,本发明的目的在于提供一种版面类型的识别方法及系统,实现当待识别图像中只有打印区域文字不同时版面类型的识别。
[0004]为实现上述目的,本发明采用的技术方案如下:
[0005]一种版面类型的识别方法,包括以下步骤:
[0006](I)提取待识别图像的版面特征;所述的版面特征是指图像文字区域中文本行的
位置信息;
[0007](2)将待识别图像的版面特征与版面类型模板库中的所有模板图像的版面特征进行比较,计算待识别图像与所有模板图像的匹配度;
[0008](3)将匹配度最高的模板图像的版面类型确定为待识别图像的版面类型。
[0009]进一步,如上所述的一种版面类型的识别方法,步骤(I)中,所述的文本行的位置信息是指图像文字区域中文本行的左上角坐标信息。
[0010]进一步,如上所述的一种版面类型的识别方法,步骤(I)中,提取待识别图像版面特征的具体方式为:
[0011]I)对待识别图像进行二值化处理,得到二值化图像;
[0012]2)确定二值化图像中文字区域的左侧起始位置和上方起始位置;
[0013]3)提取所述文字区域的文本行,确定所有文本行的左上角坐标,得到所有文本行左上角坐标信息的点集。
[0014]进一步,如上所述的一种版面类型的识别方法,步骤2)中,通过投影法确定二值化图像的文字区域的左侧起始位置和上方起始位置,具体方式如下:
[0015]a.计算所述二值图像的水平投影和垂直投影;
[0016]b.根据水平投影定位文字区域的上方起始位置,根据垂直投影定位文字区域的左侧起始位置。[0017]进一步,如上所述的一种版面类型的识别方法,步骤b中,水平投影向量中纵坐标第一个大于Th的水平投影向量的横坐标所在的位置为文字区域的上方起始位置,垂直投影向量中纵坐标第一个大于Tv的垂直投影向量的横坐标所在的位置为文字区域的左侧起始位置;
[0018]其中,O≤Th≤(m*THmax),THmax表示水平投影向量中的纵坐标的最大值,O ( m<l ;
[0019]O≤Tv≤(n*TVmax), Tvmax表示垂直投影向量中的纵坐标的最大值,O ( n〈l。
[0020]进一步,如上所述的一种版面类型的识别方法,步骤3)中,通过投影法提取所述文字区域的文本行,具体方式如下:
[0021]1.通过二值图像的水平投影提取文字区域的大行;所述的大行是指文字区域的一整行;
[0022]i 1.对每个大行的子图像进行垂直投影,提取每个大行的若干子行。
[0023]再进一步,如上所述的一种版面类型的识别方法,步骤(2)中,计算待识别图像与所有模板图像的匹配度的具体方式为:
[0024](2-1)将待识别图像的所有文本行的左上角坐标点集与模板图像的所有文本行的左上角坐标点集进行坐标对齐;所述的坐标对齐是指变换到同一坐标系下;
[0025](2-2)计算待识别图像的所有文本行的左上角坐标点集与模板图像的所有文本行的左上角坐标点集之间的双向Hausdorff距离,双向Hausdorff距离越小匹配度越高。
[0026]更进一步,如上所述的一种版面类型的识别方法,步骤(2-2)中,所述的双向Hausdorff距离的计算公式为:
[0027]
[0028]
【权利要求】
1.一种版面类型的识别方法,包括以下步骤: (1)提取待识别图像的版面特征;所述的版面特征是指图像文字区域中文本行的位置信息; (2)将待识别图像的版面特征与版面类型模板库中的所有模板图像的版面特征进行比较,计算待识别图像与所有模板图像的匹配度; (3)将匹配度最高的模板图像的版面类型确定为待识别图像的版面类型。
2.如权利要求1所述的一种版面类型的识别方法,其特征在于,步骤(1)中,所述的文本行的位置信息是指图像文字区域中文本行的左上角坐标信息。
3.如权利要求1或2所述的一种版面类型的识别方法,其特征在于,步骤(1)中,提取待识别图像版面特征的具体方式为: .1)对待识别图像进行二值化处理,得到二值化图像; .2)确定二值化图像中文字区域的左侧起始位置和上方起始位置; . 3)提取所述文字区域的文本行,确定所有文本行的左上角坐标,得到所有文本行左上角坐标信息的点集。
4.如权利要求3所述的一种版面类型的识别方法,其特征在于,步骤2)中,通过投影法确定二值化图像的文字区域的左侧起始位置和上方起始位置,具体方式如下: a.计算所述二值图像的水平投影和垂直投影; b.根据水平投影定位文字区域的上方起始位置,根据垂直投影定位文字区域的左侧起始位置。
5.如权利要求4所述的一种版面类型的识别方法,其特征在于,步骤b中,水平投影向量中纵坐标第一个大于Th的水平投影向量的横坐标所在的位置为文字区域的上方起始位置,垂直投影向量中纵坐标第一个大于Tv的垂直投影向量的横坐标所在的位置为文字区域的左侧起始位置; 其中,O≤Th≤(In^Tltaax),Tamax表示水平投影向量中的纵坐标的最大值,O ( m<l ; O≤Tv≤(n*TVmax),Tvmax表示垂直投影向量中的纵坐标的最大值,O ( n〈l。
6.如权利要求4所述的一种版面类型的识别方法,其特征在于,步骤3)中,通过投影法提取所述文字区域的文本行,具体方式如下: 1.通过二值图像的水平投影提取文字区域的大行;所述的大行是指文字区域的一整行; ii.对每个大行的子图像进行垂直投影,提取每个大行的若干子行。
7.如权利要求4所述的一种版面类型的识别方法,其特征在于:步骤(2)中,计算待识别图像与所有模板图像的匹配度的具体方式为: (2-1)将待识别图像的所有文本行的左上角坐标点集与模板图像的所有文本行的左上角坐标点集进行坐标对齐;所述的坐标对齐是指变换到同一坐标系下; (2-2)计算待识别图像的所有文本行的左上角坐标点集与模板图像的所有文本行的左上角坐标点集之间的双向Hausdorff距离,双向Hausdorff距离越小匹配度越高。
8.如权利要求7所述的一种版面类型的识别方法,其特征在于:步骤(2-2)中,所述的双向Hausdorff距离的计算公式为:
H (A, B) =max (h (A, B), h (B, A))
9.一种版面类型的识别系统,包括: 版面特征提取模块,用于提取待识别图像的版面特征;所述的版面特征是指图像文字区域中文本行的位置信息; 匹配度计算模块,用于将待识别图像的版面特征与版面类型模板库中的所有模板图像的版面特征进行比较,计算待识别图像与所有模板图像的匹配度; 版面类型确定模块,用于将匹配度最高的模板图形的版面类型确定为待识别图像的版面类型。
10.如权利要求9所述的一种版面类型的识别系统,其特征在于,所述的版面特征提取模块包括: 二值化单元,用于对待识别图像进行二值化处理,得到二值化图像; 起始位置确认单元,用于确定所述二值化图像的文字区域的左侧起始位置和上方起始位置; 文本行信息提取单元,用于提取所述文字区域的文本行,确定所有文本行的左上角坐标,得到所有文本行左上角坐标信息的点集。
11.如权利要求10所述的一种版面类型识别系统,其特征在于,所述的匹配度计算模块包括: 坐标对齐单元:用于将待识别图像的所有文本行的左上角坐标与模板图像的所有文本行的左上角坐标进行坐标对齐;所述的坐标对齐是指变换到同一坐标系下; 匹配度计算单元,用于计算待识别图像的所有文本行的左上角坐标点集与模板图像的所有文本行的左上角坐标点集之间的双向Hausdorff距离,双向Hausdorff距离越小匹配度越高。
12.如权利要求11所述的一种版面类型识别系统,其特征在于,匹配度计算单元计算所述的双向Hausdorff距离的计算公式为:
【文档编号】G06K9/00GK103544475SQ201310435103
【公开日】2014年1月29日 申请日期:2013年9月23日 优先权日:2013年9月23日
【发明者】史培培, 张宏志 申请人:方正国际软件有限公司, 方正国际软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1