一种基于emd的智能文档图像块检测方法

文档序号:9226020阅读:590来源:国知局
一种基于emd的智能文档图像块检测方法
【技术领域】
[0001] 本发明设及文档图像检测处理技术,尤其设及一种基于EMD的智能文档图像块检 测方法,适用于退化文档图像的自适应阔值分割。
【背景技术】
[0002] 技术词解释
[0003] EMD;经验模态分解,英文全称为 Empirical Mode Decomposition。
[0004] 对于从文档图像的背景中区分文字,即将文档图像的灰度级图像转换为二值图 像,其有巨大的应用价值,而在众多应用中,其主要应用在光学字符识别、自动银行支票处 理、签名验证等方面。目前,已提出了许多算法来实现从文档图像的背景中区分文字,但是 由于成像环境限制,文档图像常常被复杂的背景、非均匀的强度、阴影等该类因素退化,因 此,使得分离文档图像中的文字,变得非常困难。
[0005] 而为了解决该些问题,已有许多二值化算法被提出,该些算法主要归为两类,其包 括;1、全局阔值分割算法,如Tsai, Johannsan, Kapur等算法,然而,该些方法并不适用于 包含各种背景图案或背景不均匀的源图像;2、局部阔值分割算法,如Niblack,Sauvla,B. Goto等算法,虽然其可适用于包含各种背景图案或背景不均匀的源图像,但是,在数据计算 处理时,针对每个像素都必须估计其阔值,因此,该些方法均需耗费过长的处理时间,计算 过程复杂冗长。而对于所述的文档图像二值化,其通常是被广泛应用于便携式设备中,但便 携式设备的存储空间和计算能力均有限,因此,上述那些计算复杂度高、耗时长的局部阔值 分割算法均不能满足将文档图像二值化应用于便携式设备的要求。

【发明内容】

[0006] 为了解决上述技术问题,本发明的目的是提供一种计算简单、速度快的基于经验 模态分解的智能文档图像块检测方法。
[0007] 本发明所采用的技术方案是:一种基于EMD的智能文档图像块检测方法,该方法 包括:
[0008] A、对文档图像进行灰度变换处理,从而获得文档灰度图像;
[0009] B、计算所述文档灰度图像的均值与方差,W及计算所述文档灰度图像的水平投影 直方图;
[0010] C、对计算得出的水平投影直方图进行EMD分解,从而得到多个本征模函数分量W 及残差,将得到的最后一个本征模函数分量和残差进行求和后,将求和结果作为所述水平 投影直方图的趋势线;
[0011] D、计算趋势线与水平投影直方图之间交点位置的横坐标,然后根据计算出的多个 横坐标,从而计算相邻交点位置的横坐标之间的间隔宽度;
[0012] E、根据计算出的间隔宽度,从而进行图像子块的分割,然后对分割出的多个图像 子块进行阔值处理后,计算每个图像子块的均值与方差;
[0013] F、根据文档灰度图像的均值和方差w及图像子块的均值和方差,从而判断该图像 子块是否为背景,然后根据判断的结果进行相应的处理。
[0014] 进一步,对于步骤B中所述计算所述文档灰度图像的水平投影直方图,其所采用 的公式如下所示:
[0015]
[0016] 其中,H(y)表示文档灰度图像的水平投影直方图,f(x,y)表示为文档灰度图像的 像素矩阵,M表示为文档灰度图像的像素矩阵的行数。
[0017] 进一步,所述步骤C具体包括:
[0018] 对计算得出的水平投影直方图进行EMD分解,分解后所得出的结果如下公式所 示:
[0019]
[0020] 其中,H表示为文档灰度图像的水平投影直方图,Ci表示为第i个本征模函数分 量,Tn表不为残差;
[0021] 将得到的最后一个本征模函数分量和残差进行求和后,将求和结果作为所述水平 投影直方图的趋势线,所述求和所采用的公式如下所示:
[0022] T =叫+Cn
[002引其中,T表示为趋势线,句为第N个本征模函数分量,rW为残差。
[0024] 进一步,所述步骤D包括:
[00巧]D1、计算趋势线与水平投影直方图之间交点位置的横坐标;
[0026] D2、设置一数组,将计算得出的所有横坐标依序存储于该数组中,并在该数组中插 入初始位置和终点位置;
[0027] D3、根据该数组,从而计算相邻交点位置的横坐标之间的间隔宽度。
[0028] 进一步,所述步骤E包括:
[0029] E1、将计算出的间隔宽度作为图像子块分割窗口的高度和宽度,然后,根据该图像 子块分割窗口进行图像子块的分割,分割后所得到的图像子块的高度和宽度均为上述计算 出的间隔宽度;
[0030] E2、对分割出的多个图像子块进行阔值处理后,计算每个图像子块的均值与方差。
[0031] 进一步,所述步骤F具体为:
[0032] 根据文档灰度图像的均值和方差W及图像子块的均值和方差,从而判断该图像子 块是否为背景;
[0033] 当该图像子块的方差小于文档灰度图像的方差,且该图像子块的均值大于文档灰 度图像的均值时,则判断该图像子块为背景;
[0034] 当该图像子块的方差大于等于文档灰度图像的方差,且该图像子块的均值小于等 于文档灰度图像的均值时,则采用自适应阔值算法对该图像子块进行二值化处理。
[0035] 进一步,所述自适应阔值算法为0TSU自适应阔值算法。
[0036] 本发明的有益效果是:本发明的检测方法不仅能够适用于被复杂成像环境退化的 文档图像,而且该检测方法计算量小,可适用于便携式设备。
【附图说明】
[0037] 下面结合附图对本发明的【具体实施方式】作进一步说明:
[0038] 图1是本发明一种基于EMD的智能文档图像块检测方法的步骤流程图;
[0039] 图2是本发明一种基于EMD的智能文档图像块检测方法的一具体实施例步骤流程 图;
[0040] 图3是水平投影直方图与趋势线的示意图。
【具体实施方式】
[00川如图1所示,一种基于EMD的智能文档图像块检测方法,该方法包括:
[0042] A、对文档图像进行灰度变换处理,从而获得文档灰度图像;
[0043] B、计算所述文档灰度图像的均值与方差,W及计算所述文档灰度图像的水平投影 直方图;
[0044] C、对计算得出的水平投影直方图进行EMD分解,从而得到多个本征模函数分量W 及残差,将得到的最后一个本征模函数分量和残差进行求和后,将求和结果作为所述水平 投影直方图的趋势线;
[0045] D、计算趋势线与水平投影直方图之间交点位置的横坐标,然后根据计算出的多个 横坐标,从而计算相邻交点位置的横坐标之间的间隔宽度;
[0046] E、根据计算出的间隔宽度,从而进行图像子块的分割,然后对分割出的多个图像 子块进行阔值处理后,计算每个图像子块的均值与方差;
[0047] F、根据文档灰度图像的均值和方差W及图像子块的均值和方差,从而判断该图像 子块是否为背景,然后根据判断的结果进行相应的处理。
[0048] 进一步作为优选的实施方式,对于步骤B中所述计算所述文档灰度图像的水平投 影直方图,其所采用的公式如下所示:
[0049]
[0050] 其中,H(y)表示文档灰度图像的水平投影直方图,f(x,y)表示为文档灰度图像的 像素矩阵,M表示为文档灰度图像的像素矩阵的行数。
[0051] 进一步作为优选的实施方式,所述步骤C具体包括:
[0052] 对计算得出的水平投影直方图进行EMD分解,分解后所得出的结果如下公式所 示:
[0053]
[0054] 其中,H表示为文档灰度图像的水平投影直方图,Ci表示为第i个本征模函数分 量,Tn表不为残差;
[0055] 将得到的最后一个本征模函数分量和残差进行求和后,将求和结果作为所述水平 投影直方图的趋势线,所述求和所采用的公式如下所示:
[0056] T =Tn+Cn
[0057] 其中,T表示为趋势线,cw为第N个本征模函数分量,r w为残差。
[0058] 进一步作为优选的实施方式,所述步骤D包括:
[0059] D1、计算趋势线与水平投影直方图之间交点位置的横坐标;
[0060] D2、设置一数组,将计算得出的所有横坐标依序存储于该数组中,并在该数组中插 入初始位置和终点位置;
[0061] D3、根据该数组,从而计算相邻交点位置的横坐标之间的间隔宽度。
[0062] 进一步作为优选的实施方式,所述步骤E包括:
[0063] E1、将计算出的间隔宽度作为图像子块分割窗口的高度和宽度,然后,根据该图像 子块分割窗口进行图像子块的分割,分割后所得到的图像子块的高度和宽度均为上述计算 出的间隔宽度;
[0064] E2、对分割出的多个图像子块进行阔值处理后,计算每个图像子块的均值与方差。
[0065] 进一步作为优选的实施方式,所述步骤F具体为:
[0066] 根据文档灰度图像的均值和方差W及图像子块的均值和方差,从而判断该图像子 块是否为背景;
[0067] 当该图像子块的方差小于文档灰度图像的方差,且该图像子块的均值大于文档灰 度图像的均值时,则判断该图像子块为背景;
[0068] 当该图像子块的方差大于等于文档灰度图像的方差,且该图像子块的均值小于等 于文档灰度图像的均值时,则采用自适应阔值算法对该图像子块进行二值化处理。然后按 顺序存储图像子块的二值化结果作为整幅图像,最后整体显示阔值分割后的结果。
[0069] 进一步作为优选的实施方式,所述自适应阔值算法为0TSU自适应阔值算法。
[0070] 本发明方法一具体实施例
[0071] 如图2所示,一种基于EMD的智能文档图像块检测方法,其具体包括:
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1