一种基于emd的智能文档图像块检测方法

文档序号：9226020阅读：590来源：国知局

一种基于emd的智能文档图像块检测方法
【技术领域】
[0001] 本发明设及文档图像检测处理技术，尤其设及一种基于EMD的智能文档图像块检测方法，适用于退化文档图像的自适应阔值分割。
【背景技术】
[0002] 技术词解释
[0003] EMD;经验模态分解，英文全称为 Empirical Mode Decomposition。
[0004] 对于从文档图像的背景中区分文字，即将文档图像的灰度级图像转换为二值图像，其有巨大的应用价值，而在众多应用中，其主要应用在光学字符识别、自动银行支票处理、签名验证等方面。目前，已提出了许多算法来实现从文档图像的背景中区分文字，但是由于成像环境限制，文档图像常常被复杂的背景、非均匀的强度、阴影等该类因素退化，因此，使得分离文档图像中的文字，变得非常困难。
[0005] 而为了解决该些问题，已有许多二值化算法被提出，该些算法主要归为两类，其包括；1、全局阔值分割算法，如Tsai, Johannsan, Kapur等算法，然而，该些方法并不适用于包含各种背景图案或背景不均匀的源图像；2、局部阔值分割算法，如Niblack，Sauvla，B. Goto等算法，虽然其可适用于包含各种背景图案或背景不均匀的源图像，但是，在数据计算处理时，针对每个像素都必须估计其阔值，因此，该些方法均需耗费过长的处理时间，计算过程复杂冗长。而对于所述的文档图像二值化，其通常是被广泛应用于便携式设备中，但便携式设备的存储空间和计算能力均有限，因此，上述那些计算复杂度高、耗时长的局部阔值分割算法均不能满足将文档图像二值化应用于便携式设备的要求。

【发明内容】

[0006] 为了解决上述技术问题，本发明的目的是提供一种计算简单、速度快的基于经验模态分解的智能文档图像块检测方法。
[0007] 本发明所采用的技术方案是：一种基于EMD的智能文档图像块检测方法，该方法包括：
[0008] A、对文档图像进行灰度变换处理，从而获得文档灰度图像；
[0009] B、计算所述文档灰度图像的均值与方差，W及计算所述文档灰度图像的水平投影直方图；
[0010] C、对计算得出的水平投影直方图进行EMD分解，从而得到多个本征模函数分量W 及残差，将得到的最后一个本征模函数分量和残差进行求和后，将求和结果作为所述水平投影直方图的趋势线；
[0011] D、计算趋势线与水平投影直方图之间交点位置的横坐标，然后根据计算出的多个横坐标，从而计算相邻交点位置的横坐标之间的间隔宽度；
[0012] E、根据计算出的间隔宽度，从而进行图像子块的分割，然后对分割出的多个图像子块进行阔值处理后，计算每个图像子块的均值与方差；
[0013] F、根据文档灰度图像的均值和方差w及图像子块的均值和方差，从而判断该图像子块是否为背景，然后根据判断的结果进行相应的处理。
[0014] 进一步，对于步骤B中所述计算所述文档灰度图像的水平投影直方图，其所采用的公式如下所示：
[0015]
[0016] 其中，H(y)表示文档灰度图像的水平投影直方图，f(x，y)表示为文档灰度图像的像素矩阵，M表示为文档灰度图像的像素矩阵的行数。
[0017] 进一步，所述步骤C具体包括：
[0018] 对计算得出的水平投影直方图进行EMD分解，分解后所得出的结果如下公式所示：
[0019]
[0020] 其中，H表示为文档灰度图像的水平投影直方图，Ci表示为第i个本征模函数分量，Tn表不为残差；
[0021] 将得到的最后一个本征模函数分量和残差进行求和后，将求和结果作为所述水平投影直方图的趋势线，所述求和所采用的公式如下所示：
[0022] T =叫+Cn
[002引其中，T表示为趋势线，句为第N个本征模函数分量，rW为残差。
[0024] 进一步，所述步骤D包括：
[00巧]D1、计算趋势线与水平投影直方图之间交点位置的横坐标；
[0026] D2、设置一数组，将计算得出的所有横坐标依序存储于该数组中，并在该数组中插入初始位置和终点位置；
[0027] D3、根据该数组，从而计算相邻交点位置的横坐标之间的间隔宽度。
[0028] 进一步，所述步骤E包括：
[0029] E1、将计算出的间隔宽度作为图像子块分割窗口的高度和宽度，然后，根据该图像子块分割窗口进行图像子块的分割，分割后所得到的图像子块的高度和宽度均为上述计算出的间隔宽度；
[0030] E2、对分割出的多个图像子块进行阔值处理后，计算每个图像子块的均值与方差。
[0031] 进一步，所述步骤F具体为：
[0032] 根据文档灰度图像的均值和方差W及图像子块的均值和方差，从而判断该图像子块是否为背景；
[0033] 当该图像子块的方差小于文档灰度图像的方差，且该图像子块的均值大于文档灰度图像的均值时，则判断该图像子块为背景；
[0034] 当该图像子块的方差大于等于文档灰度图像的方差，且该图像子块的均值小于等于文档灰度图像的均值时，则采用自适应阔值算法对该图像子块进行二值化处理。
[0035] 进一步，所述自适应阔值算法为0TSU自适应阔值算法。
[0036] 本发明的有益效果是：本发明的检测方法不仅能够适用于被复杂成像环境退化的文档图像，而且该检测方法计算量小，可适用于便携式设备。
【附图说明】
[0037] 下面结合附图对本发明的【具体实施方式】作进一步说明：
[0038] 图1是本发明一种基于EMD的智能文档图像块检测方法的步骤流程图；
[0039] 图2是本发明一种基于EMD的智能文档图像块检测方法的一具体实施例步骤流程图；
[0040] 图3是水平投影直方图与趋势线的示意图。
【具体实施方式】
[00川如图1所示，一种基于EMD的智能文档图像块检测方法，该方法包括：
[0042] A、对文档图像进行灰度变换处理，从而获得文档灰度图像；
[0043] B、计算所述文档灰度图像的均值与方差，W及计算所述文档灰度图像的水平投影直方图；
[0044] C、对计算得出的水平投影直方图进行EMD分解，从而得到多个本征模函数分量W 及残差，将得到的最后一个本征模函数分量和残差进行求和后，将求和结果作为所述水平投影直方图的趋势线；
[0045] D、计算趋势线与水平投影直方图之间交点位置的横坐标，然后根据计算出的多个横坐标，从而计算相邻交点位置的横坐标之间的间隔宽度；
[0046] E、根据计算出的间隔宽度，从而进行图像子块的分割，然后对分割出的多个图像子块进行阔值处理后，计算每个图像子块的均值与方差；
[0047] F、根据文档灰度图像的均值和方差W及图像子块的均值和方差，从而判断该图像子块是否为背景，然后根据判断的结果进行相应的处理。
[0048] 进一步作为优选的实施方式，对于步骤B中所述计算所述文档灰度图像的水平投影直方图，其所采用的公式如下所示：
[0049]
[0050] 其中，H(y)表示文档灰度图像的水平投影直方图，f(x，y)表示为文档灰度图像的像素矩阵，M表示为文档灰度图像的像素矩阵的行数。
[0051] 进一步作为优选的实施方式，所述步骤C具体包括：
[0052] 对计算得出的水平投影直方图进行EMD分解，分解后所得出的结果如下公式所示：
[0053]
[0054] 其中，H表示为文档灰度图像的水平投影直方图，Ci表示为第i个本征模函数分量，Tn表不为残差；
[0055] 将得到的最后一个本征模函数分量和残差进行求和后，将求和结果作为所述水平投影直方图的趋势线，所述求和所采用的公式如下所示：
[0056] T =Tn+Cn
[0057] 其中，T表示为趋势线，cw为第N个本征模函数分量，r w为残差。
[0058] 进一步作为优选的实施方式，所述步骤D包括：
[0059] D1、计算趋势线与水平投影直方图之间交点位置的横坐标；
[0060] D2、设置一数组，将计算得出的所有横坐标依序存储于该数组中，并在该数组中插入初始位置和终点位置；
[0061] D3、根据该数组，从而计算相邻交点位置的横坐标之间的间隔宽度。
[0062] 进一步作为优选的实施方式，所述步骤E包括：
[0063] E1、将计算出的间隔宽度作为图像子块分割窗口的高度和宽度，然后，根据该图像子块分割窗口进行图像子块的分割，分割后所得到的图像子块的高度和宽度均为上述计算出的间隔宽度；
[0064] E2、对分割出的多个图像子块进行阔值处理后，计算每个图像子块的均值与方差。
[0065] 进一步作为优选的实施方式，所述步骤F具体为：
[0066] 根据文档灰度图像的均值和方差W及图像子块的均值和方差，从而判断该图像子块是否为背景；
[0067] 当该图像子块的方差小于文档灰度图像的方差，且该图像子块的均值大于文档灰度图像的均值时，则判断该图像子块为背景；
[0068] 当该图像子块的方差大于等于文档灰度图像的方差，且该图像子块的均值小于等于文档灰度图像的均值时，则采用自适应阔值算法对该图像子块进行二值化处理。然后按顺序存储图像子块的二值化结果作为整幅图像，最后整体显示阔值分割后的结果。
[0069] 进一步作为优选的实施方式，所述自适应阔值算法为0TSU自适应阔值算法。
[0070] 本发明方法一具体实施例
[0071] 如图2所示，一种基于EMD的智能文档图像块检测方法，其具体包括：

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡念;肖盼;陈裕潮;刘根;杨志景;王晗;
技术所有人：广东工业大学;
我是此专利的发明人

上一篇：一种基于压缩感知的人脸识别方法
上一篇：基于面向对象技术与ndvi时间序列相结合的农作物精细分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。