一种基于对比度增强法的降质文档图像二值化方法

文档序号：9547569阅读：559来源：国知局

一种基于对比度增强法的降质文档图像二值化方法
【技术领域】
[0001] 本发明涉及基于对比度增强法的降质文档图像二值化方法。属于图像处理技术领域，涉及对降质文档图像的二值化方法，可用于OCR系统对降质文档图像字符识别的预处理，具体是一种基于对比度增强法的降质文档图像二值化方法。
【背景技术】
[0002] OCR技术（Optical Character Recognition，光学字符识别）是将纸质文字信息录入到计算机中最高效的方法。而OCR系统的识别效率则取决于文档图像的质量。对于降质文档图像的识别，目前的OCR技术存在的不足主要表现为二值化后的文档图像丢失了大量的有效信息，无法得到连续、完整的笔画结构，严重影响后续的识别结果。虽然大量学者已经对文档图像二值化研究多年，但对于从降质文档图像（如图像中存在阴影、非均匀光照、墨迹透背、模糊等）中提取出清晰字符仍是图像处理领域的一个难点。

【发明内容】

[0003] 本发明是要解决现有方法无法从降质文档图像中提取出清晰字符的问题，而提供了一种基于对比度增强法的降质文档图像二值化方法。
[0004] -种基于对比度增强法的降质文档图像二值化方法，按以下步骤实现：
[0005] 步骤1 :读取降质文档图像，对降质文档图像进行灰度变换，输出灰度级为256的灰度图像；
[0006] 步骤2 :利用四叉树原理，根据灰度对比度信息，区分强灰度对比度区域与弱灰度对比度区域；
[0007] 步骤3 :对于强灰度对比度区域，采用弱灰度对比度增强法调整区域像素点灰度值；对于弱灰度对比度区域，采用强灰度对比度增强法调整区域像素点灰度值；
[0008] 步骤4 :根据强灰度对比度区域与弱灰度对比度区域像素点灰度值出现的频率确定局部阈值；
[0009] 步骤5 :令强灰度对比度区域与弱灰度对比度区域像素点灰度值大于局部阈值的像素点的灰度值为255 ;令强灰度对比度区域与弱灰度对比度区域像素点灰度值小于局部阈值的像素点的灰度值为〇,输出二值图像。
[0010] 发明效果：
[0011] 因此本发明提出一种新的二值化算法，针对不同的降质原因，在不同的区域选择恰当的区域对比度增强法，从而达到理想的分割效果。
[0012] 应用本实施方式算法处理的二值图像，具有最高的F-measure值（高于次高OTSU 算法4% )、最高的PSNR值（高于次高Sauvola算法5% )及较低的NRM值。说明本实施方式算法可以最好的还原目标像素点，同时说明应用本实施方式算法输出的二值图像最接近实际未降质文档的二值图像，且本实施方式算法的误分割率较小。说明应用本实施方式算法处理的降质文档图像具有最优的分割质量。
【附图说明】
[0013] 图1为本发明流程图；
[0014] 图2(a)是第一次区域划分原理示意图；
[0015] 图2(b)是第二次区域划分原理示意图；其中，所述□背景区域；隱灰度对比度显著区域；腿灰度对比度较显著区域；
[0016] 图3 (a)为待测试图像；
[0017] 图3 (b)为用OTSU方法的二值化图像；
[0018] 图3 (c)为用Niblack方法的二值化图像；
[0019] 图3 (d)为用Sauvola方法的二值化图像；
[0020] 图3 (e)为用Singh方法的二值化图像；
[0021] 图3(f)为用本发明方法的二值化图像；
[0022] 图4(a)为待测试图像；
[0023] 图4 (b)为用OTSU方法的二值化图像；
[0024] 图4 (c)为用Niblack方法的二值化图像；
[0025] 图4 (d)为用Sauvola方法的二值化图像；
[0026] 图4 (e)为用Singh方法的二值化图像；
[0027] 图4(f)为用本发明方法的二值化图像；
[0028] 图5 (a)为待测试图像；
[0029] 图5 (b)为用OTSU方法的二值化图像；
[0030] 图5 (c)为用Niblack方法的二值化图像；
[0031] 图5 (d)为用Sauvola方法的二值化图像；
[0032] 图5 (e)为用Singh方法的二值化图像；
[0033] 图5 (f)为用本发明方法的二值化图像；
[0034] 图6 (a)为待测试图像；
[0035] 图6 (b)为用OTSU方法的二值化图像；
[0036] 图6 (c)为用Niblack方法的二值化图像；
[0037] 图6 (d)为用Sauvola方法的二值化图像；
[0038] 图6 (e)为用Singh方法的二值化图像；
[0039] 图6 (f)为用本发明方法的二值化图像。
【具体实施方式】
【具体实施方式】 [0040] 一：本实施方式的一种基于对比度增强法的降质文档图像二值化方法，按以下步骤实现：
[0041] 步骤1 :读取降质文档图像，对降质文档图像进行灰度变换，输出灰度级为256的灰度图像；
[0042] 步骤2 :利用四叉树原理，根据灰度对比度信息，区分强灰度对比度区域与弱灰度对比度区域；
[0043] 步骤3 :对于强灰度对比度区域，采用弱灰度对比度增强法调整区域像素点灰度值；对于弱灰度对比度区域，采用强灰度对比度增强法调整区域像素点灰度值；
[0044] 步骤4 :根据强灰度对比度区域与弱灰度对比度区域像素点灰度值出现的频率确定局部阈值；
[0045] 步骤5 :令强灰度对比度区域与弱灰度对比度区域像素点灰度值大于局部阈值的像素点的灰度值为255 ;令强灰度对比度区域与弱灰度对比度区域像素点灰度值小于局部阈值的像素点的灰度值为〇,输出二值图像。
【具体实施方式】 [0046] 二：本实施方式与一不同的是：所述步骤2具体为：
[0047] (2a)计算降质文档图像像素点坐标为（X，y)处灰度值为f(x, y)的灰度对比度 D (X, y)，其计算公式为：
[0048] D(x,y) = max [Dh (x, y), Dv (x, y) ] (I)
[0049] Dh(x, y) = | f (x, y)-f (χ-l, y) (2)
[0050] Dv(x, y) = I f (x, y)-f (x, y-1) (3)
[0051] 其中，Dh(x, y)和Dv(x, y)分别是像素点f(x, y)水平方向和竖直方向的灰度对比度，f (x-1，y)是f (X，y)水平方向左侧像素点的灰度值，f (X，y-ι)是f (X，y)竖直方向下侧像素点的灰度值；
[0052] (2b)利用四叉树原理，根据灰度对比度对降质文档图像进行区域划分：
[0053] 第一次四分后，若任一区域内的最大灰度对比度小于等于a倍整体区域的最大灰度对比度，即公式4,说明该区域的灰度变化不显著，则认为该区域均为背景区域，直接输出该区域，对剩余区域继续进行细分；
[0054] Dftliax (X，y)彡 a · Dentiremax (χ, y) (4)
[0055] 其中，所述DD_(x，y)为第一次四分后任一区域内的最大灰度对比度， Daitiraiiax(Xj)为整体区域的最大灰度对比度；
[0056] (2c)第二次四分后，若任一第二次四分后形成的DD区域内的最大灰度对比度小于等于a倍的第一次四分后任一区域内的最大灰度对比度，即公式5,说明该区域的灰度变化不显著，则认为该区域均为背景区域，直接输出该区域；
[0057] 若任一第二次四分后形成的AC区域内的最大灰度对比度大于等于b倍的第一次四分后形成的A区域内的最大灰度对比度，即公式6,说明该区域为灰度变化非常显著区域，则对该区域进行弱灰度对比度增强法处理；
[0058] 若任一第二次四分后形成的BA区域内的最大灰度对比度介于a和b倍的第一次四分后形成的B区域内的最大灰度对比度之间即公式7,说明该区域为灰度变化较显著区域，则对该区域进行强灰度对比度增强法处理；
[0062] 其中，所述Ddd_ (X，y)第二次四分后形成的DD区域内的最大灰度对比度， DACnax(x，y)第二次四分后形成的AC区域内的最大灰度对比度，DBAmax(x，y)第二次四分后形成的BA区域内的最大灰度对比度，D amx (χ, y)第一次四分后形成的A区域内的最大灰度对比度，DB_(x，y)第一次四分后形成的B区域内的最大灰度对比度。
[0063] 实验证明a e [0, 0· 4]，b e [0· 7, 1]。且对图像进行两次四分来确定区域的灰度变化属性是最佳四分次数，过多的四分会导致计算量过大，且容易将噪声点误分成目标，不能很好的将噪点处理掉。过少的四分虽然会减小计算量，但同时也将丢失过多的细节，达不到理想的分割效果。
[0064] 其它步骤及参数与【具体实施方式】一相同。
【具体实施方式】 [0065] 三：本实施方式与一或二不同的是：所述步骤3具体为：
[0066] (3a)对于灰度变化非常显著区域，采用弱灰度对比度增强法，将区域内各像素点灰度值调整为

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卢迪;黄鑫;
技术所有人：哈尔滨理工大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。