一种彩色扫描文档图像预处理方法与流程

文档序号:14302989阅读:716来源:国知局
一种彩色扫描文档图像预处理方法与流程

本发明涉及针对彩色图像的预处理技术,尤其是针对彩色扫描文档图像的灰度化、二值化和去噪技术。



背景技术:

随着当信息技术的高速发展,以及办公数字化需求的不断增长,数字化的扫描文档图像正逐渐替代原始的纸质文档。扫描文档图像具有储存空间小,管理方便,处理快捷等特点。因此,对文档图像处理的研究具有重要的实用价值。文档在扫描过程中,由于设备原因或者人为因素,可能导致扫描后的文档图像存在噪声、光照不均匀,以及几何变形等不利情况,这将严重影响文档图像的视觉质量。因此有必要对原始扫描文档图像进行增强处理,提高扫描图像的视觉质量,为后续的处理步骤做好准备。

完整的扫描文档图像处理系统通常包括预处理、压缩存储、OCR(光学字符识别)等。其中预处理部分主要包括:二值化、去噪、倾斜度校正、去黑边等处理步骤。本专利提出的方法主要完成二值化和去噪功能,输入的是彩色扫描文档图像,输出的是经过去噪处理后的二值化扫描文档图像。典型的全局阈值化方法有平均灰度值法、Otsu法等[1][2]。如果图像是背景与目标比较均匀,全局阈值法是一个有效的方法。但由于文献本身污染情况,或者以及扫描光源等问题,造成扫描图像各部分目标与背景不均匀,在这种情况下使用全局阈值往往不能得到很好的处理结果。针对这类情况,可以考虑使用局部二值化方法。Bernsen 算法[3]是一种经典的局部二值化方法。Bernsen算法以局部窗口内最大-最小值的均值作为中心点对应的阈值,不需要事先确定阈值,并且计算复杂度低,处理速度快。但当局部区域内部无目标点,但又存在噪声点时,容易引起误检。

经过专利申请人检索,目前与文档图像处理有关的国内发明专利主要集中在扫描文档倾斜度检测与矫正[4][5],以及透字效应去除方面[6]。俞颂阳和明伟在专利“用于二值化扫描文档图像的方法”(申请号 CN201110359326.X)[7]中提出了一种用于二值化扫描文档图像的方法。该专利主要是针对二值扫描文档图像的后处理,并没有涉及彩色或灰度图像的二值化和去噪过程。

参考文献:

[1]庄军,李弼程,陈刚.一种有效的文本图像二值化方法.微计算机信息,2005(8):56-58.

[2]陈丹,张蜂,贺贵明.一种改进的文本图像二值化算法.计算机工程,2003(13):85-86.

[3]J.Bernsen.Dynamic Thresholding of Gray level.Internal Conference on Pattern Recognition,1986: 1251-1255.

[4]文志强,曾志高,朱文球,专利名称:一种扫描文档图像的倾斜角自动检测方法,申请号:N201410769531.7

[5]马磊,刘江,专利名称:一种扫描文档图像的快速纠偏方法,申请号:CN201010146476.8

[6]王建,刘长波,专利名称:一种文档扫描图像透字效应消除方法,申请号:CN201410301425.6

[7]俞颂阳,明伟,专利名称:用于二值化扫描文档图像的方法,申请号:CN201110359326.X



技术实现要素:

提出了一种针对彩色扫描文档图像的预处理方法。采用本发明所述方法,能将彩色扫描文档图像转换为二值图像,具有抗干扰能力强、适用范围广等特点。本发明的技术方案如下:

一种彩色扫描文档图像预处理方法,包括下列步骤:

1)将输入的彩色扫描文档图像转换为灰度图像L;

2)对L进行对比度拉伸增强处理,增强结果用I表示;

3)使用中值滤波器对I进行平滑处理,处理结果用F表示;

4)进行移动平均二值化处理,方法如下:

第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有

第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有

第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y),参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重;

第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示;如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0,二值图B中取值为0的点,对应于潜在的前景字符点;

5)噪点去除,方法如下:

第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数;

第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1;

第3步:遍历B中所有区域,将最终处理结果记为E。

上述方法中,可取p=10,q=20,可令α=β=0.4。

本专利提出的针对彩色扫描文档图像的预处理方法,包括灰度化、对比度拉伸、图像滤波、二值化和去噪等步骤。首先将输入的彩色扫描文档图像转换为灰度图像;接下来进行增强处理,包括对比度拉伸和中值滤波两步骤;然后使用移动平均法对增强后的灰度进行二值化处理;最后结合连通域分析,去除噪声点。本发明方法的特征有:1)有很强的抗噪声干扰能力;2)与图像内容无关,适应中文、英文文档情形、各种图文混排、多种书写方向并存等复杂情形。

附图说明

图1所提方法框图

图2部分实验结果(为显示方便,添加图片外轮廓线)

(a)扫描文档图像灰度图 (b)灰度级拉伸和滤波结果

(c)二值化结果 (d)噪点去除结果

图3部分实验结果(为显示方便,添加图片外轮廓线)

(a)左图为英文印刷文本扫描图像,右图为采用本发明的方法的处理结果

(b)左图为中文手写文本扫描图像,右图为采用本发明的方法的处理结果

具体实施方式

所提方法主要包括:灰度化、对比度拉伸、平滑滤波、二值化和噪点去除等步骤。图1给出了所提方法的框图。包括:

1、灰度化

本专利所提方法首先将输入的彩色扫描文档图像转换为灰度图像。首先判断输入扫描文档图像类型。如果是灰度图,则直接进入到下一步;如果是彩色图,则使用以下过程转换为灰度图像。

用C表示输入彩色扫描文档图像,其红、绿、蓝三通道图像分别用CR、CG和CB表示。使用式(1)得到灰度图像,并用L表示,即有:

2、灰度级拉伸

由于扫描设备等原因,可能导致扫描文档图像背景偏暗,文字与背景的对比度较低。所提方法使用对比度拉伸技术增强L,增强结果用I表示。具体过程如下:

算法1:对比度拉伸

第1步:计算L中的最大值和最小值,分别用Lmax和Lmin表示;

第2步:对L进行线性拉伸,处理结果用I表示;

3、平滑滤波

文档在扫描过程中可能引入噪声。所提方法使用中值滤波器对I进行平滑处理,处理结果用F表示。具体过程如下:

算法2:中值滤波

第1步:选取I中(x,y)位置上的点,用I(x,y)表示,以它为中心,选取周围的“4-邻域点”,即该点上方、下方、左方和右方的4个点,分别用I(x-1,y)、I(x+1,y)、I(x,y-1)和I(x,y+1)表示;

第2步:对这5个点的灰度值进行排序,选取中间值,记为Imed(x,y),将F(x,y)赋值为Imed(x,y)。

第3步:确定是否遍历了I中所有点,如果是,则算法结束;否则改变当前点的位置,返回第1步。

4、二值化

无论是中文还是外文,扫描文档图像中的字符大多数是按水平方向排列,单个字符笔画以水平和垂直方向为主。本专利使用提出移动平均计算局部阈值,实现二值化处理。具体实现过程如下:

算法3:移动平均二值化

第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有

第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有

第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y)。

第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示。如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0。

在上述算法中,取p=10,q=20,参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重,可令α=β=0.4。二值图B中取值为0的点,对应于潜在的前景字符点。

5、噪点去除

由于各种情况的干扰,B中可能仍然存在噪声点,经过观察发现,这类噪声点通常以孤立区域存在,并且所占面积较小。对于分辨率在300dpi以上的扫描文档图像,中/英文中的字符和标点符号中有效点的尺寸都在4×4以上,而面积小于16个点的潜在前景区域,可以看做是噪点并去除。本专利使用以下过程去除噪点:

算法4:噪点去除

第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数。

第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1(即变为背景点)。

第3步:遍历B中所有区域,将最终处理结果记为E。

采用Windows7SP1系统下的Visual C++2010作为实验仿真平台。选用自己采集的扫描文档图像作为测试集,共计120幅图像。扫描文档设为A4大小,水平/垂直分辨率是300dpi,像素数为2480×3508。采用本专利所提方法对测试图像进行处理,得到了良好的处理效果,平均处理速度为320ms,处理速度能够满足实时要求。

图2所示为所提方法处理过程示例。图3所示为更多的处理结果,其中(a)为英文印刷文本扫描图像情况,(b)为中文手写文本扫描图像情况,左侧为原始扫描文本图像,右侧为使用本专利所提方法得到的处理结果。为显示方便,图2和图3的文本图像人为增加黑色轮廓线。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1