一种文档图像透印清除方法及系统的制作方法

文档序号:7997759阅读:235来源:国知局
专利名称:一种文档图像透印清除方法及系统的制作方法
技术领域
本发明涉及图像处理中的透印去除技术领域,具体涉及一种文档图像透印清除方法及系统。
背景技术
纸质文档数字化的第一步是扫描,在扫描的过程中纸质文档背面的黑色文字会通过扫描仪形成一种模糊图像,这种模糊图像就称为透印。透印的灰度值一般介于文字图像和背景图像之间。传统的透印清除方法主要依靠人工手动进行,既费时又费力,效率很低。
目前的透印清除方法主要是通过操作人员利用Wiotoshop的色阶功能完成,其做法的基本流程如下首先利用Photoshop打开待处理的图像,启动色阶命令;然后调节色阶的功能面板,即通道选择全色通道,并从右到左滑动输入色阶中最右侧的白色滑块(在滑块从右到左移动过程中,图像中的透印会逐渐减少)直到透印完全消失为止,最后点击确定,应用于图像,保存图像。此方法虽然可以较好的去除透印,但是费时费力,需要大量熟悉 Photoshop的操作人员完成。因此一种自动化的自适应的文档图像透印去除方法是十分必要的。
申请号为2003101M357. 2、公开号为CN1512760A、名称为“除去读取双面或重叠原稿产生的透印的图像处理装置及其方法”的发明专利申请公开了一种通过校正以除去在读取双面或重叠原稿产生的透印的处理装置。该专利将正面图像或者反转图像中的任一个图像反转,检测反转的正面图像与背面图像,或者反转的背面图像与正面图像之间的位置关系,并根据检测出的位置关系通过运算来校正图像以便除去图像透印。虽然该发明中的方法能够较好的去除图像中的绝大部分透印,但是由于在检测图像的位置关系时只是提取了正面、背面图像的高亮度分量,对于低于设定亮度值的低亮度分量没有予以考虑,所以通过该方法并不能够实现较理想的清除透印,尤其对于亮度本身就较低的图像的透印处理更是如此。发明内容
针对现有技术中存在的缺陷及实际应用中的需要,本发明的目的在于提供一种文档图像透印清除方法及系统,实现去透印过程自动化,以及对不同类型、透印程度不同的文档图像的自适应的去透印。
为实现上述目的,本发明采用的技术方案是(1)选定待处理的文档图像,找出文档图像的文字笔画区域和非文字笔画区域;
(2)对所述非文字笔画区域进行直方图统计,并通过对直方图进行分析确定去透印阈值T;
(3)根据去透印阈值T对所述文档图像进行调整以清除透印,将高于去透印阈值T 的像素点的像素值设置为255,将像素值低于去透印阈值T的做函数关系变换。
进一步,如上所述的一种文档图像透印清除方法,步骤(1)中,根据所述文档图像的局部分布特征,或者全局分布特征找出文档图像的文字笔画区域和非文字笔画区域,其中,所述局部分布特征包括局部均值和方差。
进一步,如上所述的一种文档图像透印清除方法,步骤(1)中,根据所述文档图像的局部分布特征找出文字笔画区域和非文字笔画区域的具体步骤为
a)计算所述文档图像中每一个像素点的像素值,以任意一个像素点为中心,设该像素点的像素值为g (X,y),计算该中心P X q范围内的所有像素点的像素值的均值m(X,y) 和方差s (X,y),其中30彡ρ彡240,30彡q彡240 ;
b)根据均值m(x,y)和方差s(x,y)计算文档图像的像素值阈值t (x,y),计算公式为
t{x,y)^m{x,y)x 1 + ^(^^--1)L κ 」,
其中,0. 2 < Ii1 < 0. 5,R表示标准差的最大值;
c)根据所述阈值t(x,y)对文档图像的每个像素点进行阈值处理,将像素值小或等于阈值t(x,y)的像素点设置为文字笔画区域,大于阈值t(x,y)的像素点设置为非文字笔画区域。
进一步,如上所述的一种文档图像透印清除方法,步骤a)中,ρ的优选值为60,q 的优选值为60。
进一步,如上所述的一种文档图像透印清除方法,步骤(1)中,根据所述文档图像的局部分布特征找出文字笔画区域和非文字笔画区域后,对所述文字笔画区域进行膨胀处理,膨胀处理的次数为1 3次。
进一步,如上所述的一种文档图像透印清除方法,步骤O)中,对非文字笔画区域进行直方图统计,并通过对直方图进行分析确定去透印阈值的具体步骤为
i)计算出非文字笔画区域内像素的数目nTotal ;
ii)建立非文字笔画区域的直方iii)从右向左遍历直方图,将直方图中第一个小于li2*nT0tal的柱所对应的像素值确定为去透印阈值T ;其中,k2为经验值,0. 0001 ^ k2 ^ 0. 001。
再进一步,如上所述的一种文档图像透印清除方法,步骤(3)中,做函数关系变换时选择线性函数或者非线性函数。
基于上述文档图像透印清除方法的一种文档图像透印清除系统,包括
区域查找装置用于选定待处理的文档图像,找出文档图像的文字笔画区域和非文字笔画区域;
阈值计算装置用于确定去透印阈值,该装置包括
像素数目计算单元用于计算非文字笔画图像区域内像素的数目nTotal ;
直方图建立单元用于建立非文字笔画区域的直方去透印阈值确定单元用于从右向左遍历直方图,并将直方图中第一个小于 k2*nTotal的柱所对应的像素值确定为去透印阈值T,k2为经验值,0. 0001 ^ k2 ^ 0. 001 ;
图像处理装置用于根据去透印阈值T对所述文档图像进行调整清除透印,将高于透印阈值T像素点的像素值设置为255,将像素值低于去透印阈值T的做函数关系变换。
进一步,如上所述的一种文档图像透印清除系统,所述区域查找装置还包括5
膨胀处理单元用于对确定的文字笔画区域进行膨胀处理。
本发明的效果在于本发明通过对文档图像的背景区域进行统计分析可以自适应的确定去除透印所需的阈值,并根据该阈值对图像进行调整,达到去除透印的目的。通过该方法及系统,实现了去透印过程的自动化,并能够对不同类型、透印程度不同的文档图像自适应的去除透印,大大提高了文档图像的处理效率,节约劳动力和劳动成本。


图1为本发明一种文档图像透印清除系统的结构框图2为本发明一种文档图像透印清除方法的流程图3为具体实施方式
中寻找文字笔画区域时像素的邻域示意图4为实施例中的未去透印前的原始文档图像;
图5为实施例图4的局部放大图6为实施例中的文字笔画区域图像;
图7为实施例中经过膨胀处理的文字笔画区域图像;
图8为实施例中非文字笔画区域的直方图9为实施例中经过线性函数变换的调整结果图10为图9中的局部放大图。
具体实施方式
下面结合说明书附图与具体实施方式
对本发明做进一步的详细说明。
图1示出了本发明一种文档图像透印清除系统的结构框图,由图中可以看出该系统主要包括以下装置
区域查找装置11 用于选定待处理的文档图像,找出文档图像的文字笔画区域和非文字笔画区域;
阈值计算装置12 用于确定去透印阈值
图像处理装置13 用于根据去透印阈值T对所述文档图像进行调整清除透印,将高于透印阈值T像素点的像素值设置为255,将像素值低于去透印阈值T的做函数关系变换。
其中,区域查找装置11还包括对文字笔画区域进行膨胀处理的膨胀处理单元,由于仅根据局部分布特征找出的文字笔画区域可能不太精确,对其进行膨胀处理可以保证尽可能多的覆盖文字笔画区域像素,使得对非文字笔画区域的统计尽可能少得受到文字笔画区域的影响。
阈值计算装置12包括
像素数目计算单元用于计算非文字笔画图像区域内像素的数目nTotal ;
直方图建立单元用于建立非文字笔画区域的直方去透印阈值确定单元用于从右向左遍历直方图,并将直方图中第一个小于 k2*nTotal的柱所对应的像素值确定为去透印阈值ΤΛ2为经验值,其取值范围为

通过阈值计算装置12确定去透印阈值Τ,图像处理装置12根据该透印阈值T对文档图像进行调整,对于像素值高于阈值T的像素点,将该点的像素值设置为255,对于像素值低于阈值T的按照一定的函数关系(线性函数或非线性函数)进行变换处理。
图2示出了基于图1中文档图像透印清除系统的一种文档图像透印清除方法的流程图,该方法包括以下几个步骤
步骤S21 确定文字笔画区域和非文字笔画区域;
选定待处理的文档图像,确定待处理文档图像的文字笔画区域和非文字笔画区域。文字笔画区域是指文档图像所对应的纸质文档正面文字笔画所覆盖的区域,其他均为非文字笔画区域(背景区域)。由于透印是一种比较模糊的图像,而文字笔画区域则较为锐利,因此可以根据文档图像的局部分布特征或者全局分布特征来找出文档图像中的文字笔画区域和非文字笔画区域,将文字笔画的大致区域提取出来。
例如可以利用文档图像的局部均值和方差特征来实现,具体的过程如下
a)计算文档图像中每一个像素点的像素值,以任意一个像素点为中心,设该像素点的像素值为g(X,y),计算窗口大小为PXq范围内的所有像素点的像素值的均值m(X,y) 和方差s (X,y),其中30彡ρ彡M0,30彡q彡M0,本具体实施方式
中p、q均取值为60 ;
b)根据均值m(x,y)和方差s(x,y)计算文档图像的像素值阈值t (x,y),计算公式为
权利要求
1.一种文档图像透印清除方法,包括以下步骤(1)选定待处理的文档图像,找出文档图像的文字笔画区域和非文字笔画区域;(2)对所述非文字笔画区域进行直方图统计,并通过对直方图进行分析确定去透印阈值T ;(3)根据去透印阈值T对所述文档图像进行调整以清除透印,将高于去透印阈值T的像素点的像素值设置为255,将像素值低于去透印阈值T的做函数关系变换。
2.如权利要求1所述的一种文档图像透印清除方法,其特征在于步骤(1)中,根据所述文档图像的局部分布特征,或者全局分布特征找出文档图像的文字笔画区域和非文字笔画区域,其中,所述局部分布特征包括局部均值和方差。
3.如权利要求2所述的一种文档图像透印清除方法,其特征在于步骤(1)中,根据所述文档图像的局部分布特征找出文字笔画区域和非文字笔画区域的具体步骤为a)计算所述文档图像中每一个像素点的像素值,以任意一个像素点为中心,设该像素点的像素值为g(x,y),计算该中心PXq范围内的所有像素点的像素值的均值m(X,y)和方差 s (X,y),其中 30 < ρ < 240,30 < q < 240 ;b)根据均值m(x,y)和方差s(x,y)计算文档图像的像素值阈值t(x,y),计算公式为
4.如权利要求3所述一种文档图像透印清除方法,其特征在于步骤a)中,ρ的优选值为60,q的优选值为60。
5.如权利要求2或3所述一种文档图像透印清除方法,其特征在于步骤(1)中,根据所述文档图像的局部分布特征找出文字笔画区域和非文字笔画区域后,对所述文字笔画区域进行膨胀处理,膨胀处理的次数为1 3次。
6.如权利要求1所述一种文档图像透印清除方法,其特征在于步骤O)中,对非文字笔画区域进行直方图统计,并通过对直方图进行分析确定去透印阈值的具体步骤为i)计算出非文字笔画区域内像素的数目nTotal ; )建立非文字笔画区域的直方图;iii)从右向左遍历直方图,将直方图中第一个小于Ic2^nTotal的柱所对应的像素值确定为去透印阈值T ;其中,k2为经验值,0. 0001 ^ k2 ^ 0. 001。
7.如权利要求1所述的一种文档图像透印的清除方法,其特征在于步骤(3)中,做函数关系变换时选择线性函数或者非线性函数。
8.一种文档图像透印清除系统,包括区域查找装置用于选定待处理的文档图像,找出文档图像的文字笔画区域和非文字笔画区域;阈值计算装置用于确定去透印阈值,该装置包括像素数目计算单元用于计算非文字笔画图像区域内像素的数目nTotal ;直方图建立单元用于建立非文字笔画区域的直方图;去透印阈值确定单元用于从右向左遍历直方图,并将直方图中第一个小于k2*nT0tal 的柱所对应的像素值确定为去透印阈值T,k2为经验值,0. 0001 ^ k2 ^ 0. 001 ;图像处理装置用于根据去透印阈值T对所述文档图像进行调整清除透印,将高于透印阈值T像素点的像素值设置为255,将像素值低于去透印阈值T的做函数关系变换。
9.如权利要求8所述的一种文档图像透印清除系统,其特征在于所述区域查找装置还包括膨胀处理单元用于对确定的文字笔画区域进行膨胀处理。
全文摘要
本发明公开了一种文档图像透印清除方法及系统,涉及图像处理中的透印去除技术领域。该方法首先根据文档图像的全局或局部分布特征找出文档图像的文字笔画区域(前景区域)和非文字笔画区域(背景区域),然后通过对背景区域进行直方图统计分析确定去透印阈值,最后根据该去透印阈值对文档图像进行调整,达到去除透印的目的。本发明所述的方法及系统,通过自适应的确定去透印阈值来去除透印,并可以去除不同程度的透印,对于较深和较浅的透印都具有良好的去除效果,大大提高了文档图像的去透印处理效率,节约劳动力和劳动成本。
文档编号H04N1/409GK102523364SQ20111039434
公开日2012年6月27日 申请日期2011年12月2日 优先权日2011年12月2日
发明者史培培, 胡希驰 申请人:方正国际软件(北京)有限公司, 方正国际软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1