用于文档图像的自适应二值化方法和设备的制作方法

文档序号:6467574阅读:111来源:国知局
专利名称:用于文档图像的自适应二值化方法和设备的制作方法
技术领域
本发明涉及图像二值化技术,尤其涉及用于文档图像的自适应二值化方法和设备。
背景技术
近年来,随着图像处理技术的迅速发展,文档图像光学字符识别(OCR)正得到广 泛的应用。作为一种图像预处理技术,文档图像二值化处理经常在OCR系统中被用到。二 值化处理是将彩色或灰度级图像转换成黑白图像的过程,其中黑白图像只具有黑、白两个 灰度级。 有许多种用于文档图像的全局或自适应的二值化方法。二值化方法的例子包 括Otsu方法,用于根据灰度直方图计算阈值(参见〃 A ThresholdSelection Method from Gray-Level Histograms 〃 , IEEE Trans. On systems, Man,30and cybernetics, Vol. SMC-9, No. 1, pp. 62-66, January 1979) , Niblack方法,用于基于图像的局部均 值禾口标准差计算阈值(参见〃 Anlntroduction to Digitall Image Processing", Prentice-Hal 1, EnglewoodCliffs, NJ(1986))和Sauvola方法,其是对Niblack方法的 改进并且尝试抑制噪声区(参见J. Sauvola和M.Pietikainen, 〃 Ad即tive document imagebinarization, 〃 Pattern Recognition 33②,pp.225-236,2000。
例如0tsu方法的全局二值化方法对于退化的弱笔划字符和光线变化的背景效果 不佳。例如Niblack方法和Sauvola方法的自适应二值化方法虽然能够应对上述情况,但 经常在背景图像中产生大量噪声。作为对Niblack方法的改进的Sauvola方法对于纹理背 景图像效果较好,但可能会丢失弱笔划。此外,目前的二值化方法都不适合处理带表格线的 字符串图像。

发明内容
本发明的目的是提供一种用于文档图像的自适应二值化方法和设备,以至少克服 现有技术的部分不足。 在本发明的一个实施例中,用于文档图像的自适应二值化设备包含估计器,根 据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度 级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为 中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景 灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据 第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像 素区间和第一像素区域的尺寸大于预定尺寸。 在一个可选实施例中,估计器还根据在行和列中的另一个方向上文档图像的每一 组像素,估计该组的每个像素的第二背景灰度级,以获得文档图像的第二背景图像,计算器 还针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素到第二背景
4图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第二阈值,并且提取器还根据第二阈值从文档图像中提取出第二二值化图像,其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定尺寸,其中,所述自适应二值化设备还包括图像合并器,获得第一和第二二值化图像间的逻辑与图像。 在一个可选实施例中,在计算第一和第二阈值时,d = kXr,O < k < 2。 在一个可选实施例中,在计算第一和第二阈值时,d = kX (rn+1 r_rn |) , 0 < k < 2,
rn为文档图像的估计噪声。 在一个可选实施例中,估计器通过平均值或迭代多项式回归来进行估计。 在本发明的一个实施例中,用于文档图像的自适应二值化方法,包括根据在行和
列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获
得文档图像的第一背景图像;针对文档图像的每个像素,计算以该像素为中心的第一像素
区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均
距离r正相关的量d之间的差,以作为该像素的第一阈值;和根据第一阈值从文档图像中提
取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的
尺寸大于预定尺寸。


参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。
图1是示出根据本发明实施例的用于文档图像的自适应二值化设备的框图。
图2是示出根据本发明实施例的用于文档图像的自适应二值化方法的流程图。
图3A示意性示出了计算器计算阈值的原理,图3B示出了在应用阈值时估计噪声所产生的作用。 图4示意性示出了由原始文档图像中一行像素估计背景图像中该行像素的过程 图5示意性示出了图1的自适应二值化设备处理文档图像的具体示例。 图6是示出根据本发明优选实施例的用于文档图像的自适应二值化设备的框图。 图7是示出根据本发明优选实施例的用于文档图像的自适应二值化方法的流程图。 图8示意性示出了图6的自适应二值化设备处理文档图像的具体示例。
图9是示出其中实现本发明的计算机的示例性结构的框图。
具体实施例方式
下面参照附图来说明本发明的实施例。应当注意,为了清楚的目的,附图和说明中
省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
图1是示出根据本发明实施例的用于文档图像的自适应二值化设备100的框图。 如图1所示,自适应二值化设备100包括估计器101、计算器102和提取器103。
在图l所示的实施例中,假定在文档图像中分布有沿行方向延伸的线条,并且沿行方向存在手写或打印的文字。此外,假定文档图像的灰度级为0到255。灰度级255代表纯白,灰度级O代表纯黑,并且文档图像具有浅灰度(即高灰度级)背景,深灰度(即低灰度级)文字。 估计器101以文档图像的每一行的像素为一组,逐行处理文档图像。在处理中,估计器101根据行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的背景图像。 可以将文档图像认为是背景图像与文字图像的叠加,并且线条也被认为是背景图像的一部分。由于文字与线条相交的部分往往具有比文字和线条更深的灰度,因此当线条被提取为背景图像的一部分时,自然能够将线条与文字分离。 由于根据每一行的像素来估计背景图像,因此能够更加适应地将沿行方向延伸的线条估计为背景图像的一部分。 可以利用各种方法来进行估计。例如,可以通过平均值来估计背景图像,其中对于每一组像素中的每一个像素,针对以该像素为中心的像素区间内的所有像素求灰度级平均值,并且将灰度级平均值作为当前像素的背景灰度级。这样,所有像素的背景灰度级构成文档图像的背景图像。为了足够区分背景和文字,可以将像素区间的尺寸(即宽度)设置为大于某个值,使得区间内至少包含背景像素。例如,可以将像素区间的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区间的尺寸设置为大于文字沿线条方向(在本实施例中为行方向)的平均或最大笔划宽度。在一个实施例中,像素区间的尺寸为ll个 对于接近图像边界的像素,以其为中心的像素区间可能包含边界以外的部分。对于这样的情况,可以只针对像素区间内的实际像素求平均值。 也可以采用迭代多项式回归来拟合估计背景图像。适合使用的多项式拟合函数可采用P次多项式,如P = 7。拟合函数的形式为
f (x) = ao+^x+^xS+^xS+^xA+^xS+^^+^x7 其中p越大,函数的拟合能力越强,但容易过拟合;p越小,拟合能力越差,但容易
欠拟合。 给定一行像素(Xl, y》,…,(xn, yn) ,x,. = ^代表像素归一化的列坐标,乂.=条代表像素(设灰度级gi在0至255之间)归一化后的灰度级,n是一行的像素数目。
将输入A,…,Xn的0至p次幂依次安排放置于一个矩阵X
<formula>formula see original document page 6</formula>,以定义多项式滤波矩阵
HnXn = X(XTX+e I)-Y 其中I是单位矩阵,e是一个小正常数,例如取e = 0. OOOln。对于给定的图像,宽度n是一个常量,故滤波矩阵是一个常量矩阵。 设多项式回归函数拟合输出yi,…,yn的结果为4,…,4,记输出行的列向量y=(y"…,y》t,拟合行的列向量为f = (4,…,4)t,则它们满足f = Hy。 经过多次迭代的使用多项式回归,可以估计出输入图像的背景图像(假定文档背
景为白色,文档字符笔划为黑色)。 针对一行像素,估计文档图像该行背景的过程如下(l)设置初始迭代次数t = O,初始瑜出jT 二为,…,乂w =_y ; (2)对于图像的一行数据y,),…,y,),经过第t次多项式拟合,我们得到了输出f,),…,fn(t)(其中若,')〉l,则裁减为乂W"); (3)如果迭代次数满足t > T,则终止迭代并输出f,),…,fn(t)作为该行背景;
(4)按照如下规则计算y,1),…,yn(t+1):若乂(') > 乂')+△('),贝U,+"=,'),否贝U
=xw ,其中△(t)是一个噪声阈值。 (5)增加迭代次数t —t+l,返回步骤(2),开始新一轮迭代。在第(4)步中,有一个噪声阈值A(t),它可以如下设置设初始噪声为A(Q) =0.2,结束噪声为A =0,则第
t次迭代噪声AW-^A^。 上述的迭代过程是逐渐把笔划处的像素值以背景多项式行插值来替代的过程,最终输出收敛于背景行曲线。 图4示意性示出了由原始文档图像中一行像素估计背景图像中该行像素的过程,其中点线为(Xi,y,)),实线为(Xi,fi(t)),自上而下迭代次数t二0,…,6。
图5示意性示出了图1的自适应二值化设备处理文档图像的具体示例。原始文档图像如图5中的(A)所示,并且逐行估计背景得到的背景图像如图5中的(B)所示。
当然,也可以采用现有技术已知的其它方法来逐行估计背景图像。
回到图l,根据估计器101获得的背景图像和文档图像,计算器102确定像素的二值化所需的比较阈值。具体地,计算器102针对文档图像的每个像素,计算以该像素为中心的像素区域中所有像素到背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的阈值。阈值t可以表示为t = B-f (r),其中d = f (r)是与平均距离r正相关的量,B为估计的背景图像中相应像素的灰度级。所述平均距离r可以是像素区域中所有像素与估计的背景图像中对应像素的灰度级之差的平均值,但也可以是其它距离的平均值。 像素区域可以具有任意形状,例如圆形、多边形等等。优选地,像素区域可以是(2w+l) X (2w+l)的正方形。可以将像素区域的尺寸(例如宽度、长度、直径等)设置为大于某个值,使得区域内至少包含背景像素。例如,可以将像素区域的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区域沿线条方向(在本实施例中为行方向)的尺寸设置为大于平均或最大笔划宽度。在一个实施例中,像素区域的尺寸为ll个像素。
对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。 图3A示意性示出了计算器计算阈值的原理。如图3A所示,强笔划的像素与弱笔划的像素与背景图像的距离存在差别。对于每个像素,阈值的可能范围为背景图像的相应像素的灰度级到该像素的灰度级的区间之内。相应地,根据文档图像中每个像素的灰度级确定相适应的阈值,使得能够实现自适应的二值化处理。
7
可以指定各种函数f(r),只要其能够反映正相关关系。优选地,可以指定函数d二f(r) =kXr,0<k<2。在一个实施例中,k可以取值1。 进一步地,可以在确定阈值时考虑到噪声(如图3A所示)。例如,可以指定函数d=f (r) = kX (rn+|r-rn|),0 < k < 2, rn为文档图像的估计噪声。在一个实施例中,k可以取值l。 k越小,二值化后的笔划越粗,k越大,二值化后的笔划越细。 可以采用现有技术的方法来估计文档图像的噪声。图3B示出了在应用阈值时估计噪声所产生的作用。如图3B所示,在平均距离r小于估计噪声rn的区间,会导致将像素视为背景,而在平均距离r大于估计噪声rn的区间,会导致将像素视为文字。在一个实施例中,可将噪声rn假定为20或25,或20至25之间的值。 回到图l,提取器103根据计算器102确定的阈值,从文档图像中提取出二值化图像。例如,提取器103可以将文档图像的每个像素的灰度级与其相应阈值进行比较,将灰度级小于阈值的像素处理为文字像素,而将灰度级大于或等于阈值的像素处理为背景像素。提取器103提取的二值化图像如图5中的(C)所示。 作为一个具体例子,设文档图像为I,估计得到的背景图像为B,I中某像素点处的灰度级为gij(O到255之间),B中该点的灰度级为bij(O到255之间),以该点为中心的正方形窗大小为(2w+l) X (2w+l),则计算该点处的阈值计算方法为
tij = birk(rn+|rirrn|) 其中rn为文档图像中的噪声大小(rn设得越大,二值图像中的噪声越少,但弱笔划的丢失越大),r".为背景图像与文档图像邻域的差均值 得到该点处的阈值之后,比较gij和tij,若gij < tij,则该点为笔划点(纯黑色0),否则它为背景点(纯白色255)。 图2是示出根据本发明实施例的用于文档图像的自适应二值化方法的流程图。
如图2所示,方法从步骤200开始。在步骤202,根据在行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的背景图像。在步骤204,针对文档图像的一个像素,计算以该像素为中心的像素区域中所有像素到背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的阈值。在步骤206,确定是否有未计算阈值的像素。如果有,则返回步骤204继续计算。如果没有,则前进到步骤208,根据阈值从文档图像中提取出二值化图像。像素区域可以具有任意形状,例如圆形、多边形等等。优选地,像素区域可以是(2w+l) X (2w+l)的正方形。可以将像素区域的尺寸(例如宽度、长度、直径等)设置为大于某个值,使得区域内至少包含背景像素。例如,可以将像素区域的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区域沿线条方向(在本实施例中为行方向)的尺寸设置为大于平均或最大笔划宽度。在一个实施例中,像素区域的尺寸为ll个像素。对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。 对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。 所属技术领域的普通技术人员明白,本发明的实施例也适用于在文档图像中分布有沿列方向延伸的线条,并且沿列方向存在手写或打印的文字。在这样的情况下,可以以每列的像素为单位来进行背景图像估计。 此外,本发明的实施例也适用于其它文档图像灰度级范围。并且,本发明的实施例也适用于其它文档图像灰度级表示,例如灰度级255代表纯黑,灰度级0代表纯白。在这种情况下,只需要例如将灰度级表示转换成与图1的实施例一致即可。 图6是示出根据本发明优选实施例的用于文档图像的自适应二值化设备600的框图。在图6的实施例中,文档图像中包含行、列两个方向的线条背景。假定文档图像的灰度级为0到255。灰度级255代表纯白,灰度级0代表纯黑,并且文档图像具有浅灰度(即高灰度级)背景,深灰度(即低灰度级)文字。 如图6所示,自适应二值化设备600包括估计器601、计算器602、提取器603和图像合并器604。 估计器601以文档图像的每一行的像素为一组,逐行处理文档图像。在处理中,估
计器601根据行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获
得文档图像的第一背景图像。具体估计方法与前面参照估计器101描述的相同。 图8示意性示出了图6的自适应二值化设备处理文档图像的具体示例。原始文档
图像如图8中的(A)所示,并且逐行估计背景得到的第一背景图像如图8中的(B)所示。 回到图6,根据估计器601获得的第一背景图像和文档图像,计算器602确定像素
的二值化所需的第一比较阈值。具体计算方法与前面参照计算器102描述的相同。 提取器603根据计算器602确定的第一阈值,从文档图像中提取出第一二值化图
像。具体提取方法与前面参照提取器103描述的相同。第一二值化图像如图8中的(D)所示。 此外,估计器601还以文档图像的每一列的像素为一组,逐列处理文档图像。在处理中,估计器601根据列方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第二背景图像。具体估计方法与前面参照估计器101描述的相同。原始文档图像如图8中的(A)所示,并且逐列估计背景得到的第二背景图像如图8中的(C)所示。 回到图6,根据估计器601获得的第二背景图像和文档图像,计算器602还确定像素的二值化所需的第二比较阈值。具体计算方法与前面参照计算器102描述的相同。
提取器603还根据计算器602确定的第二阈值,从文档图像中提取出第二二值化图像。具体提取方法与前面参照提取器103描述的相同。第二二值化图像如图8中的(E)所示。 图像合并器604获得第一和第二二值化图像间的逻辑与图像,S卩,通过将第一和
第二二值化图像中相应像素的0或1的像素值进行逻辑与运算,得到的结果作为最终二值
化图像中相应像素的像素值。最终的二值化图像如图8中的(F)所示。 图7是示出根据本发明优选实施例的用于文档图像的自适应二值化方法的流程图。 如图7所示,方法从步骤700开始。在步骤702,根据在行方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第一背景图像。在步骤704,针对文档图像的一个像素,计算以该像素为中心的像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的第一阈值。在步骤706,确定是否有未计算第一阈值的像素。如果有,则返回步骤704继续计算。如果没有,则前进到步骤708,根据第一阈值从文档图像中提取出第一二值化图像。在步骤710,根据在列方向上文档图像的每一组像素,估计该组的每个像素的背景灰度级,以获得文档图像的第二背景图像。在步骤712,针对文档图像的一个像素,计算以该像素为中心的像素区域中所有像素到第二背景图像的平均距离r,并计算该像素的背景灰度级和与平均距离r正相关的量d之间的差t,以作为该像素的第二阈值。在步骤714,确定是否有未计算第二阈值的像素。如果有,则返回步骤712继续计算。如果没有,则前进到步骤716,根据第二阈值从文档图像中提取出第二二值化图像。在步骤718,获得第一和第二二值化图像间的逻辑与图像。像素区域可以具有任意形状,例如圆形、多边形等等。优选地,像素区域可以是(2w+l) X (2w+l)的正方形。可以将像素区域的尺寸(例如宽度、长度、直径等)设置为大于某个值,使得区域内至少包含背景像素。例如,可以将像素区域的尺寸设置为大于文字的平均或最大笔划宽度。优选地,可以将像素区域沿线条方向(在本实施例中为行方向)的尺寸设置为大于平均或最大笔划宽度。在一个实施例中,像素区域的尺寸为ll个像素。对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。 对于接近图像边界的像素,以其为中心的像素区域可能包含边界以外的部分。对于这样的情况,可以只针对像素区域内的实际像素求平均值。 虽然在图6和图7的实施例中先处理行方向再处理列方向,然而也可以先处理列方向再处理行方向。 根据本发明的实施例,能够将例如表格线的线条作为背景从文档图像中过滤掉。
此外,根据本发明的实施例,能够处理退化的弱笔划,并使强笔划和弱笔划在最终的二值化
图像中具有近似相等的宽度。此外,根据本发明的实施例,在二值化图像的空白区域中噪声
较低。此外,根据本发明的实施例,能够处理光照亮度变化的背景,以得到平滑的背景图像,
从而能够应对光线变化背景的情况。 本发明的设备和方法实现环境如图9所示。 在图9中,中央处理单元(CPU)901根据只读映射数据(ROM)902中存储的程序或从存储部分908加载到随机存取映射数据(RAM)903的程序执行各种处理。在RAM 903中,也根据需要存储当CPU 901执行各种处理等等时所需的数据。 CPU 901、ROM 902和RAM 903经由总线904彼此连接。输入/输出接口 905也连接到总线904。 下述部件连接到输入/输出接口 905 :输入部分906,包括键盘、鼠标等等;输出部分907,包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等等,和扬声器等等;存储部分908,包括硬盘等等;和通信部分909,包括网络接口卡比如LAN卡、调制解调器等等。通信部分909经由网络比如因特网执行通信处理。 根据需要,驱动器910也连接到输入/输出接口 905。可拆卸介质911比如磁盘、光盘、磁光盘、半导体映射数据等等根据需要被安装在驱动器910上,使得从中读出的计算
10机程序根据需要被安装到存储部分908中。 在通过软件实现上述步骤和处理的情况下,从网络比如因特网或存储介质比如可拆卸介质911安装构成软件的程序。 本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程序、与方法相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子包含磁盘、光盘(包含光盘只读映射数据(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)和半导体映射数据。或者,存储介质可以是ROM 902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的方法一起被分发给用户。 在前面的说明书中参照特定实施例描述了本发明。然而本领域的普通技术人员理解,在不偏离如权利要求书限定的本发明的范围的前提下可以进行各种修改和改变。
权利要求
一种用于文档图像的自适应二值化设备,包括估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
2. 如权利要求l所述的自适应二值化设备,其中,估计器还根据在行和列中的另一个方向上文档图像的每一组像素,估计该组的每个像 素的第二背景灰度级,以获得文档图像的第二背景图像,计算器还针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素 到第二背景图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的 量d之间的差,以作为该像素的第二阈值,并且提取器还根据第二阈值从文档图像中提取出第二二值化图像,其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定 尺寸,其中,所述自适应二值化设备还包括 图像合并器,获得第一和第二二值化图像间的逻辑与图像。
3. 如权利要求1或2所述的自适应二值化设备,其中,在计算第一和第二阈值时,d = kXr,O < k < 2。
4. 如权利要求1或2所述的自适应二值化设备,其中,在计算第一和第二阈值时,d = kX (rn+|r-rn|),0 < k < 2, rn为文档图像的估计噪声。
5. 如权利要求1或2所述的自适应二值化设备,其中,所述估计器通过平均值或迭代多 项式回归来进行估计。
6. —种用于文档图像的自适应二值化方法,包括根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背 景灰度级,以获得文档图像的第一背景图像;针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背 景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的 差,以作为该像素的第一阈值;禾口根据第一阈值从文档图像中提取出第一二值化图像,其中, 一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。
7. 如权利要求6所述的自适应二值化方法,还包括根据在行和列中的另一个方向上文档图像的每一组像素,估计该组的每个像素的第二 背景灰度级,以获得文档图像的第二背景图像;针对文档图像的每个像素,计算以该像素为中心的第二像素区域中所有像素到第二背景图像的平均距离r,并计算该像素的第二背景灰度级和与平均距离r正相关的量d之间的 差,以作为该像素的第二阈值;根据第二阈值从文档图像中提取出第二二值化图像;禾口获得第一和第二二值化图像间的逻辑与图像,其中,第二背景灰度级的估计所基于的像素区间和第二像素区域的尺寸大于所述预定 尺寸。
8. 如权利要求6或7所述的自适应二值化方法,其中,在计算第一和第二阈值时,d = kXr,O < k < 2。
9. 如权利要求6或7所述的自适应二值化方法,其中,在计算第一和第二阈值时,d = kX (rn+|r-rn|),0 < k < 2, rn为文档图像的估计噪声。
10. 如权利要求6或7所述的自适应二值化方法,其中,通过平均值或迭代多项式回归 来进行估计。
全文摘要
用于文档图像的自适应二值化方法和设备。自适应二值化设备包含估计器,根据在行和列中的一个方向上文档图像的每一组像素,估计该组的每个像素的第一背景灰度级,以获得文档图像的第一背景图像;计算器,针对文档图像的每个像素,计算以该像素为中心的第一像素区域中所有像素到第一背景图像的平均距离r,并计算该像素的第一背景灰度级和与平均距离r正相关的量d之间的差,以作为该像素的第一阈值;和提取器,根据第一阈值从文档图像中提取出第一二值化图像,其中,第一背景灰度级的估计所基于的像素区间和第一像素区域的尺寸大于预定尺寸。因而,能够去除文档图像中的水平竖直方向上的线条,以利于提高字符识别率。
文档编号G06K9/38GK101727583SQ20081017118
公开日2010年6月9日 申请日期2008年10月22日 优先权日2008年10月22日
发明者堀田悦伸, 孙俊, 皆川明洋, 直井聪, 藤本克仁, 郑大念 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1