一种图像的二值化方法及系统的制作方法

文档序号:6651513阅读:271来源:国知局
专利名称:一种图像的二值化方法及系统的制作方法
技术领域
本发明属于计算机信息处理领域的图像处理技术,具体涉及一种图像的二值化方法及系统。
背景技术
随着数码相机与摄像头等数码产品应用的普遍,由这些数码产品拍摄的图像的文字识别也必将得到广泛得应用。通常,文字识别首先要进行二值化,所谓的二值化,就是把彩色图像或灰度图像变为黑白图像的过程,而这种黑白图像的每个象素以1比特被编码。二值化的方法大体上可以分为全局阈值法和局部阈值法,也有一些两者结合的做法。全局阈值法是指对整幅图像选取单一的阈值进行二值化。局部阈值法指把图像分成若干区域,对每一个区域或每一个象素点设定阈值,然后逐点对图像二值化。全局阈值方法的计算速度较快,发展的也比较成熟。如以Otso方法为基础的“一种二值化的方法”[中国专利申请号CN200510080050.6,2005年11月9日公开],对于处理大多数的扫描仪输入的图像已经达到了很好的效果,但是由于数码相机或摄像头拍摄的图像因光照、拍摄角度等原因,造成图像背景深度严重的不均匀,用全局阈值法效果不尽人意。另一方面,局部阈值法仅考虑象素点的邻域特性,以Bernsen法为例,该算法以局部窗口的最大、最小值平均为象素点的阈值,因此,当窗口内象素均为背景或笔划,而其灰度又不均匀时就得到错误的二值化结果,因此出现伪影现象。有些局部阈值法采用子图像形式,如“基于局部最大方差分割的图像二值化算法”[姚宇华等,微型电脑应用,2003年第19卷第8期],其对于子图像的阈值求取依赖子图像直方图的双峰特性,然而数码相机拍摄的图像,一般背景与前景的对比不突出,大部分子图像直方图都是单峰的,因此上述方法对于数码相机图像不适用。还有一些结合局部与全局的方法,如“基于目标边缘的图像二值化方法研究”[郑浩等,计量技术,2002年第4期]中描述了一种基于边缘检测的二值化方法,但其二值化效果受差分算子的选择的影响较大,且求取边缘时,速度较慢。

发明内容
针对现有技术中存在的缺陷,本发明的目的是提供一种图像的二值化方法及系统,该方法及系统能够很好的解决由数码相机等拍摄的图像,因为光照等问题引起的背景深度不均匀的问题。同时,本发明利用扫描图像时直接得到的象素之间的跳变信息来判断图像块的前景、背景属性,加上三个等级特征的相互参考,对象素的前景、背景判断快速、准确,从而最终能够获得适合OCR识别的黑白图像。
为达到以上目的,本发明采用的技术方案是一种图像的二值化方法,包括以下步骤(1)将输入的文档转换为数字图像数据;(2)首先将图像按三个等级分块,分别为整体级、子图像区域级、象素区域级,然后扫描统计三个等级各块的特征值;(3)计算出整体级和子图像区域级各块的阈值;(4)根据步骤(2)和步骤(3)得到的数据对子图像区域级的特征值进行修正;(5)根据修正后的特征值对图像逐点二值化。
更进一步,为使本发明具有更好的效果,步骤(2)中,所述的整体级是整幅图像为一个块,子图像区域级是将图像分成若干个子图像,所述的子图像是固定大小的,或者是根据整体级图像的大小,按比例确定,每一个子图像块不小于128×128个象素点;象素区域级是以n*n的象素点阵为一块,其中n为正整数,n小于等于16。
步骤(2)中,扫描统计三个等级各块的特征值是按如下方法实现的依次扫描每一个象素点,对于每一个象素点,根据其所在图像的位置,确定其在各级上分别属于哪个块,然后将此象素的特征参与到其所属的各级块的特征统计中。
再进一步,步骤2)中所述的各等级块的特征值包括子图像中每一块的灰度直方图、最大灰度值、最小灰度值、跳变灰度平均值、灰度跳变较大的象素数;上述特征值中的灰度跳变是这样求取的比较当前象素点与其隔行或隔列象素点的灰度值,如果足够大,灰度跳变象素数加1,将每一个灰度差值累加,扫描完本块内所有象素后,累加的灰度差值与灰度跳变象素数的商为该块的灰度跳变均值。
步骤2)中灰度跳变的求取过程中,不是每两个象素的灰度差异都要累加,本发明首先设定一个基础跳变值,只有两象素灰度差异大于基础跳变值的才参与累加计算,所述的基础跳变值的经验值在5-8之间。
进一步,步骤(3)中,运用各级统计出的灰度直方图,用大津法求出整幅图像和子图像级中每一块图像的阈值。
进一步,步骤(4)中根据步骤(2)和步骤(3)得到的数据对子图像区域级的特征值进行修正的方法包括以下步骤a.首先,设定一个参考跳变值。以子图像区域级二值化阈值为横坐标,子图像区域级跳变值为纵坐标,将子图像划分在不同的区域中;b.然后,对不同区域的子图像采取不同的分析方法;进一步的,所述的分析方法如下a)图像前景、背景交替较少并且背景比重较多的图像,首先选择该子图像周围跳变值较大的图像,用这些跳变较大的子图像的平均二值化阈值做为该子图像的二值化阈值。如果该子图像块周围没有满足条件的其他子图像块,那么就判断一下该子图像块是否纯粹的背景块,如果是,就令该子图像块的二值化阈值为该子图像块最小灰度值-1,即二值化后,该图像块没有前景象素。否则,令整体级阈值为该子图像块的二值化阈值。
b)对于可能存在部分连续的背景或前景的子图像,参考象素区域级跳变重新扫描统计数据。
进一步的,本发明所述的重新扫描过程中,首先确定一个最小精确跳变值,然后找到包含在子图像级块内的所有象素级块,只有满足大于精确跳变值的象素级块才参与重新扫描、统计数据。如果没有足够的满足条件的象素级块参与统计,那么就按1)的方法处理。与1)方法中处理不同的是,如果子图像周围没有用于计算阈值的满足条件的其他子图像,阈值不作修改。
c)对于前景、背景交替较多的子图像,不予修改。
步骤(5)中二值转化的方法包括以下步骤(a)首先确定象素二值化主要遵循的3条规则即①灰度值越大,则说明象素点的颜色越淡,倾向于判断为背景,反之亦然;②象素所属子图像区域级的子图像块内跳变越大,说明前景、背景变换越强烈,含有带识别文字较多。③象素级块内跳变越大,说明象素属于边缘象素的可能性较大。
(b)利用上述规则,对每一个象素做前景、背景判断。
一种图像的二值化系统,包括以下装置图像输入装置、分块扫描装置、阈值求取装置、数据分析装置及二值转化装置和输出装置;其中,图像输入装置用于将输入的文档转换为数字图像数据;分块扫描装置用于将图像按三个等级分块并扫描统计三个等级各块的特征值,所述的三个等级分块分别为整体级、子图像区域级、象素区域级;阈值求取装置用于计算出整体级和子图像区域级各块的阈值;数据分析装置用于根据分块扫描装置和阈值求取装置得到各种特征值,对子图像区域级的特征值进行修正;二值转化装置用于将原始图像转换为黑白二值的图像文件;输出装置用于输出已被转换黑白二值的图像文件。
本发明的效果在于采用本发明所述的方法,可准确快速的由灰度图像得到适合于OCR识别的黑白图像,尤其适用于用数码相机、摄像头等拍摄的,由于拍摄角度、光线、阴影等造成的背景色不均的图像的二值化。


图1是根据本发明所述系统的总体框图;图2是本发明实施例中进行特征统计的流程图;图3是本发明实施例中数据分析的特征区域图;图4是本发明实施例中一个象素点二值化的流程图;图5是本发明所述方法与其他方法的效果对比图,其中a、b、c分别是灰度图、大津法效果图、本发明效果图。
具体实施例方式
下面结合附图及具体实施方式
对本发明作进一步的描述。
如图1所示,一种图像的二值化系统,包括图像特征统计分析部分和逐点二值化部分,具体包括以下装置图像输入装置、分块扫描装置、阈值求取装置、数据分析装置及二值转化装置和输出装置。
其中,图像特征统计分析部分包括图像输入装置,它可以是扫描仪、传真机或数码相机等图像输入装置,尤其适用于数码相机或摄像头拍摄的图像。还包括扫描装置、阈值求取装置、数据分析装置。
其中,图像输入装置用于将输入的文档转换为数字图像数据;分块扫描装置用于将图像按三个等级分块并扫描统计三个等级各块的特征值,所述的三个等级分块分别为整体级、子图像区域级、象素区域级;阈值求取装置用于计算出整体级和子图像区域级各块的阈值;数据分析装置用于根据分块扫描装置和阈值求取装置得到各种特征值,对子图像区域级的特征值进行修正;二值转化装置用于将原始图像转换为黑白二值的图像文件;输出装置用于输出已被转换黑白二值的图像文件。
一种图像的二值化方法,包括以下步骤(1)将输入文档转换为数字图像数据,所述的文档可以是打印文档、手写文档或其他形式的文档;(2)首先将图像按三个等级分块,分别为整体级、子图像区域级、象素区域级,然后扫描统计三个等级各块的特征值;1)首先将图像按三个等级分块,第一个等级为整体级,即整幅图像为一个块;第二个等级为子图像区域级,将图像分成同等大小的几个子图像,如,将图像分成10×10。因为每一子图像块需要由大津法计算二值化阈值,因此每个子图像块不能过小,在图像比较小的情况下,减少子图像块数目,令每一个子图像块不小于128×128个象素点。第三个等级为象素区域级,如8×8的象素点阵为一块。
2)然后,依次扫描每一个象素点。如图2所示,步骤(2)通过扫描装置逐点统计图像上的点,根据各点的灰度值记录统计分析时需要的数据是按以下方法实现的。
对于每一个象素点,根据其所在图像的位置,确定其在各级上分别属于哪个块,然后将此象素的特征参与到其所属的各级块的特征统计中。因为所有象素在第一等级上均属于同一块,扫描时不必统计整体级的特征,扫描后由子图像级的特征累加即可得到整体级的统计值。因此扫描过程中只统计子图像级与象素级的特征值。
上述方法中的特征值包括子图像中每一块的灰度直方图、最大灰度值、最小灰度值、跳变灰度平均值、灰度跳变较大的象素数等。
上述特征值中的灰度跳变是这样求取的比较当前象素点与其隔行(或隔列)象素点的灰度值,如果足够大,灰度跳变象素数加1,将每一个灰度差值累加,扫描完本块内所有象素后,累加的灰度差值与灰度跳变象素数的商为该块的灰度跳变均值。上述比较的两个象素也可以是相邻的,但是隔行或隔列的两象素之间在边界上跳变更明显,而对于非边界则差异较小,因此效果更好。
上述灰度跳变的求取过程中,不是每两个象素的灰度差异都要累加,因为相近的同属背景或前景的两象素之间也会有微小的差异,如果将这些微小的差异累加,与边界间象素的差异共同参与跳变的计算,必定会抹煞跳变特征的突出性,因此,本发明首先设定一个基础跳变值(基础跳变值的经验值在5-8之间),两象素灰度差异大于基础跳变值的才参与累加计算。
本发明所述的扫描过程中,不必每一个象素都统计,实践证明,隔行、隔列的抽取统计象素不会影响整块的各种特征值,而且大大的减少了扫描时间。
(3)计算出整体级和子图像区域级各块的阈值;本实施例中,运用各级统计出的灰度直方图,用大津法求出整幅图像和子图像级中每一块图像的阈值,当然,也可采用其他求取阈值的方法,比如平均灰度阈值法、数学期望法等。
(4)根据步骤(2)和步骤(3)得到的数据对子图像区域级的特征值进行修正;本发明所述的数据分析的过程就是进一步使子图像级二值化阈值精确的过程。数据分析装置输入的参数是扫描装置和阈值求取装置中得到的图像各个级的特征值,输出的是子图像级每一块子图像相对精确的二值化阈值。首先,设定一个参考跳变值(经验值为整体级平均跳变值与基础跳变值的平均值)。以子图像区域级二值化阈值为横坐标,子图像区域级跳变值为纵坐标,将子图像划分在不同的区域中。图3示出按照本发明一个实施例数据分析过程中用到的特征区域图。从图3可以看到,根据子图像二值化阈值与跳变值的不同,子图像被分在3个不同的区域。本发明将对3个区域的子图像采取不同的分析方法。
首先,A区域的子图像跳变较小,二值化阈值偏高,则图像前景、背景交替较少并且背景比重较多,对于这种特征的图像,大津法计算得到的区域的阈值通常偏高,按此阈值二值化得到的图像就会产生很多污点。对于A区域的子图像,我们首先选择该子图像周围跳变值较大的图像,用这些跳变较大的子图像的平均二值化阈值做为该子图像的二值化阈值。如果该子图像块周围没有满足条件的其他子图像块,那么就判断一下该子图像决是否纯粹的背景块,如果是,就令该子图像块的二值化阈值为该子图像块最小灰度值-1,即二值化后,该图像块没有前景象素。
本发明所述的纯粹背景块的判断如下,首先,子图像块的跳变阈值要较小,满足小于基本跳变值与参考跳变值的均值,其次,子图像的最小象素值要小于整体级二值化阈值,子图像的最大象素值要大于整体级二值化阈值。
如果不能满足上述两个条件,令整体级阈值为该子图像块的二值化阈值。
B区域的子图像跳变低于整体级跳变,说明该区域可能存在部分连续的背景或前景,因此,对于该区域的子图像,要参考象素区域级跳变重新扫描统计数据。
本发明所述的重新扫描过程如下首先确定一个最小精确跳变值,认为大于该精确跳变值的象素级块中存在足够的前背景交替,最小精确跳变值取在参考跳变值与整体级平均跳变值之间。
然后找到包含在子图像级块内的所有象素级块,将满足大于精确跳变值的象素级块重新扫描,统计数据,根据直方图重新用大津法计算二值化阈值作为该子图像块的阈值。
如果没有足够的满足条件的象素级块参与统计,那么就像A区域的子图像一样,选择子图像周围跳变值较大的图像,用这些跳变较大的子图像的平均二值化阈值做为该子图像的二值化阈值。与A区域子图像处理不同的是,如果子图像周围没有用于计算阈值的满足条件的其他子图像,阈值不作修改。
C区域的子图像跳变值较高,认为这个区域的子图像前景、背景交替较多,等同于包含很多的文本信息的区域,因此大津法计算得到的阈值较准确,不予修改。
(5)二值转化装置对图像逐点二值化,即将灰度图像转换为黑白二值的图像文件。
本发明所述的象素二值化的流程主要遵循下列规则1.灰度值越大,则说明象素点的颜色越淡,倾向于判断为背景,反之亦然。
2.象素所属子图像区域级的子图像块内跳变越大,说明前景、背景变换越强烈,含有带识别文字较多。
3.象素级块内跳变越大,说明象素属于边缘象素的可能性较大。
如图4所示,一个象素二值化判断的流程如下首先,根据以求取阈值装置输出的整体级阈值为中心,划出一个隔离带,隔离带的上沿为整体级的最大阈值,下沿为整体级的最小阈值。令最大、最小阈值分别为Max_T,Min_T,整体级阈值为Whole_T,那么
Max_T=Whole_T×(1+α),Min_T=Whole_T×(1-α),其中α为一个固定的系数,经验值为0.4。
根据现有的数据,可进行二值化的部分图像象素有下列几种情况1.灰度值大于整体级最大阈值的,判断为背景象素;2.灰度值小于整体级最小阈值,子图像级块内灰度跳变较小(防止阴影区域的文字背景误判),且子图像级块的最大灰度大于阈值(防止无前景阴影区域误判)的象素,判断为前景象素。
3.灰度值大于整体级阈值,象素级灰度跳变较小,且象素级最大、最小灰度差较小的,判断为背景象素。
如果象素不属于上述三种情况,就根据双线性差值求出象素级阈值。首先找出距离本象素点最近的四个子图像级的子图像块,认为每个子图像块的子图像级阈值为该图像块中心点象素的二值化阈值,设四个中心点的阈值分别为TTL、TTR、TBL、TBR、WT、WB、WL、WR为对该象素点影响度的权值,则该象素点的阈值为T=WT×(TTL×WL+TTR×WR)+WB×(TBL×WL+TBR×WR);其中,上述权值由象素点到以四个中心点为顶点的长方形(或正方形)上、下、左、右各边的距离计算得到,与距离成反比。
根据象素点阈值与前期统计的其他特征值,大部分象素的二值化结果就都可以确定了。主要包括下述情况1.如果象素灰度值与象素点阈值相差较大,则象素灰度值大于阈值的判断为背景,反之判断为前景。
2.如果象素灰度值与象素点阈值相差不大,象素级灰度跳变较小,象素级最大灰度值与最小灰度值的差别也很小,说明该象素级区域存在边界的可能性较小,如果该象素点的灰度值大于最大、最小灰度值的平均值,则判断为背景。
3.若象素灰度值与象素点阈值差别很小,又不满足上述条件,就要求取该象素的跳变状态,来确定象素应该判为背景还是前景。
在步骤求取该象素的跳变状态中,设HT、HB、HL、HR分别为该象素相邻的上、下、左、右象素与该象素本身的灰度差,若任意灰度差大于基础跳变与一个系数(经验值为1.5~2)的乘积,则认为该象素属于边缘象素,要根据跳变状态来确定,否则直接根据象素级阈值判断。
确定为边缘象素的通过下述几种情况来判断1.若HT、HB、HL、HR的和大于两倍的基础跳变,说明该象素是较周边象素颜色较深的,判断为前景;
2.若HT、HB、HL、HR的和小于负的基础跳变的两倍,说明该象素是较周边象素颜色较浅的,判断为背景;若不能满足上述两个条件,则用象素级最大值与最小值的平均值做为该象素的二值化阈值。
实验结果表明,通过采用本发明,二值化后的图像能够很好的规避由于拍摄角度不同对图像造成的背景深浅不一致问题,且与其他复杂的区域二值化相比速度相对较快。
由此看来,本发明起到了显著的优化作用。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种图像的二值化方法,包括以下步骤(1)将输入的文档转换为数字图像数据;(2)首先将图像按三个等级分块,分别为整体级、子图像区域级、象素区域级,然后扫描统计三个等级各块的特征值;(3)计算出整体级和子图像区域级各块的阈值;(4)根据步骤(2)和步骤(3)得到的数据对子图像区域级的特征值进行修正;(5)根据修正后的特征值对图像逐点二值化。
2.如权利要求1所述的一种图像的二值化方法,其特征是步骤(2)中,所述的整体级是整幅图像为一个块,子图像区域级是将图像分成若干个子图像,所述的子图像是固定大小的,或者是根据整体级图像的大小,按比例确定,每一个子图像块不小于128×128个象素点;象素区域级是以n*n的象素点阵为一块,其中n为正整数,n小于等于16。
3.如权利要求1所述的一种图像的二值化方法,其特征是步骤(2)中,扫描统计三个等级各块的特征值是按如下方法实现的依次扫描每一个象素点,对于每一个象素点,根据其所在图像的位置,确定其在各级上分别属于哪个块,然后将此象素的特征参与到其所属的各级块的特征统计中。
4.如权利要求2所述的一种图像的二值化方法,其特征是步骤2)中所述的各等级块的特征值包括子图像中每一块的灰度直方图、最大灰度值、最小灰度值、跳变灰度平均值、灰度跳变较大的象素数。
5.如权利要求4所述的一种图像的二值化方法,其特征是上述特征值中的灰度跳变是这样求取的比较当前象素点与其隔行或隔列象素点的灰度值,如果足够大,灰度跳变象素数加1,将每一个灰度差值累加,扫描完本块内所有象素后,累加的灰度差值与灰度跳变象素数的商为该块的灰度跳变均值。
6.如权利要求5所述的一种图像的二值化方法,其特征是步骤2)中灰度跳变的求取过程中,首先设定一个基础跳变值,只有两象素灰度差异大于基础跳变值的才参与累加计算,所述的基础跳变值的经验值在5-8之间。
7.如权利要求1、2、3、4、5或6所述的一种图像的二值化方法,其特征是步骤(3)中,运用各级统计出的灰度直方图,用大津法求出整幅图像和子图像级中每一块图像的阈值。
8.如权利要求1、2、3、4、5或6所述的一种图像的二值化方法,其特征是步骤(4)中根据步骤(2)和步骤(3)得到的数据对子图像区域级的特征值进行修正的方法包括以下步骤a.首先,设定一个参考跳变值,以子图像区域级二值化阈值为横坐标,子图像区域级跳变值为纵坐标,将子图像划分在不同的区域中;b.然后,对不同区域的子图像采取不同的分析方法;进一步的,上述的分析方法如下a)图像前景、背景交替较少并且背景比重较多的图像,首先选择该子图像周围跳变值较大的图像,用这些跳变较大的子图像的平均二值化阈值做为该子图像的二值化阈值,如果该子图像块周围没有满足条件的其他子图像块,那么就判断一下该子图像块是否纯粹的背景块,如果是,就令该子图像块的二值化阈值为该子图像块最小灰度值-1,即二值化后,该图像块没有前景象素。否则,令整体级阈值为该子图像块的二值化阈值;b)对于可能存在部分连续的背景或前景的子图像,参考象素区域级跳变重新扫描统计数据;进一步的,本发明所述的重新扫描过程中,首先确定一个最小精确跳变值,然后找到包含在子图像级块内的所有象素级块,只有满足大于精确跳变值的象素级块才参与重新扭描、统计数据,如果没有足够的满足条件的象素级块参与统计,那么就按a)的方法处理,与a)方法中处理不同的是,如果子图像周围没有用于计算阈值的满足条件的其他子图像,阈值不作修改;c)对于前景、背景交替较多的子图像,不予修改。
9.如权利要求1、2、3、4、5或6所述的一种图像的二值化方法,其特征是步骤(5)中二值转化的方法包括以下步骤(a)首先确定象素二值化主要遵循的3条规则即①灰度值越大,则说明象素点的颜色越淡,倾向于判断为背景,反之亦然;②象素所属子图像区域级的子图像块内跳变越大,说明前景、背景变换越强烈,含有带识别文字较多;③象素级块内跳变越大,说明象素属于边缘象素的可能性较大;(b)利用上述规则,对每一个象素做前景、背景判断。
10.一种图像的二值化系统,包括以下装置图像输入装置、分块扫描装置、阈值求取装置、数据分析装置及二值转化装置和输出装置;其中,图像输入装置用于将输入的文档转换为数字图像数据;分块扫描装置用于将图像按三个等级分块并扫描统计三个等级各块的特征值,所述的三个等级分块分别为整体级、子图像区域级、象素区域级;阈值求取装置用于计算出整体级和子图像区域级各块的阈值;数据分析装置用于根据分块扫描装置和阈值求取装置得到各种特征值,对子图像区域级的特征值进行修正;二值转化装置用于将原始图像转换为黑白二值的图像文件;输出装置用于输出已被转换黑白二值的图像文件。
全文摘要
本发明涉及一种图像的二值化系统及方法,属于计算机信息处理领域的图像处理技术。现有技术中,对于扫描仪输入的图像的二值化方法已经很成熟,但是对于数码相机或摄像头拍摄的图像,还存在伪影、计算复杂等问题。本发明所述的二值化方法按统计的象素范围将对图像的统计数据分为三个等级,并且提出了根据跳变确定图像区域的属性的方法,最后以上述统计的各级特征值为依据,对每个象素点进行二值转换。本发明所述二值化系统包括分块扫描装置、阈值求取装置、数据分析装置和二值转化装置。采用本发明所述的方法,统计快捷,精确度高。尤其用于数码相机拍摄的图像,二值化效果优于其他方法。
文档编号G06K9/38GK1790378SQ20051013237
公开日2006年6月21日 申请日期2005年12月21日 优先权日2005年12月21日
发明者刘芝, 康凯 申请人:北大方正集团有限公司, 北京北大方正技术研究院有限公司, 北京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1