一种图像二值化的方法

文档序号：6626110阅读：209来源：国知局

专利名称：一种图像二值化的方法
技术领域：
本发明涉及计算机信息处理领域的图像处理技术，具体涉及一种图像二值化的方法。
背景技术：
图像二值化是一种非常有用的图像处理技术，用来将灰度图像转化为单色图像。对图像进行二值化，可以有效缩减图像占用的存储空间，方便传输；同时很多相关技术必须使用二值化后的图像，如文字识别(OCR)。图像二值化的质量好坏，不仅影响到图像的主观质量评价，还会直接影响到后续处理环节，比如会直接影响到OCR的识别率。
现有技术中，图像二值化基本思路是通过确定一个域值，对图像中的点进行逐点判定，小于(或等于)域值的为黑点，大于域值的为白点。因此二值化的关键在于域值的确定。二值化域值的确定一般是通过图像的灰度直方图运算得到的，基本思路是将图像中的点分为两类，找最小误判概率下的二值化域值。文献“图像二值化算法研究及其实现”[科技情报开发与经济，2004年第14卷第12期，作者吕俊哲]较好地总结了二值化域值选取的方法。还有很多文献涉及到多域值选取方法，全局和局部域值选取方法，以及相应的改进策略，如文献“一种改进的文本图像二值化算法”[计算机工程，第29卷第13期，2003年8月，作者陈丹等]描述了局域域值的一种改进方法，再如专利“图像二值化的方法”[中国专利申请号00808969.8]描述了多灰度级的图像二值化方法，专利“灰度图像二值化处理系统和方法”[中国专利申请号98119135]描述了一种根据邻居点确定局域域值方法。
一般的数字化设备产生的数字化图像，其灰度直方图多数表现为没有偏移的正常的双峰、或多峰特征，现有技术能够较好地处理这类图像。但当数字图像的灰度直方图产生偏移，使颜色明显偏浅或偏深，表现在灰度直方图中，即最左侧或最右侧出现异常高峰时，现有技术处理的二值化结果会导致图像过深或过浅，导致前景/背景不能有效分离而使图像质量下降。这种下降将极大影响主观评价或影响后续的处理过程，如导致文字识别率下降。

发明内容
针对现有技术中对图像二值化的不足，本发明的目的是提出一种改进的图像二值化方法，该方法对直方图发生偏移的图像能有较好的二值化结果，从而使图像主观质量提高，并能有效提高OCR的识别率。
为实现以上目的，本发明采用的技术方案是一种图像二值化的方法，包括以下步骤(1)首先统计待处理的数字图像的灰度等级直方图；(2)检查灰度直方图是否存在偏移，对偏移的直方图进行直方图边缘补偿，对补偿后的直方图求二值化域值；(3)对图像按域值进行二值化。
在步骤(1)中，设灰度等级为N，得到的统计直方图为H[N]，统计直方图中每一个元素H[n]表示该图像中灰度等级为n的像素个数，其中n＝0，1，...N-1。
在步骤(2)中，通过检查直方图两个端点H
和H[N-1]数值是否明显高于同侧附近点的外推值，如果明显偏高，则可以认定直方图存在偏移，需要补偿，并对补偿后的直方图求二值化域值，具体包括下面的步骤1)取直方图左侧扣除最边界的M个数值，H[i]，i＝1，2，...，M作为外推的基准点，推测第0点的数值H1；2)计算左侧补偿系数k1＝c*H
/H1，其中c为补偿因子；3)同法取直方图右侧扣除最边界的M个数值，H[N-M+i-1]，i＝1，2，...，M作为外推的基准点，推测第N-1点的数值Hr；4)计算右侧补偿系数kr＝c*H[N-1]/Hr；5)使用变化的大津法求二值化域值，即最左侧点的矩由H
*0改变为H
*(0-k1)，而最右侧点的矩由H[N-1]*(N-1)改变为H[N-1]*(N-1+kr)，得到二值化域值d。
进一步，步骤(2)中的步骤1)和步骤3)中，外推时使用线性外推或曲线外推方法计算端点的估计值，或者使用算术平均值作为端点的估计值。步骤(2)中的步骤5)中，求二值化域值时使用双峰法、迭代法或基于矩的二值化方法。
更进一步，为使本发明具有更好的效果，在步骤(2)和步骤(3)中，求二值化的方法是全局二值化方法，或者是局部二值化方法；该方法在二值化时，能够采用单域值二值化，也能够采用多域值二值化。
本发明的效果在于采用本发明所述的方法，能对直方图发生偏移的图像能有较好的二值化结果，从而使图像主观质量提高，并能有效提高OCR的识别率。
本发明的原理是假设直方图右侧端点的高峰是因为有更高亮度的像素被截断到最大灰度等级引起的，而直方图左侧端点的高峰是因为有更低亮度的像素被截断到最小灰度等级引起的。通过对分拆右侧高峰的像素到更高亮度等级和分拆左侧高峰的像素到更低亮度等级来近似还原符合统计规律的正常峰值的直方图，使用还原后的直方图确定二值化域值，从而得到更为真实的二值化域值，最终使用该二值化域值对原图像进行二值化。

图1是本发明所述方法的流程图；图2是待处理的图像样张；图3是为图像样张的统计直方图；图4是常规的大津法二值化后的图像以及识别结果；图5是使用本发明方法的二值化后的图像以及识别结果；具体实施方式
下面结合附图和实施方式对本发明作进一步详细的描述。
如图1所示，一种改进的图像二值化方法，包括以下步骤(1)统计数字图像的灰度直方图如图2、图3所示，先对数字化以后的灰度图像(图2)统计灰度直方图(图3)，可以看到，直方图右侧存在明显高峰，本实施例中，灰度等级为256级(N＝256)；(2)根据补偿方法计算二值化域值取直方图左侧扣除最边界的M个数值，H[i]，i＝1，2，...，M作为外推的基准点，推测第0点的数值H1；取直方图右侧扣除最边界的M个数值，H[N-M+i-1]，i＝1，2，...，M作为外推的基准点，推测第N-1点的数值Hr。本实施例中，M取5，外推方法使用5点的算术平均值作为边界点的估计值。按修正后的大津法计算得到二值化域值为254；(3)对图像进行二值化如图4、图5所示，本实施例中，按全局单域值二值化方法进行二值化，得到的二值化图像如图5左侧所示。作为对比，不使用本发明的方法直接使用大津法得到的二值化域值为185，得到的二值化图像如图4左侧所示；(4)对得到的二值化图像使用OCR软件进行文字识别，图4和图5的右侧显示识别结果。
可以看到，本发明的图像二值化明显提高了图像的质量，文字的断笔明显减少，而输出结果给OCR软件使用时，能有效提高识别率。
本发明所述的方法并不限于具体实施方式
中所述的实施例，本领域技术人员根据本发明的技术方案得出其他的实施方式，同样属于本发明的技术创新范围。
权利要求
1.一种图像二值化的方法，包括以下步骤(1) 首先统计待处理的数字图像的灰度等级直方图；(2) 检查灰度直方图是否存在偏移，对偏移的直方图进行直方图边缘补偿，对补偿后的直方图求二值化域值；(3) 对图像按域值进行二值化。
2.如权利要求1所述的一种图像二值化的方法，其特征是在步骤1中，设灰度等级为N，得到的统计直方图为H[N]，统计直方图中每一个元素H[n]表示该图像中灰度等级为n的像素个数，其中n＝0，1，...，N-1。
3.如权利要求1所述的一种图像二值化的方法，其特征是在步骤2中，通过检查直方图两个端点H
和H[N-1]数值是否明显高于同侧附近点的外推值，如果明显偏高，则可以认定直方图存在偏移，需要补偿，并对补偿后的直方图求二值化域值，具体包括下面的步骤1)取直方图左侧扣除最边界的M个数值，H[i]，i＝1，2，...，M作为外推的基准点，推测第0点的数值H1；2)计算左侧补偿系数k1＝c*H
/H1，其中c为补偿因子；3)同法取直方图右侧扣除最边界的M个数值，H[N-M+i-1]，i＝1，2，...，M作为外推的基准点，推测第N-1点的数值Hr；4)计算右侧补偿系数kr＝c*H[N-1]/Hr；5)使用变化的大津法求二值化域值，即最左侧点的矩由H
*0改变为H
*(0-k1)，而最右侧点的矩由H[N-1]*(N-1)改变为H[N-1]*(N-1+kr)，得到二值化域值d。
4.如权利要求3所述的一种图像二值化的方法，其特征是在步骤(2)中的步骤1)和步骤3)中，外推时使用线性外推或曲线外推方法计算端点的估计值，或者使用算术平均值作为端点的估计值。
5.如权利要求3所述的一种图像二值化的方法，其特征是在步骤(2)中的步骤5)中，求二值化域值时使用双峰法、迭代法或基于矩的二值化方法。
6.如权利要求1所述的一种图像二值化的方法，其特征是求二值化的方法是全局二值化方法，或者是局部二值化方法。
7.如权利要求1所述的一种图像二值化的方法，其特征是该方法在二值化时，能够采用单域值二值化，也能够采用多域值二值化。
全文摘要
本发明涉及计算机信息处理领域的图像处理技术，具体涉及一种图像二值化的方法。现有技术中，通过计算机系统对数字化的图像进行二值化方法时，处理灰度直方图为正常的双峰图像一般效果比较好，但当双峰出现明显的偏移，如图像的亮度过高时，往往导致二值化域值选择不能准确而导致二值化后的图像过浅或过深，从而影响到后面对图像的继续处理，如进行文字识别。本发明所述的方法通过对二值化图像的灰度直方图进行补偿，再使用常规的二值化域值确定方法，使二值化后的图像质量提高。采用本发明所述的方法，可以有效提高灰度直方图中双峰偏移的图像的二值化效果。
文档编号G06K9/38GK1694119SQ200510080050
公开日2005年11月9日申请日期2005年6月28日优先权日2005年6月28日
发明者徐剑波, 康凯申请人:北大方正集团有限公司, 北京北大方正技术研究院有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐剑波;康凯
技术所有人：北大方正集团有限公司;北京北大方正技术研究院有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。