基于像素邻域特征的自适应文字图像的二值化处理方法

文档序号：6564987阅读：678来源：国知局

专利名称：基于像素邻域特征的自适应文字图像的二值化处理方法
技术领域：
本发明涉及一种文字图像的二值化处理方法，具体来说，它涉及一种利用全局和局部阈值对基于像素邻域特征的自适应文字图像的二值化处理方法。
背景技术：
二值化是数字图像处理技术中的一项基本技术，也是许多图像处理技术的预处理技术，在自动目标识别(ATR)、图象分析、文本增强和光学字符识别(OCR)等图像处理中得到广泛应用。现有的二值化方法大多属于阈值化方法，而在不同的应用中，阈值的选取决定着图像特征信息的保留。因此，自动阈值选取的方法非常值得研究，好的自动阈值选取方法不仅能够保留图像中有用的信息，而且还可以减少时间上的开销。图像二值化技术的关键在于如何选取阈值，根据其对像素的处理方式，主要分为
三类(1)全局阈值法整个图像采用单一阈值T (全局阈值)进行图像二值化。一般由图像的直方图或灰度的空间分布确定一个全局阈值T，将图像中每个像素的灰度值与T进行比较。若大于T，则取为前景色；否则，取为背景色。典型的全局阈值法有Ostu法、最大熵方法等。全局阈值法在目标和背景灰度相差较明显时效果比较突出，但是这种方法往往容易忽略细节，当图像中存在较多的阴影或者图像灰度变化比较复杂时往往很难得到理想的效果。(2)局部阈值法由当前像素灰度值与该像素周围点灰度特征来确定像素的阈值。通过定义考察点的邻域，并由邻域计算模板实现考察点灰度与邻域点的比较。典型的局部阈值法有Bernsen法、Nilblack法等。局部阈值法能够适应较为复杂的情况，比全局阈值法有更为广泛的应用。但它们往往忽略了图像的边界特征信息，使得原图像中的一些不同区域在二值化后变成了一块大区域，造成二值化结果图像某些重要信息的丢失。而在一些如医学图像分割和颗粒分析等应用中，往往需要结果图像能够较好地保留边界特征信息，这对后续的图像分析是非常重要的。(3)动态阈值法当光照不均勻或者背景灰度变化较大等情况时，必须根据像素的坐标位置关系自动确定不同阈值，实施动态的阈值确定。该法的阈值选择不仅取决于该像素及周围像素的灰度值，而且还与该像素的坐标位置有关。动态阈值二值化能够处理品质较差的图像甚至单峰直方图，但因为动态阈值化方法常常需要对图像中每个像素点都计算阈值，即对整幅图像求出一个阈值面(通常是曲面)计算量很大，运算速度一般比较慢，由于具有比较费时和某些失真的缺点，这在一定程度上阻碍其发展。迭代法是较为常见的一种动态阈值确定技术。

发明内容
针对以上的不足，本发明提供了一种利用全局和局部阈值对基于像素邻域特征的自适应文字图像的二值化处理方法，它包括
a)对文本图像进行全局亮度调整，提高文本图像中目标字符与背景的灰度对比度；b)自适应选取邻域计算模板的大小；c)根据选取的领域计算模板的大小将文本图像的文字信息分成文字块；d)采用全局与局部阈值结合的方法对每个文字块进行逐点二值化处理。所述步骤a)与步骤b)之间还包括步骤ab)采用双三次插值算法对文本图像进行缩放处理。所述步骤a)包括al)定义文本图像的任意一点处的像素值为该点的亮度值Y，对亮度值Y进行归一化处理，I表示归一化后该点的亮度值，I = Y/255 ；a2)计算图像整体的灰度平均值Ial，
权利要求
1.一种基于像素邻域特征的自适应文字图像的二值化处理方法，其特征在于，它包括a)对文本图像进行全局亮度调整，提高文本图像中目标字符与背景的灰度对比度；b)自适应选取邻域计算模板的大小；c)根据选取的领域计算模板的大小将文本图像的文字信息分成文字块；d)采用全局与局部阈值结合的方法对每个文字块进行逐点二值化处理。
2.根据权利要求1所述的基于像素邻域特征的自适应文字图像的二值化处理方法，其特征在于，所述步骤a)与步骤b)之间还包括步骤ab)采用双三次插值算法对文本图像进行缩放处理。
3.根据权利要求1所述的基于像素邻域特征的自适应文字图像的二值化处理方法，其特征在于，所述步骤a)包括al)定义文本图像的任意一点处的像素值为该点的亮度值Y，对亮度值Y进行归一化处理，I表示归一化后该点的亮度值，
4.根据权利要求1所述的基于像素邻域特征的自适应文字图像的二值化处理方法，其特征在于，所述步骤b)包括bl)定义文本图像中的最大和最小灰度值分别为rmax和rmin，全局阈值初值为
5.根据权利要求4所述的基于像素邻域特征的自适应文字图像的二值化处理方法，其特征在于，所述步骤d)包括dl)比较考察点(x，y)的灰度值f(x，y)与全局阈值Tk+1，如果考察点(x，y)的灰度值 f(x，y)小于或等于Tk+1，则转到d2)；否则，目标像素点灰度值g(x，y)的值为255，继续扫描下一点，并转到dl)；d2)求出以考察点为中心的模板内的平均灰度avg(X，y)； d3)比较考察点的灰度值f(x，y)与由步骤d2)得到的平均灰度avg(X，y)，如果考察点的灰度值f(x，y)大于平均灰度avg(x，y)，那么目标像素点灰度值g(x，y)的值为255，否则目标像素点灰度值g(x，y)为0，继续扫描下一点，并转到dl)。
全文摘要
本发明公开了一种利用全局和局部阈值对基于像素邻域特征的自适应文字图像的二值化处理方法，首先，对文本图像进行全局亮度调整，增加图像中较暗部分的比重，提高文本图像中目标字符与背景的灰度对比度；然后，采用双三次插值算法对文本图像进行缩放处理，增大字符笔画之间的空隙；接着，统计目标字符的笔画宽度d，从而确定邻域计算模板的大小w；再根据确定的领域计算模板的大小将文本图像的文字信息分成文字块；最后，采用全局与局部阈值结合的方法对每个文字块进行逐点二值化处理。本发明能有效地使文字笔画从背景中分割出来，避免断笔、伪影等现象，保持笔画的连通性，而且减少对文本图像中像素点计算局部阈值的情况，极大提高运算速度。
文档编号G06K9/38GK102289668SQ20111026414
公开日2011年12月21日申请日期2011年9月7日优先权日2011年9月7日
发明者朱雄泳, 杨劲, 谭洪舟申请人:朱雄泳, 杨劲, 谭洪舟

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谭洪舟;朱雄泳;杨劲
技术所有人：谭洪舟;朱雄泳;杨劲
我是此专利的发明人

上一篇：一种基于错误传播网络的回归测试用例排序方法
上一篇：一种基于隐形意识的个人身份验证系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。