一种文本图像二值化的优化方法

文档序号：8544046阅读：705来源：国知局

一种文本图像二值化的优化方法
【技术领域】
[0001] 本发明设及一种文本图像的二值化优化方法，属于图像处理领域。
【背景技术】
[0002] 目前纸质的文献资料随着时间的发展越来越多，需要占用越来越多的地方来存放，且使用捜索起来也不方便，因此需要将其数字化后存储W便于传播、管理与应用。文本图像的数字化，需要对字符进行分割、识别等步骤，而在进行该些操作之前，需要对文本图像进行二值化，二值化的准确度直接影响着随后的分析、识别等步骤能否顺利进行，所W，文本图像的二值化扮演着至关重要的角色。文本图像的二值化，是将一幅文本的灰度图像，转换为只有黑白两色的二值图像，即将图像分为前景和背景两部分。许多文本图像是年代久远的文献资料，难W避免会发生图像退化，发生退化的原因有很多种，比如图像的获取来源，图像的保存环境、保存时间等等，都会使图像发生严重的退化现象，使得文本图像中前景与背景高度相似，难W区分，因而如何准确的对文本图像进行二值化一直是一道难题。
[0003] 二值化算法，通过最近十多年的发展，已经有了很大的进步。但是对于历史文本图像，通常图像退化比较严重，图像质量较差。而退化类型有各种各样，比如光照变化，污溃，折痕，背面浸透过来的字迹等等，现有的二值化算法，对各种类型的退化文本图像都有自己的不同的特点且准确度不一。因而本文希望能够提高现有二值化算法对于各种类型的退化文本的适应性，在现有二值化算法得到的二值图的基础上，进行二次优化，进一步提高二值化的准确度。

【发明内容】

[0004] 本发明的目的是提供一种对文本图像二值化的优化方法。
[0005] 本发明的技术方案是，
[0006] 一种文本图像二值化的优化方法，包括W下步骤：
[0007]步骤 1 ;
[000引用二值化算法对原始文本图像进行二值化后得到的二值图，作为初始二值图；
[0009] 对原始文本图像运用k-means算法，W图像的所有像素点的像素值为对象进行分类，分类的数目设为k，分类W后就能得到一幅被标记为Ui，12,13…Ijk类像素集合的图像，每个像素被标记为1~k中的一类，计算每个li集合中所有像素值的平均值A1，记 /min=苗，Imi。即为像素值均值最小的一类像素集合；
[0010] 步骤 2;
[0011] 采用R.M.haralick连通区域检测算法在初始二值图中标记出每一个独立封闭的连通区域，连通区域是指图像中的一个最大连通子集，在一个最大连通子集中任意两个像素点PiOq，Yi)满足；
[0012] 1《（Xi-X2)2+(yi-y2)2《2 (1)
[0013]得到一幅大小与初始二值图相同且被标记为1~m个连通区域的图像；
[0014] 步骤 3;
[0015] 首先，对于步骤2中被标记的1~m个连通区域，任取标记为j(1《j《m)的连通区域，j连通区域中像素总个数为Sj.，计算其中包含的Imi。类像素的总数，记为nij.，j连通区域中的像素通过W下规则重新分类，Qj.(x)代表j连通区域中所有的像素：
[0016]
【主权项】
1. 一种文本图像二值化的优化方法，其特征在于包括以下步骤：步骤1 : 用二值化算法对原始文本图像进行二值化后得到的二值图，作为初始二值图；
对原始文本图像运用k-means算法，以图像的所有像素点的像素值为对象进行分类，分类的数目设为k，分类以后就能得到一幅被标记为U1, 12, 13~IJk类像素集合的图像，每个像素被标记为1~k中的一类，计算每个Ii集合中所有像素值的平均值A i，记 Imin即为像素值均值最小的一类像素集合；步骤2 : 采用R. M. haralick连通区域检测算法在初始二值图中标记出每一个独立封闭的连通区域，连通区域是指图像中的一个最大连通子集，在一个最大连通子集中任意两个像素点 P1U1, Y1)满足： I < (X1-X2)2+(Y1I2) 2S 2 (1) 得到一幅大小与初始二值图相同且被标记为1~m个连通区域的图像；步骤3 : 首先，对于步骤2中被标记的1~m个连通区域，任取标记为j (I < j < m)的连通区域，j连通区域中像素总个数为Sj，计算其中包含的Imin类像素的总数，记为mj，j连通区域中的像素通过以下规则重新分类，Q jOO代表j连通区域中所有的像素：
将标记为1~m的每个连通区域中的像素通过上式划分后，即可去掉一部分错误划分为前景像素的区域，得到了二值图B2; 然后，对二值图B2重新检测连通区域，得到标记为1~η的连通区域图，任取标记为 j(l< j < η)的连通区域，每幅图像都是一个2维像素矩阵，矩阵中的每个像素都有自己的行、列下标，假设j连通区域中的像素的行下标为P~q，统计j区域中第f (Ρ < f < q)行的Imin类像素个数和像素的总个数S #，对第f行像素按下式重新分类，Q# (X)代表连通区域中f行的所有像素：
将标记为j连通区域用上式对连通区域中的每一行像素进行判断的同时记录该行像素划分的类别并将其记录在数组ajf，如果该行分类为背景像素，则该行的分类结果记为O 存入数组中，反之则分类结果记为1，用公式表示如下：
ajf中的每一个数对应P~q中的一行像素，由此，当一个连通区域中的像素被逐行使用上式分类完成后，能够生成一个标记数组ajf作为附加条件；只需把数组a jf所有元素中 1与1中间的所有〇代表的那行像素重新标记为前景像素即可，用上述方法将标记为1~η 的连通区域中的行像素全部划分完；最后，重新检测连通区域，对得到的每个连通区域中每列像素用上述相同方法进行分类，得到中期二值图；步骤4 :使用Su提出的一个融合规则，即对初始二值图和中期二值图，同时被分类为前景或者背景的像素认为分类正确，其它不相同的字符像素分类为待定像素；如下公式所示：
KU)代表原始图像中的一个像素,Bi(X)代表初始二值图和中期二值图中K(X)位置像素的值；对于待定的像素，通过下式进行分类：
式（6)中J(X)代表待定的像素，Con(X)，I(X)代表像素 J(X)的对比度值和像素值； ConF，1卩代表了以J(X)为中心的局部窗口内前景像素的平均对比度值和平均灰度值，ConB 和Ib代表了局部窗口中的背景像素的平均对比度值和平均灰度值；式（7)中，（X，y)表示原始图像中像素的行列坐标，Con(X，y)表示每个像素的对比度值，灰度值I (X，y)表示原始图像中像素（X，y)处的像素值，以（X，y)为中心点取一个 10X10的像素窗口，f_(x，y)表示窗口中的最大像素值，ε为正的极小化因子，为了防止分母为零；记中期二值图为B3，初始二值图为&，选择B1作为初始的迭代图像，将其与中期二值图 B3结合运用公式（5)分类后，对于分类得到的所有待定像素，以每一个待定像素为中心取 3X3的窗口，当窗口内有一个或1个以上的前景或者背景像素后，按照公式（6)中J(X)的判定条件对这个待定像素进行分类，分类完毕后换下一个待定像素继续分类，将所有待定像素分类完毕后得到的图像与第一次迭代图像B 1做对比，不相同则将其作为第二次迭代的初始图像，继续与中期二值图B3相结合分类，重复之前步骤，一直迭代到基本不变，得到了最终优化后的二值图。
【专利摘要】本发明公开了一种文本图像二值化的优化方法，本发明具有如下的技术效果，(1)本发明提出了一种优化二值化的方法。现有的二值化算法，对于不同退化类型的文本图像，都有着自己不同的特点和准确度，而本发明能够很好的在现有二值图的基础上进行二次优化，保留二值化算法自身的优点，进一步提升二值化方法的准确度。(2)本发明提出了一种以每个区域中、每一行或者每一列像素中某一类作为特征的像素所占的百分比作为判断其中所有像素分类的方法，不仅仅可以用到该发明中，对于很多其它需要细致分类的情况，在已经初步得到分类信息的情况下，都能够很好的借鉴此方法进行二次分类。
【IPC分类】G06K9-38
【公开号】CN104866850
【申请号】CN201510257271
【发明人】高协平, 张胜龙, 胡凯
【申请人】湘潭大学
【公开日】2015年8月26日
【申请日】2015年5月13日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高协平;张胜龙;胡凯;
技术所有人：湘潭大学;
我是此专利的发明人

上一篇：一种图像匹配的sift算法
上一篇：一种基于移动终端的食品营养成分标签识别方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。