一种文本图像的长干扰线去除方法与流程

文档序号:15933847发布日期:2018-11-14 02:04阅读:2348来源:国知局
技术简介:
本发明针对文本图像中长干扰线难以去除的问题,提出一种基于多方向扫描与自适应二值化的去除方法。通过灰度转换、自适应阈值二值化、多方向线段检测与筛选,精准识别并去除任意角度、颜色、位置的干扰线,再结合膨胀腐蚀修复断笔,有效保留文本信息,提升OCR识别准确率。
关键词:长干扰线去除,文本图像处理

本发明涉及图像识别与信息处理领域,尤其涉及一种文本图像的长干扰线去除方法。

背景技术

随着计算机视觉和模式识别技术的快速发展,光学字符检测和识别技术的应用领域越来越广阔。因此,如何准确定位文本信息成为提高光学字符识别准确率的重要前提。但是,在去除文本图像噪音过程中,很多情况下导致文本笔画断裂和缺失,因此,如何在尽可能去除图像中的噪音以及文本无关的无用信息的情况下,保留文本信息成为光学字符识别的一项重要预处理工作。

在去除文本图像中的干扰线方面,许多研究文本分析学者给出了一些方法,这些方法大致可以归纳为二类。第一类,基于颜色特征的方法:根据干扰线与文本字符颜色差异性,将干扰线从文本图像中分割出来,从而达到去除干扰线的目的,这类方法可以很好地去除与文本颜色信息差异较大的干扰线;当干扰线与文本字符颜色相似甚至相同时,此类方法不能去除这类干扰线。第二类,基于宽度特征的方法:根据干扰线与文本字符笔画宽度差异性,当干扰线与字符笔画宽度不同时,可以通过适当的腐蚀膨胀操作去除干扰线且保留文本笔画;但当干扰线宽度与字符笔画宽度一致时,腐蚀膨胀操作去除干扰线的同时,也会丢失大量的字符笔画,故这类方法不适用于去除此类干扰线。针对此类文本图像中的干扰线,本发明提出了一种文本图像的长干扰线去除方法。



技术实现要素:

本发明提出了一种文本图像的长干扰线去除方法,包括如下步骤:

步骤一:获取具有特征干扰线的彩色文本图像;

步骤二:将所述彩色文本图像转换到灰度空间,得到灰度图像;

步骤三:将所述灰度图像二值化处理,得到二值化图像;

步骤四:以初始水平方向和初始垂直方向扫描所述二值图像,创建候选线段的起点和初始终点;

步骤五:继续扫描所述二值图像,更新所述候选线段的终点、斜率、长度;

步骤六:扫描完成,生成初始方向的候选线段集合;

步骤七:以相反水平方向和初始垂直方向重复扫描所述二值图像,获取候选线段并更新所述候选线段集合;

步骤八:以初始水平方向和相反垂直方向重复扫描所述二值图像,获取候选线段并更新所述候选线段集合;

步骤九:以相反水平方向和相反垂直方向重复扫描所述二值图像,获取候选线段并更新所述候选线段集合;

步骤十:根据干扰线的特性,从所述候选线段集合中筛选得到干扰线;

步骤十一:去除所述二值图像中的干扰线;

步骤十二:填充所述二值图像中因干扰线去除后造成的文字笔画断笔;

步骤十三:以所述二值图像为掩码图像,从所述彩色文字图像中提取前景像素值,其余背景像素赋值为不同颜色。

本发明提出所述文本图像的长干扰线去除方法中,步骤三对所述灰度图像的二值化处理包括如下步骤:

3a.计算所述灰度图像中每一像素点局部领域块的灰度高斯加权和大小;

3b.计算灰度高斯加权和得到的权平均,并计算得到每个像素点的自适应总阈值;高于所述自适应总阈值的像素赋值为255,否则像素赋值为0,得到二值图像。

本发明提出所述文本图像的长干扰线去除方法中,步骤四中,若所述二值图像中一像素点的像素值为非零,其八个邻域内以初始水平方向和初始垂直方向经过的三个像素点的像素值均为零,其以相反方向经过的三个像素点的像素值不全为零,则该像素点为候选线段的起点和初始终点。

本发明提出所述文本图像的长干扰线去除方法中,在步骤五中,若所述二值图像中的像素值为非零,存在候选线段终点为该像素点八邻域内以初始水平方向和初始垂直方向经过的三个像素点之一,则计算此像素点与该候选线段起点组成线段的斜率,若此斜率与候选线段的斜率的变化在阈值范围内,则更新此候选线段的终点、斜率以及长度。

本发明提出所述文本图像的长干扰线去除方法中,步骤十二利用膨胀腐蚀方法填充断笔,包括如下步骤:

12a.将所述二值图像的向右、向下各膨胀一个像素,填充由于去除干扰线造成的竖起笔画或水平笔画断笔现象;

12b.将膨胀后的二值图像向左、向上各腐蚀一个像素,还原文本笔画宽度。

本发明中所指干扰线的特性为:是指具有一定长度的、穿越文本区域的长直线。在每一幅文本图像中:干扰线数目随机,每张文本图像中的干扰线数目不同,一般大于10;干扰线长度随机,同一文本图像中的干扰线长度在一个字符宽度与图像宽度之间变化;干扰线方向随机,同一文本图像中的干扰线的斜率在正无穷与负无穷之间变化;干扰线颜色为随机彩色,同一文本图像中的每条干扰线颜色不同,可能与之相交的字符颜色相似;干扰线宽度为1个像素,与图像中的部分文本字符笔画宽度相同;干扰线位置随机,可出现在图像中的任意位置。

本发明的有益效果在于:本发明能够自动去除文本图像中的任意数目、任意角度、任意颜色、任意位置的长干扰线。为后续的光学字符定位和识别奠定了基础。与现有的技术相比,本发明能够自动去除与字体颜色相似甚至相同颜色的、与字符笔画等宽的干扰线。本发明在去除具有上述特性干扰线的同时,能够尽可能地保留有用文本信息。

附图说明

图1是本发明文本图像的长干扰线去除方法的流程图。

图2是图1中步骤中s4-s6流程图。

图3是带干扰线的文本图像示例。

图4是图3二值图像。

图5是去除干扰线后带断笔的文字笔画示例图。

图6是经过膨胀腐蚀操作后文字笔画示例图。

图7是图3经本发明去除干扰线后的结果图。

具体实施方式

结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。

为了更好的说明本发明的思路,将文本图像中的长直干扰线做如下说明:

干扰线数目随机,每张文本图像中的干扰性数目不同;

干扰线长度随机,每条干扰线长度在一个字符宽度与图像宽度之间;

干扰线方向随机,每条干扰线的倾斜角在0度到360度之间;

干扰线颜色随机,彩色,可能与相交的字符颜色相同;

干扰线宽度为1个像素,与部分文本字符笔画宽度相同。

干扰线位置随机,可能出现在图像上的任意位置。

参阅图1-2,本发明的文本图像的长干扰线去除方法操作步骤如下:

s1、给定一幅带长干扰线的彩色文本图像,见附图3,以备自动去除图像中的长直干扰线;

s2、对上述给定的彩色图像进行色彩空间转换,将其灰度化;

s3、对灰度图像进行自适应局部二值化处理:

s3a、将灰度图像的每一像素点,选取局部领域,计算该像素局部领域块的灰度高斯加权和大小,以某像素点(x,y)为中心,领域大小为r,其高斯加权和sumg的计算公式如下所示:

其中w(i,j)是像素(i,j)的高斯权重大小,f(i,j)为像素点(i,j)的灰度值;

s3b、根据上步计算得到的像素点(x,y)加权和sumg,除以领域内的平均值g(x,y),减去一个常数t,得到每个像素点的自适应阈值。如该点灰度值大于该阈值则将二值图像中该点像素赋值为255,否则赋值为0。点(x,y)的二值化大小dst(x,y)具体计算公式如下:

dst(x,y)=f(x,y)>(g-t)?255:0

其中t取常数15。结过上述计算,得到源图片的二值化图像,如附图4所示;

s4、从左向右,从下至上扫描图像,创建候选线段。具体步骤如下:

s4a、选取线段起点。如果某点像素值非零,其八邻域内正上、正左、左上三点像素均为零,且其正下、正右、右下三点像素值不全为零,则该点为某一线段起点;

s4b、创建一条新线段。该线段起点为上步中选取的起点,终点与起点相同,斜率为0,长度为1;

s5、继续此方向上扫描图像,更新线段终点,更新线段斜率;其具体步骤如下:

s5a、若二值图像中的非零像素点的八邻域内存在该方向上线段的终点,前往s5b;

s5b、计算该非零点与此线段起始点组成的线段斜率;

s5c、如果s5b计算所得斜率与该线段斜率差值在一定范围内,则更新此线段终点、斜率、长度,否则继续扫描。

s6扫描完成,形成该方向上的所有候选干扰线集合。

s7、从右向左、从上至下扫描图像,创建候选线段。具体步骤如下:

s7a、选取线段起点。如果某点像素值非零,其八内正上、正右、右上三点像素均为零,且其正下、正左、左下三点像素值不全为零,则该点为某一线段起点;

s7b、重复步骤s4b;

重复步骤s5-s6;

s8从左向右、从下至上扫描图像,创建候选线段。具体步骤如下:

s8a、选取线段起点。如果某点像素值非零,其八邻域内正下、正左、左下三点像素均为零,且其正上、正右、右上三点像素值不全为零,则该点为某一线段起点;

s8b、重复步骤s4b;

重复步骤s5-s6;

s9从右向左、从下至上扫描图像,创建候选线段。具体步骤如下:

s9a、选取线段起点。如果某点像素值非零,其八邻域内正下、正右、右下三点像素均为零,且其正上、正左、左上三点像素值不全为零,则该点为某一线段起点;

s9b、重复步骤s4b;

重复步骤s5-s6;

s10、根据上述干扰线特征,从候选线段集合中筛选出干绕线;剔除候选干扰线集合中线段长度小于某一总阈值(这里选取字符宽度)的线段,形成最终的干扰线线段集合;

s11、从二值图像中去除干扰线,去除干扰线后的示例图见图5;

s12、将去除干扰线的二值化图像进行一定规则的膨胀腐蚀操作,填充由干扰线去除所造成的笔画断笔,具体步骤包含:

s12a、将二值图像向右、向下各膨胀一个像素,填充由于去除干扰线造成的竖起笔画或水平笔画所引起的断笔现象;

s12b、将膨胀后的二值图像向左、向上各腐蚀一个像素,还原文本笔画宽度,膨胀腐蚀后的示例图见附图6。

s13、以最终的二值图像为掩码图像,从源图像中提取目标图像的前景像素值,目标图像的背景像素一律赋值为白色。目标图像示例图见附图7,当掩码图像中某点像素值非零时,则从源图像中拷贝相应位置像素值到目标图像相应位置,此点即为前景像素点;当掩码图像中某点像素值为零时,目标图像中对应点即为背景像素点。

以附图3为例,经过步骤s2-s3后,得到附图4所示的该图二值化图片,经过步骤s4—s11,扫描图片,创建候选线段,更新线段数据,得到最终的干扰线线段集合,从图4中去除干扰线,从而得到去除干扰线后的二值图。由于干扰线穿越文本笔画,去除干扰线后导致文本部分某些字符笔画出现断裂现象,见附图5中红色箭头所示。故对二值图像经过适当的膨胀腐蚀操作,消除笔画断笔,并尽可能接近原始笔画细节,以此二值图像为掩码,从源图像中提取目标图像前景像素值,最终的目标图片示例图附图7。

本发明的保护内容不局限于以上实施例。在不背离发明构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本发明中,并且以所附的权利要求书为保护范围。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!