一种畸变喷码字符逐层分割的方法与流程

文档序号:22738844发布日期:2020-10-31 09:20阅读:158来源:国知局
一种畸变喷码字符逐层分割的方法与流程

本发明属于图像处理、光学字符识别领域,尤其涉及一种畸变喷码字符逐层分割的方法。



背景技术:

某工件喷码字符是产品参数、质量等指标对应具体工件的重要身份信息。目前喷码字符的识别主要依赖人工视检。通用字符识别方法对喷码字符应用难点主要在于字符分割,由于喷码字符由离散点阵组成,字符间隔特征不明显,字体内的点阵空隙会造成对应方向的灰度投影值下降,对分割造成干扰;此外,当喷码方向无法垂直工件表面时,将会造成不同程度的字符畸变与字符大小、间隔变化,此时基于先验知识的字符分割方法在处理长字符连通域时将积累误差,当误差积累达到一字符长度时,将会造成错误分割。该工件生产线上的快速喷码环节正属于上述情况。目前,就这一问题未有有效解决方法。



技术实现要素:

本发明的目的在于解决上述现有技术中的问题,提供了一种畸变喷码字符逐层分割的方法,该方法结合连通域分割思想、灰度投影波谷探测分割思想、平均分割思想,由粗至细逐层分割文字区域,有效减小喷码字符畸变带来的影响,并提升分割算法鲁棒性。

为实现上述目的,本发明采用以下技术方案予以实现的:

一种畸变喷码字符逐层分割的方法,包括以下步骤:

1)对输入图像进行对中与旋转矫正,使得目标检测工件处于视场中央,喷码字符文字沿水平方向排列;

2)剪裁喷码字符区域,并对剪裁区域边缘进行压缩,使得剪裁区域边缘紧贴文字,接着判断剪裁区域文字是否颠倒,并予以矫正;

3)对上述剪裁区域使用纵向矩形模板进行闭运算以粘连离散的文字点阵,得到向性粘连图;

4)统计向性粘连图内连通域信息,并根据连通域面积的特征去除无关噪声,并得到符合标准的含有文字信息的子区域集合a;

5)遍历子区域集合a中子区域,依次判断子区域横向长度,对于大于预设三字符长度的子区域,绘制其纵向的灰度投影曲线,并通过分割指数计算方法选择最可靠的分割点,分割子区域后更新子区域排序;

6)重复步骤5)直至所有子区域横向长度不大于预设三字符长度,并得到子区域集合b;

7)通过加权的方式结合基于预设字符宽度预测字符数、子区域纵向灰度投影“波峰—波谷”对组数预测子区域集合b中每个子区域中的内含字符数,对子区域进行平均分割,得到子区域集合c;

8)通过空间坐标位置关系,补全子区域集合c字符间的间隔空间,使得子区域集合c构成连续的字符行并包含完整的喷码字符信息。

本发明进一步的改进在于,步骤1)中,首先对输入图像进行二值化,通过计算二值化图像重心与图像中心偏移量确定平移偏移矫正量;接着提取文字图像所在灰度区间,并筛选过滤像素面积超过文字区域的连通域与像素面积小于0.5倍喷码点面积的连通域,得到初步降噪的文字二值图像,通过计算文字在各角度的灰度投影,寻找投影峰值对应角度作为旋转偏移矫正量。

本发明进一步的改进在于,步骤2)中,基于步骤1)矫正后的图像,通过圆形模板对图像闭运算,无向性黏合散点使得整体文字区域形成连通域,筛选连通域面积获取文字区域范围并裁剪之,实现对文字区域的粗定位;创建文字边缘检测模板自裁剪区域边缘逐渐压缩,以式(1)计算判断是否触碰文字边界,若触碰,则在以模板所在位置向偏离图像中心方向10像素的位置建立最终文字区域框选边界,最后计算文字区域重心位置,判断文字是否颠倒,最终得到文字边缘压缩剪裁图:

式(1)中β为触碰边界判断系数,若计算大于0.5则判断为触碰边界;m为边缘检测模板像素宽度;n为边缘检测模板像素长度;f(m,n)为边缘检测模板;g(i-m,j-n)为剪裁区域对应位置。

本发明进一步的改进在于,步骤3)中,通过闭运算将离散的文字点阵粘连,如式(2)所示,创建纵向矩形模板对上述步骤所得文字边缘压缩剪裁图进行闭运算,得到向性粘连图;

式(2)中,a为字符图像矩阵,b为纵向矩形运算模板;

为膨胀运算符:

为腐蚀运算符:

本发明进一步的改进在于,步骤5)中,首先绘制该区域纵向灰度投影曲线,使用闭运算平滑灰度投影曲线并统计各波谷位置及对应灰度累加值,其中定义分割指数加权公式如式(3)所示:

式(3)中di为第i个波谷的分割指数,h为波谷灰度累加值,w1为h对应加权系数,|d|为波谷与子区域中点像素距离绝对值,w2为d对应加权系数;

选择具备最大分割指数波谷点作为分割点,分割子区域后更新子区域排序。

本发明进一步的改进在于,步骤5)中,按子区域集合c中子区域坐标位置从左到右、从上到下的顺序整理子区域排序,考察子区域间隔空间,若相邻子区域间隔超过0.75倍平均字符宽度,则自动框选该间隔区域,以符号形式填补到待识别序列中。

与现有技术相比,本发明至少具有以下有益的技术效果:

本发明提供的一种畸变喷码字符逐层分割的方法,该方法综合三种字符分割思路:连通域框选法、灰度投影波谷探测法、平均分割法;将文字连通域由粗至细三次细分,其中“连通域框选法”解决“灰度投影波谷探测法”易受喷码点阵空隙干扰的问题,“灰度投影波谷探测法”解决“平均分割法”在分割畸变长字符区域累积字符数判断误差的问题。相比单一字符分割方法,本发明在应对一定程度畸变的喷码字符分割问题上展现出更强的鲁棒性,同时子区域逐层细分的结构限定三种分割方法的作用范围,不会由于方法本身带来额外的分割误差,由此带来更高的喷码字符分割正确率。

附图说明

图1是本发明的算法流程图;

图2是输入图像;

图3是对中矫正图;

图4是文字区间阈值图;

图5是旋转矫正图;

图6是矫正输出图;

图7是文字粗剪裁图;

图8是文字边缘压缩剪裁图;

图9是向性粘连图;

图10是逐层分割全过程示意图。

具体实施方式

为方便对本发明进一步理解,现基于电阻片表面喷码字符分割任务,结合相关附图和实施例,对本发明涉及算法原理进行具体描述。但是随着技术发展,可由更多的形式实现本发明构想,然而基于结合连通域分割思想、灰度投影波谷探测分割思想、平均分割思想,由粗至细逐层分割文字区域的文字分割方法,都属于本发明的保护范围。

如图1所示,本发明提供的一种畸变喷码字符逐层分割的方法,包括以下步骤:

1)对输入图像进行矫正,首先对输入图像进行二值化,通过计算二值化图像重心与图像中心偏移量确定平移偏移矫正量;接着提取文字图像所在灰度区间,筛选过滤像素面积超过文字区域的连通域与像素面积小于0.5倍喷码点面积的连通域,得到初步降噪的文字二值图像,接着通过计算文字在各角度的灰度投影,寻找投影峰值对应角度作为旋转偏移矫正量。经上述步骤获得目标工件居中,且文字行处于水平方向的矫正图像。

2)基于步骤1)矫正后的图像,通过圆形模板对图像闭运算,无向性黏合散点使得整体文字区域形成连通域,筛选连通域面积获取文字区域范围并裁剪之,实现对文字区域的粗定位;创建文字边缘检测模板自裁剪区域边缘逐渐压缩,以式(1)计算判断是否触碰文字边界,若触碰,则在以模板所在位置向偏离图像中心方向10像素的位置建立最终文字区域框选边界,最后计算文字区域重心位置,判断文字是否颠倒,最终得到文字边缘压缩剪裁图:

式(1)中β为触碰边界判断系数,若计算大于0.5则判断为触碰边界;m为边缘检测模板像素宽度;n为边缘检测模板像素长度(取剪裁区域对应长宽);f(m,n)为边缘检测模板;g(i-m,j-n)为剪裁区域对应位置。

3)为实现基于连通域的文字粗分割,需通过闭运算将离散的文字点阵粘连,如式(2)所示,创建纵向矩形模板对上述步骤所得文字边缘压缩剪裁图进行闭运算,得到向性粘连图;

式(2)中,a为字符图像矩阵,b为纵向矩形运算模板;

为膨胀运算符:

为腐蚀运算符:

4)基于上述向性粘连图,统计该图内连通域信息,筛选去除面积过小、过大区域,接着将符合标准的子区域按空间顺序排序并保存,得到符合标准的含有文字信息的子区域集合a,即本发明涉及的连通域框选法;

5)基于上述步骤所得子区域集合a,依次判断子区域横向长度,对于大于预设三字符长度的子区域进行灰度投影波谷分割;首先绘制该区域纵向灰度投影曲线,使用闭运算平滑灰度投影曲线并统计各波谷位置及对应灰度累加值,其中定义分割指数加权公式如式(3)所示:

式(3)中di为第i个波谷的分割指数,h为波谷灰度累加值,w1为h对应加权系数,|d|为波谷与子区域中点像素距离绝对值,w2为d对应加权系数。

选择具备最大分割指数波谷点作为分割点,分割子区域后更新子区域排序,即本发明涉及的灰度投影波谷探测法。

6)重复步骤5)直至所有子区域横向长度不大于预设三字符长度,按照空间位置整理得到子区域集合b。

7)基于上述步骤所得子区域集合b,使用平均分割法预测各子区域内包含字符数,由如下两个综合因素加权预测:基于预设字符宽度预测字符数、子区域纵向灰度投影“波峰—波谷”对组数。两种指标分别按照0.7、0.3权重加权取整决定最终包含字符数,最后按照计算平均字符宽度分割所在区域,得到子区域集合c,即本发明涉及的平均分割法。

8)由于同行字符排列连续,间隔点可能在上述分割步骤中被忽略,因此要进行符号补全,按子区域集合c中子区域坐标位置从左到右、从上到下的顺序整理子区域排序,考察子区域间隔空间,若相邻子区域间隔超过0.75倍平均字符宽度,则自动框选该间隔区域,以符号形式填补到待识别序列中。

实施例

本发明涉及文字分割算法如图1所示,原始输入图像如图2,工件随机摆放位置与角度在视场内。首先对输入图像进行对中矫正,选取阈值25对二值化输入图像,将待测工件与背景分离开,接着计算二值化图像重心坐标,通过对比图像中心坐标获得平移矫正量(如图3);接着提取喷码文字相关像素的灰度区间[43,81],得到区间阈值图像(如图4),并筛选过滤过大和过小连通域得到含少量噪声的文字二值图像,通过计算文字在各角度的灰度投影,寻找投影峰值对应角度作为旋转偏移矫正量(如图5)。经上述步骤获得平移与旋转偏移矫正量带入原图,得到目标工件居中,且文字行处于水平方向的矫正图像(如图6)。

进一步地,基于上述矫正图像,创建半径为10pixels的圆形模板对图像闭运算,实现无向性黏合散点,使得整体文字区域形成连通域,同时背景离散的噪声相互粘连为面积交大的连通域,通过筛选连通域面积与长宽比即可获取大致文字区域范围并裁剪(如图7),得到文字粗剪裁图。

接着,自文字粗剪裁图四周边缘开始,分别创建与边界等长,且宽度为20像素的文字边缘剪裁模板,带入式(1)计算判断是否触碰文字边界,若未触碰,文字边缘剪裁模板向中心方向移动一个像素;若触碰,则在以模板所在位置向偏离图像中心方向10像素的位置建立最终文字区域框选边界,最后计算文字区域重心位置,判断文字是否颠倒,最终得到文字边缘压缩剪裁图(图8)。

在进行喷码字符逐层分割前,需要将离散的文字点阵粘连,同时尽可能保持文字之间的间隙,因此创建长为30像素,宽为5像素的纵向矩形模板b,令上述文字边缘压缩剪裁图为a,带入式(2)中进行闭运算,得到向性粘连图(图9)。由此可进行本发明所涉及喷码字符逐层分割算法核心,具体效果可参考图10。

第一步,基于上述步骤所得向性粘连图,统计该图内连通域信息,筛选去除面积过小、过大区域,接着将符合标准的子区域按空间顺序排序并保存,获得子区域集合a,实现基于连通域框选的分割。

第二步,基于子区域集合a,依次判断该集合内子区域横向长度,对于大于预设三字符长度的子区域进行灰度投影波谷分割;首先绘制该子区域纵向灰度投影曲线,使用闭运算平滑灰度投影曲线并统计各波谷位置及对应灰度累加值,通过式(3)计算各波谷的分割指数,并将具备最大分割指数波谷点作为分割点,分割子区域后更新子区域排序。重复此步骤,直至所有子区域横向长度不大于预设三字符长度,得到子区域集合b,实现基于灰度投影波谷探测的分割。

第三步,基于子区域集合b,使用平均分割法预测各子区域内包含字符数,由如下两个综合因素加权预测:基于预设字符宽度预测字符数、子区域纵向灰度投影“波峰—波谷”对组数。两种指标分别按照0.7、0.3权重加权取整决定最终包含字符数,这种加权的方法相较于单纯使用预设字符宽度预测字符数能更好地应对畸变字符的场景,最后按照计算平均字符宽度分割子区域并更新至子区域集合c中。

进一步地,由于同行字符排列连续,间隔点可能在上述分割步骤中被忽略,因此要进行符号补全,按图像坐标位置从左到右、从上到下的顺序整理子区域排序,考察子区域集合c中间隔空间,若相邻子区域间隔超过0.75倍平均字符宽度,则自动框选该间隔区域,以符号形式填补到待识别序列中。

以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1