一种用于识别铝车轮背腔字符的方法与流程

文档序号:11678104阅读:428来源:国知局
一种用于识别铝车轮背腔字符的方法与流程

本发明涉及工业控制技术领域,具体地涉及一种用于识别铝车轮背腔字符的方法。



背景技术:

在此之前,没有关于铝车轮背腔字符识别系统的方法,当需要获得铝车轮背腔数字信息时,需要人工查看并记录,这种方法不仅费时费力而且人工查看会存在很大的疏漏,在查看和记录这两个环节上都有可能出现错误。然而,在汽车这一方面有关数字识别的大部分是对车牌的数字识别,读取车牌信息,用于交通管理。

以前人们很少关注铝车轮背腔字符的应用,但随着时代的变迁,产品溯源和物联网随之出现,这就对车轮生产提出了更多新的要求。要对产品进行溯源或要将整个生产车间建立一个局部的物联网都需要提取车轮的信息并进行处理,而车轮最根本的信息则是其背腔内的各种字符,例如:china、gm和2016等,从这些字符中我们可以知道车轮是哪个国家、哪个公司、哪一年生产的,从各种不同的数字标号中我们甚至可以知道车轮的第n道工序是由谁在什么时间完成的。这些都是新时代的要求,这些新的要求促使新技术的诞生。



技术实现要素:

因此,本发明的目的是提供一种识别表面上凹陷或者凸起的字符的方法,该方法包括步骤:(001)图像输入步骤:在该步骤中,使用相机采集待观测表面的图像,并且将图像输入到存储器;(002)第一预处理步骤:将步骤(001)中采集的图像进行灰度化处理;将灰度图像进行二值化处理,得到二值图;将所述的二值图进行形态学膨胀处理,使法规标识字符所在区域形成连通域;(003)字符区域分割:对步骤(002)得到的图像进行轮廓搜索,并且计算轮廓所围成的面积,根据轮廓面积确定待检测字符所在的连通域;其次,在灰度图像上画出连通域的外部轮廓,并画出包围轮廓的最小矩形;最后,根据最小矩形选择roi感兴趣区域,提取法规标识字符所在的区域,完成图像的初步分割;(004)第二预处理步骤:首先,将步骤(003)中提取的连通域灰度图像通过最大类间差法进行二值化处理;其次,将二值化处理后的图像进行形态学膨胀处理,使各个数字和字符串独立成一个连通域,便于字符分割;(005)字符分隔步骤:首先,查找数字和字符串的外围轮廓并在灰度图像上画出轮廓;然后,查找并画出包围数字和字符串外围轮廓的最小矩形;最后,根据最小矩形进行字符分割;(006)静态模板处理步骤:a)在任意的一张图片上分别切割一幅尺寸为512*384和1000*100的图片a和b;b)对图片a、b进行灰度化处理;c)对灰度化处理后的图片a和b进行遍历像素,对每一个像素点都赋值255,使图片a和b成为一张白色图片,这样静态模板的背景图片就完成了;d)在背景图片a上划分用于放置标准字符0~9的精确位置,第一形态数字,将数字0~9放在矩形区域左上角坐标为(10+50*i,20)(i=0~9)的位置,第二形态数字,将数字0~9放在矩形区域左上角坐标为(10+50*i,50)(i=0~9)的位置,第三形态数字,将数字0~9放在矩形区域左上角坐标为(10+50*i,90)(i=0~9)的位置;e)在背景图片b上划分用于放置标准字符串的精确位置,其矩形区域左上角坐标为(10+50+i*图宽)(i=0~3);f)按照步骤004和步骤005对灰度图像分割并提取标准法规标志字符并根据步骤d、e中划分的区域复制掩膜,将提取的标准字符放置到指定区域;(007)模板匹配步骤:将步骤005分割好的样本法规标识字符图片在步骤006制成的静态模板上从左上角开始向右下角滑动并在静态模板上寻找与样本图片最匹配的部分;找到最匹配区域后,在此区域画出其最小矩形,由最小矩形可以获得最匹配区域的左上角坐标,用于与数据库对比;(008)数据库配对步骤:将步骤007测得的最匹配区域左上角横坐标值与建立的匹配数据库进行对比匹配;(009)如果步骤008的数据库对比匹配不成功,说明样本图片无法识别,输出错误;(010)如果步骤008的数据库对比匹配成功,根据静态模板返回的最匹配区域最小矩形左上角横坐标在数据库中查找与之对应的法规标识字符数据,输出正确的样本法规标识字符。

在本发明优选的方面,所述的表面是铝合金表面。

在本发明优选的方面,所述的表面是铝合金车轮背腔表面。

在本发明优选的方面,在步骤(001)中,所述的图像的分辨率为1600*1200。

在本发明优选的方面,在步骤(002)中,所述的灰度图像是通过加权平均法得到的,灰度化公式如下所示:f=0.3r+0.59g+0.11b;其中,f为灰度图像某一点的像素值,r、g、b分别代表彩色图片某一点的三原色像素值。

在本发明优选的方面,在步骤(002)中,所述的二值化处理是通过全局阈值二值化的方法来实现的,二值化公式表示如下所示:

其中,bin为二值化图像中像素点的像素值,t是阈值。

在本发明优选的方面,在步骤(002)中,所述的形态学膨胀是通过将图像与核进行卷积的方法来实现的,表达式如下所示:其中,s是膨胀后的二值图像集合,x为原始的二值图像集合,b是高亮度核。标记b的中心点,将b在x上移动,如果b与x有重叠则保留b中心点所在位置的像素值。

在本发明优选的方面,在步骤(007)中,采取平方差匹配法来进行匹配。

在本发明优选的方面,在步骤(007)中,匹配方法是,针对被测图片与静态模板的相似性的计算,然后通过公式:

来计算r值,用r值来表示两者之间的相似程度,r值越小代表相似度越大。由公式可以看出被测图片t在静态模板i上每移动一个位置就要进行一次计算并得出结果r来判断当前位置的相似度。

在本发明优选的方法,在步骤(007)中,采取相关匹配法或者系数匹配法来进行匹配。

在本发明优选的方面,针对相关匹配法,针对模板与图像之间的相关性进行计算,然后通过公式来计算r值,用r值来表示匹配度的大小,r值越大匹配程度越高。

在本发明优选的方面,在步骤(008)中,判定值设置成5~10个像素宽度的范围。

本发明的方法的优点在于,通过模板匹配的方法可以有效的识别出铝车轮背腔的铸造法规标识字符,实现了识别的自动化。

附图说明

以下,结合附图来详细说明本发明的实施方案,其中:

图1:本发明实施例1的方法的流程图;

图2:本发明实施例1的当判定值为固定值时的数字字符待检测图;

图3:本发明实施例1的当判定值为固定值时,数字字符进行模板匹配后返回的坐标值和显示被测图片真实值情况的图;

图4:本发明实施例1的当判定值为固定值时,模板匹配后显示在静态模板上的当前最匹配区域图;

图5:本发明实施例1的当判定值为固定值时的英文字符串待检测图;

图6:本发明实施例1的当判定值为固定值时,英文字符串进行模板匹配后返回的坐标值和显示被测图片真实值情况的图;

图7:本发明实施例1的当判定值为固定值时,模板匹配后显示在静态模板上的当前最匹配区域图;

图8:本发明实施例1的当判定值是一个数值范围时,数字字符待检测图;

图9:本发明实施例1的当判定值是一个数值范围时,数字字符进行模板匹配后返回的坐标值和显示被测图片真实值情况的图;

图10:本发明实施例1的当判定值是一个数值范围时,模板匹配后显示在静态模板上的当前最匹配区域图;

图11:本发明实施例1的当判定值是一个数值范围时,英文字符串待检测图;

图12:本发明实施例1的当判定值是一个数值范围时,英文字符串进行模板匹配后返回的坐标值和显示被测图片真实值情况的图;

图13:本发明实施例1的当判定值是一个数值范围时,模板匹配后显示在静态模板上的当前最匹配区域图;

图14:本发明实施例2的用来再次验证本发明所提出的方法可行性重采样数字字符图;

图15:本发明实施例2的用来再次验证本发明所提出方法可行性的重采样英文字符串图;

图16:本发明实施例2的数字字符静态模板图;

图17:本发明实施例2的英文字符串静态模板图;

图18:本发明实施例2的重采样的待检测数字字符进行模板匹配之后显示在静态模板上的最匹配区域图;

图19:本发明实施例2的重采样的待检测英文字符串进行模板匹配之后显示在静态模板上的最匹配区域图;

图20:本发明实施例2的重采样的待检测数字字符进行模板匹配后返回的坐标值和显示被测图片真实值情况的图。

图21:本发明实施例2的重采样的待检测英文字符串进行模板匹配后返回的坐标值和显示被测图片真实值情况的图。

本发明的附图中有部分是相同的图片,用来验证所使用方法的优越性。因此,使用相同的实验图片做不同的实验来确保实验结果不同是由单一变量(本发明所用的方法)导致的,以此达到对比说明的目的。其中图2和图8是相同的图片,二者都是数字字符待检测的图片,但是每个图片中的三个“9”是不同的;图5和图11是相同的图片,二者都是“china”字符串待检测的图片,但是每个图片中的两个“china”是不同的,上述两种情况都是用来做对比实验验证一定程度的扩大比对数据库的条件范围有助于提高识别率。图4和图10是相同的图片,二者都是数字字符“9”模板匹配的结果图;图7和图13是相同的图片,二者都是“china”字符串模板匹配的结果图。

具体实施方式

实施例1

在本发明的一个实施方案中,做一个由0~9这10个数字字符和“china”,“dicastal”,“gm”,“t-dot”这四个字符串组成的法规标识字符的静态模板,可确定每个字符所在区域的四角点的精确坐标;其次,对样本铝车轮背腔图像进行预处理,提取样本法规标识字符所在的区域,并对提取出来的字符进行分割;最后,将分割好的法规标识字符与静态模板相匹配,通过将返回的坐标值与提前设计好的数据库相比较来确定被识别的法规标识字符。

在本发明的具体实施方案中,采取以下的步骤来进行识别:

001)用相机采集铝车轮背腔图像,将采集的图像读取到处理程序中,用于下一步处理。

002)预处理时,首先,对采集的图像进行灰度化处理,将原始采集图像由三通道彩图变为单通道灰度图;其次,将灰度图像进行二值化处理,将灰度图变为二值图;最后,将二值图进行形态学膨胀处理,使法规标识字符所在区域形成连通域,便于提取。

003)首先,将步骤002处理好的图像进行轮廓搜索,找到轮廓后计算轮廓的面积,根据轮廓面积确定法规标识字符所在的连通域;其次,在灰度图像上画出连通域的外部轮廓,并画出包围轮廓的最小矩形;最后,根据最小矩形选择roi感兴趣区域,提取法规标识字符所在的区域,完成图像的初步分割。

004)首先,将步骤003中提取的连通域灰度图像通过最大类间差法进行二值化处理,其次,将二值化处理后的图像进行形态学膨胀处理,使各个数字和字符串独立成一个连通域,便于字符分割。

005)首先,查找数字和字符串的外围轮廓并在灰度图像上画出轮廓;然后,查找并画出包围数字和字符串外围轮廓的最小矩形;最后,根据最小矩形进行字符分割。

006)静态模板是预先设计好的,设计静态模板的步骤如下:a)分别切割一幅尺寸为512x384和1000x100的图片a和b;b)对图片a、b进行灰度化处理;c)对灰度化处理后的图片a和b进行遍历像素,对每一个像素点都赋值255,使图片a和b成为一张白色图片,这样静态模板的背景图片就完成了;d)在背景图片a上划分用于放置标准字符0~9的精确位置,第一形态数字,将数字0~9放在矩形区域左上角坐标为(10+50*i,20)(i=0~9)的位置,第二形态数字,将数字0~9放在矩形区域左上角坐标为(10+50*i,50)(i=0~9)的位置,第三形态数字,将数字0~9放在矩形区域左上角坐标为(10+50*i,90)(i=0~9)的位置;e)在背景图片b上划分用于放置标准字符串的精确位置,其矩形区域左上角坐标为(10+50+i*图宽)(i=0~3);f)按照步骤004和步骤005对灰度图像分割并提取标准法规标志字符并根据步骤d、e中划分的区域复制掩膜,将提取的标准字符放置到指定区域,到此,静态模板就完成了。

007)模板匹配是一项在一幅图片中寻找另一幅模板图像最匹配部分的技术。模板匹配不是基于直方图的,而是通过在输入图像上滑动图像块,对实际的图像块和输入图像进行匹配的一种匹配方法。本方法是将步骤005分割好的样本法规标识字符图片在步骤006制成的静态模板上从左上角开始向右下角滑动并在静态模板上寻找与样本图片最匹配的部分。因为不同的法规标识字符所在的样本图片之间存在差异,所以在寻找最匹配区域时会精确的找到静态模板上对应法规标识字符所在的区域。找到最匹配区域后,在此区域画出其最小矩形,由最小矩形可以获得最匹配区域的左上角坐标,用于与数据库对比。

008)由步骤006可知,静态模板上法规标识字符模板分配的区域其左上角坐标是确定的,并且各个字符的位置是由其所在区域左上角坐标的横坐标值唯一确定的,所以根据步骤006分配的位置左上角横坐标值建立匹配数据库;由步骤007可知,通过模板匹配得到的最匹配区域也是由其左上角坐标唯一确定的;因此,将步骤007测得的最匹配区域左上角横坐标值与建立的匹配数据库进行对比匹配。

009)如果步骤008的数据库对比匹配不成功,说明样本图片无法识别,输出错误。

010)如果步骤008的数据库对比匹配成功,根据静态模板返回的最匹配区域最小矩形左上角横坐标在数据库中查找与之对应的法规标识字符数据,输出正确的样本法规标识字符。

在本发明优选的实施方案中,步骤008数据库对比中,判定值设置成5~10个像素宽度的范围更加容易匹配成功,如果判定值用唯一确定的值进行精确匹配,则会降低本识别方法的识别率。下面由数字“9”在判定值为460和455~465时和字符串“china”在判定值是10和8~12时举例说明,效果图如下图所示:

1)数字“9”当判定值为460时和字符串“china”当判定值为10时

由上图可知,图2和图5是样本字符图片,图3和图6是输出结果,图4和图7是模板匹配效果图;由图4和图7可知样本图片在静态模板上都找到了正确的最匹配区域并画出其最小矩形,但是由于不同图片之间的差异使得最匹配区域有很小的差异,由图3和图6可以看出,数据库精确判定值为460和10,而第一和第三个样本数字图片和第一个样本字符串图片返回的坐标值分别是461、459和9,与精确判定值相差一个像素宽度,所以在结果输出时各只有一个样本图片被认定是匹配成功被正确识别,识别率为30%~50%左右。

2)数字“9”当判定值为455~465时和字符串“china”当判定值为8~12时

由上图可知,图8和图11是样本字符图片,图9和图12是输出结果,图10和图13是模板匹配效果图;由图9、图10、图12和图13可知,当判定值为455~465和8~12之间时,系统成功的识别出所有的样本图片并输出正确识别结果,识别率为100%。因此步骤008中,数据库对比的判定值不能设置成某个精确值,应该设置成一个有效范围。

实施例2

下面通过对数字“3”、“6”和字符串“dicastal”、“gm”的识别来说明本方法的整个运作过程。

1)对铝车轮背腔进行图片采集并处理,分割出待检测的数字图片和字符串图片,如图14和图15所示。

2)制作静态模板,为了适合更多形态的数字识别,在制作静态模板时要采集多中形态的标准字符,如图16和图17所示。

如上图16所示,此为两种形态的静态模板,第一行为小型号铸造数字字符模板,这种形态的模板用于识别铝车轮背腔数字较小时或图片采集时相机镜头距离背腔字符较远时的情况;第二行为较大型号铸造数字字符模板,这种形态的模板用于识别铝车轮数字较大时或图片采集是相机镜头距离背腔字符较近是的情况。因为在采集铝车轮背腔数字图片的时候为了获得较清晰的图片数字字符大小无法完全相同,所以静态模板采集了两种形态的标准字符,如果后期有其他形态数字字符识别需要时可以在模板中添加新形态的标准字符。图17所示为字符串的静态模板,目前只有一种形态,如果后期有新形态的字符串出现可以在静态模板上加入。

3)模板匹配,将分割好的样本图片放入静态模板中进行最匹配区域搜索并画出最小矩形

由图18和图19可知,图14和图15中分割的4幅法规标识字符“3”、“6”、“dicastal”和“gm”的图片,成功的在静态模板上搜索到正确的最匹配区域并画出最小矩形,同时也获得了最小矩形左上角横坐标值,用于与数据库比对来确定所检测的数字字符的真实数值。

4)数据库匹配,输出正确法规标识字符

图20和图21分别为数字字符和字符串的识别输出结果,由上图可以看出两点:其一,4幅作为样本的图片进行匹配后,返回的最匹配区域的左上角横坐标基本上与精确坐标值相同,偶尔有偏差也是很小的偏差;其二,即使返回的左上角横坐标值有微小的偏差,但是,由于在数据库比对时设置的判定值是一个精确坐标值加减5个像素宽度的范围,因此,仍然可以正确锁定对应的法规标识字符。所以,由此可得出本方法的匹配检测能够很好的搜索出对应的模板字符所在地区域并可以较精确的查找到最匹配区域,返回准确的判定值;匹配结果出现较小偏差时,由于对数据库比对判定值的有效设置,仍然能够正确的识别出样本图片的法规标识字符,具有较高的识别率。

步骤007模板匹配时可以有多种匹配方法,本方法使用的是平方差匹配法。此种方法简单易懂且计算量较小,能够得到较好的匹配结果,公式如下:

除此之外,还有相关匹配法和系数匹配法等精确度更高的匹配方法。相关匹配法公式如下:

由上面两个公式可以看出,相关匹配法的运算中由加减运算变成乘除运算,虽然这些方法匹配精度可能更高一些,但是其计算量比较大,普适性会差一些。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1