一种喷印字符图像识别与校验系统及方法

文档序号:6498859阅读:289来源:国知局
一种喷印字符图像识别与校验系统及方法
【专利摘要】本发明提供了一种喷印字符图像识别与校验系统及方法,其中:所述字符生成部分包括字符本部、校验码部分和衔接部分,当系统根据产品的生产特性为该产品分配一个标识字符串时,字符生成部分就会根据该标识字符串即字符本部,自动的将该标识字符串的校验码部分字符串和衔接部分字符串加到字符本部字符串后面,从而生成字符生成字符串;所述字符喷印部分,用于实现字符串在产品表面的喷印;所述字符识别部分,用于识别出产品上的喷印字符串;所述字符校验部分,对识别结果采用校验法则计算校验码,判断识别结果是否正确。本发明可以用于钢铁和其他行业中不便使用标签读写器方式进行产品信息录入的地方,能够有效保证识别编码的正确性。
【专利说明】一种喷印字符图像识别与校验系统及方法
【技术领域】
[0001]本发明涉及喷印字符的识别与校验技术,具体地,涉及一种喷印字符图像识别与校验系统及方法,能够广泛应用于各类型材表面喷印字符的准确识别。
【背景技术】
[0002]当前钢铁生产制造及相关领域中,产品的生命周期跟踪管理通常会采用一、二维码标签与读写器设备来完成产品信息的录入。通常一、二维码标签会预先将产品的生产制造相关属性信息(这些属性信息能够唯一标识该产品)存储在码的本体上,然后将标签安装到需要跟踪的对应产品上。由于标签的存储信息能够唯一标识该产品,所以当标签跟随产品流通到达某一生产环节时,可以通过相应的读写设备对该标签的存储信息读取,并传输到上位机管理系统中,从而相应的该产品流转物流信息也会在上位机管理系统中记录并衔接流转。
[0003]然而,这种通过一、二维码标签录入信息的方式在有些场合并不适用,例如如下几种情况:1)如热态钢卷/板坯表面,它们由于表面温度较高,标签的安装和扫描作业实施比较困难,且标签在如此环境下较容易失效,这样的环境不适合采用标签读写器方式;2)由于钢铁生产制造及相关领域,产品多数都是金属,对于电子标签来讲,金属的无线信号穿透能力很弱,而且这些产品一般质量较重,很容易产生磕碰,电子标签极易容易损坏,如果采用纸质标签,也较容易磨损,且很多产品表面光滑度和整洁度很差,纸质标签贴上去之后,并不能很好的读取产品信息,这些情况下不适合采用标签读写器方式。
[0004]目前在钢铁生产制造及相关领域流行的解决方法是在产品的表面喷印产品的标识信息字符串,然后通过人眼观察来抄录这些字符串并输入到上位机系统中。人完成整个录入工作,一般包括识别抄写和校验录入两个动作,由于许多不可控因素(如心情,疲劳度等),这种方法经常会造成抄错和漏抄情况,而且生产效率较低。在这种情况下,可以通过一种喷印字符图像识别与校验系统及方法来解决这个问题。通常,喷印在产品表面的字符串标识信息录入可以采用图像识别的方法,图像识别系统获取含有产品字符串标识的图像,进行分析处理,获得识别结果,将结果录入到产品跟踪管理系统中。但是由于字符串标识的识别准确率不能够达到100%,会有一定的误识。判断字符串标识识别是否误识,通常是将识别出来的结果与该产品开始流通时,系统生成并传送给喷印设备的原始字符串标识进行比较,如果相符则判定为正确,相反,则是错误的。然而,由于产品在流通过程中,产品固有位置的变化等外在因素会导致产品开始流通时系统生成的原始字符串标识与对应产品不能一一对应,从而直接导致该产品识别的结果没有标准可以进行比对,也致使系统不能够自动判别识别结果是否正确,需要人眼对照产品上的字符进行判定。
[0005]通常情况下,系统会根据产品的固有信息和对应的编码原则,对每一件产品生成一个唯一的字符串标识,然后采用喷印设备,将字符串标识等信息字符喷涂到该产品的表面,那么在后续的生产流通过程中,该产品就获得了唯一标识。
[0006]经检索,针对字符识别及结果校验的问题,主要有以下几种解决方式。[0007](I) —种实时IC卡数字字符识别与校验系统及方法,专利申请号:200410034867.5。该方法对IC卡生产中IC卡上的印刷字符进行识别和校验。由于需要检测的IC卡数字字符是在上一道工序中已经印刷完成,而且校验参考字符(需校验的卡号字符)由上位机给定,因而只需将印刷的字符进行识别,将识别结果与标准的上位机给定的校验字符逐一比对,即可识别错误。
[0008]该专利主要涉及图像的识别过程,而校验过程是与标准的结果进行比对,对于如果不存在上位机给定校验参考字符的情况下,并未给以解决的方法。
[0009](2)字符识别结果验证设备和字符识别结果验证,专利申请号:201010588384.5。该发明涉及字符识别结果验证设备和字符识别结果验证方法,在一个实施例中,字符识别结果验证设备具有组成生成部和验证图像生成部。组生成部从包括多个字符图像的文档图像中生成包括了被识别为相同的多个字符图像的组。验证图像生成部通过叠置在生成的组中包括的多个字符图像,生成包括第一区域和第二区域的验证图像。第一区域所对应的像素在多个字符图像的全部中具有相同的像素值、第二区域所对应的像素在多个字符图像的一部分中具有相同的像素值。通过比较两个区域来判断识别的结果是否正确。
[0010]该方法提到了可以通过对识别结果为同一类的字符采用叠置的方法来生成第一区域和第二区域,在对这两个区域的图像进行比对来完成验证识别的结果是否正确;而本发明对识别结果采用校验法则计算校验码,然后对图像中以后的校验码识别获得识别校验码结果,然后比对两者校验码,如果一致则识别的结果是正确的,如果不一致则识别是错误的。

【发明内容】

[0011]针对现有技术中的缺陷,本发明的目的是针对字符型产品信息录入提供一种喷印字符图像识别与校验系统及方法,当产品在不适合使用标签读写器方式来进行字符型产品信息录入的时候,可以采用本发明提供的方法来完成产品字符型标识信息录入,并根据易识别且识别准确率高的校验字符来对识别的结果进行校验,从而判断识别的结果是否正确,为信息录入增加安全保障。
[0012]根据本发明的一个方面,提供一种喷印字符图像识别与校验系统,包括:字符生成部分、字符喷印部分、字符识别部分和字符校验部分,其中:
[0013]所述字符生成部分包括字符本身部分(称字符本部)、校验码部分和衔接部分,字符本部是指标识该产品的字符串,是字符生成部分的主体;校验码部分位于字符本部之后或之前,是根据一定的校验法则来校验字符本部识别是否是准确的字符;衔接部分是连接字符本部和校验码部分的中间部分;当系统根据产品的生产特性为该产品分配一个标识字符串时,字符生成部分就会根据该标识字符串(字符本部),自动的将该标识字符串的校验码部分字符串和衔接部分字符串加到字符本部字符串后面或前面,从而生成整个字符串,该字符串称为字符生成字符串;
[0014]所述字符喷印部分,用于实现字符生成部分生成的字符串在产品表面的喷印;
[0015]所述字符识别部分,用于通过图像识别的方式识别出产品上的喷印字符串;
[0016]所述字符校验部分,对所述字符识别部分的识别结果采用校验法则计算校验码,判断识别结果是否正确。[0017]本发明上述整套系统能够自动实现产品表面字符标识的自动识别和自动校验,无需人眼对识别的结果字符和表面实际喷印字符进行一一比对,有效的降低了劳动强度。
[0018]本发明中,所述字符生成部分是整个系统的起始部分,其中:
[0019]所述字符本部一般由字母或数字或两者混合组成,当一件产品处于流通环节的起始位置时,系统会为该产品分配一个标识该产品的标示符字符串,这部分字符串是由系统根据该产品的生产特性自动生成的,是生产环节中能够唯一标识该产品的代码。
[0020]所述校验码部分与字符本部不一样,是由特殊字符组成的(即后面描述的约束条件确定),校验码的字符取值范围不包含在字符本部范围内。如果校验码部分含有字符本部已经存在的字符,且字符本部该字符已经错误,那么校验码也可能发生错误,识别的结果自然也是错误的。这样并不能实现校验码校验字符本部的功能。
[0021]鉴于此,校验码需具备一定的独立性和易识别性才能使校验码字符能够更加准确的校验字符本部的字符串正确与否,校验码应该满足以下要求:
[0022]I)校验码应该与字符本部的字符相关性低,也即是校验码要尽量与字符本部的字符不同,从而防止将校验码误识为字符本部的相关字符。
[0023]2)校验码设计和实现都应该简单,相对于字符本部,校验码部分的字符应该更加容易识别。
[0024]3)校验码的识别应当具有一定的冗余特性,即当校验码出现一定程度的破损,依然不影响识别的正确性。
[0025]当校验码满足上述条件时,校验码本身具有很高的识别精度,从而能够通过校验码的正确识别,判断已经识别出来的字符串是否正确。
[0026]所述衔接部分是连接字符本部和校验码部分的中间部分,衔接部分可以通过该部分的字符告知计算机字符本部的字符串已经结束和校验码部分的字符即将开始。当字符本部的字符串与校验码部分的字符差别不大时,可以通过设计衔接部分的字符来将两部分区另IJ,从而得知哪一部分是字符本部,哪一部分是校验码。对于本发明,由于上述的校验码部分与字符本部字符串差别较大,能够比较明显的进行区分,因而可以不必设计衔接部分字符,故将衔接部分置为空。
[0027]本发明中,所述字符喷印部分是整个系统的第二个部分,是字符生成部分生成的字符串在产品表面的喷印实现。字符生成字符串会从上位机传输到下位机的喷印控制系统中,下位机的喷印控制系统则根据预定好的字符大小和喷印点数,将所有的字符生成字符串转化为喷印控制器能够识别喷印点阵图案,然后喷印控制器根据喷印点阵图案控制喷印执行机构在产品表面的某位置喷印字符生成字符串,从而形成可见的产品表面字符串。
[0028]本发明中,所述字符识别部分包括字符串分割模块、字符分割模块、特征提取模块和字符识别模块,其中:
[0029]所述字符串分割模块,将喷印在产品表面的字符串从背景图像中分割出来;
[0030]所述字符分割模块,在字符串从背景分割出来之后,将分割的字符串拆分为单个的字符;
[0031]所述特征提取模块,通过提取不同类别字符的同种类型特征将字符进行归类;
[0032]所述字符识别模块,根据所述特征提取模块提取的特征,对字符进行识别。
[0033]优选地,所述字符串分割模块包括字符串图像读取子模块、字符串分割子模块,其中:
[0034]所述字符串图像读取子模块,通过终端图像采集设备采集并存储字符串图像;
[0035]所述字符串分割子模块对所述字符串图像读取子模块采集的图像,根据字符串部分的灰度、色彩或灰度梯度特征与背景区域对应的特征不相同将字符串从背景区域中提取出来,将提取出来的字符串部分二值化操作,最后形成的图像为二值化图像,字符串部分为前景色,其余部分为背景色。
[0036]更优选地,所述字符串分割模块进一步包括字符串预处理子模块,该子模块在所述字符串图像读取子模块读取字符串图像之后,对读取的图像进行灰度化和去噪处理等预处理(如果需要利用图像的色彩特征也可以不必进行灰度化),然后再将预处理后的图像送到所述字符串分割子模块。
[0037]优选地,所述字符分割模块包括字符串二值化图像倾斜度调整处理子模块、单个字符的分割处理子模块、单个字符的归一化处理子模块,其中:
[0038]所述字符串二值化图像倾斜度调整处理子模块,对字符串分割之后的二值化图像中字符串位置进行倾斜度调整处理,将字符串的位置调整为近似水平位置。将字符串按照宽度方向均分为前半部分和后半部分,通过计算字符串前半部分的形心坐标和后半部分形心坐标可以确定字符串与水平方向的夹角,获得夹角之后,可以将整个字符串沿着夹角的反方向旋转,从而将字符串调整为水平位置。
[0039]所述单个字符的分割处理子模块,在二值化字符串倾斜度调整为水平后,根据字符串前景色像素点在垂直方向和水平方向投影直方图来进行单个字符的分割处理;寻找垂直方向和水平方向投影直方图曲线的波谷,设定一个阀值,如果波谷位置对应的投影像素统计数值小于这个阀值,那么确定字符与字符的分割位置。确定字符与字符的分割位置后,可以将字符串图像分割为若干个单个字符。
[0040]所述单个字符的归一化处理子模块,对分割后的若干个单个字符进行归一化处理,将分割后大小可能不同的单个字符转化为同一尺寸大小的字符,方便后续的字符特征提取处理。
[0041]优选地,所述特征提取模块,字符之间不同的特征是区别字符类别的关键(如数字字符8有两个圈圈与数字字符I没有圈圈等),可以通过提取不同类别字符的同种类型特征(如提取归一化字符的逐像素灰度特征等)将字符进行归类。常用的字符特征有逐像素灰度特征、水平垂直方向的灰度投影特征等。
[0042]优选地,所述字符识别模块,包括字符本部识别子模块和校验码字符识别子模块,其中:
[0043]所述字符本部识别子模块,按照特征提取的方法,提取不同类别字符的同一类型的特征,如果字符的类别是相同的,那么提取同一类型特征也将是极其相似,因而可以采集大量的字符样本,将这些样本分为不同的类别,对所有的样本采用同一种特征提取方法,同一种类别的字符特征将是非常相似,且与其它类别字符的特征形成差异,根据这些已知的字符样本相似性和差异的统计,可以形成字符分类器。当遇到新的字符时,将新的字符与已知样本形成的分类器中的所有类别字符的特征进行比对,找出与已知类别字符特征相似性最高的字符类别,并将新的字符类别置为与其相似性最高的字符类别。通常分类器的设计方法有多种,如神经网络分类器设计方法、基于向量机的分类器设计方法、聚类分类器设计方法等。
[0044]所述校验码字符识别子模块,因为校验码部分的字符与字符本部字符识别不一样,它不是由数字和字母组成的,因而不能与字符本部共用一套字符分类器来识别。校验码字符的识别可以根据其设计原则和本身具有的特性来实现的识别方法,根据这这套识别方法来识别校验码。
[0045]本发明中,所述字符校验部分,经过字符本部部分的识别,能够获得字符本部对应的字符串,而检验码部分的字符串按照校验码字符的识别方法也可以识别出来。由于校验码是字符本部字符串的每一个字符对应的ASCII码值,按照一定的校验法则,形成的16进制的字符串。一个字符本部字符串对应唯一一个校验码字符串,通过检验校验码部分识别出来的字符串,与字符本部识别出来的字符串对应的校验码是否一致来判定识别是否正确。
[0046]根据本发明的另一个方面,提供一种喷印字符图像识别与校验方法,该方法基于上述系统,由以下步骤构成:
[0047]字符生成步骤:用于生成包括字符本部、校验码部和衔接部分的整个字符串;
[0048]字符喷印步骤:用于实现字符生成部分生成的字符串在产品表面的喷印;
[0049]字符识别步骤:用于通过图像识别的方式识别产品上的喷印字符串;
[0050]字符校验步骤;对字符识别结果采用校验法则计算校验码,接着对图像中以后的校验码识别获得识别校验码结果,然后比对两者校验码,如果一致则识别的结果是正确的,如果不一致则识别是错误的。
[0051]优选地,所述字符生成步骤中:
[0052]字符本部生成,是产品根据其生产特性(比如生产日期),生成能够代表该产品特性且唯一标识该产品的字符串;
[0053]校验码部生成,是根据字符本部生成的字符串,按照校验法则,获得校验码字符串,然后再根据校验码字符串,设计能够代表校验码字符串的特殊字符代码串;
[0054]衔接部分字符串生成,是生成用于区分成字符本部字符串和校验码字符串的字符标识串。
[0055]优选地,所述字符喷印步骤,将所有的字符生成步骤生成的字符串转化为喷印控制器能够识别喷印点阵图案,然后喷印控制器根据喷印点阵图案控制喷印执行机构在产品表面的某位置喷印字符生成字符串,从而形成可见的产品表面字符串。
[0056]优选地,所述字符识别步骤,包括字符串分割、字符分割、特征提取和字符识别四个子步骤。
[0057]更优选地,所述字符串分割子步骤,按照视频图像读取步骤、图像预处理步骤和字符串分割步骤进行;其中:
[0058]所述视频读取步骤,是通过图像终端设备,将镜头视场的图像采集到计算机对应的存储空间中;
[0059]所述图像预处理步骤,是将采集到的图像经过灰度化处理和去噪声处理(也可以进行HSV空间色彩分割处理)得到的图像;
[0060]所述字符串分割步骤,是根据图像预处理获得的图像,根据图像中字符部分灰度的特征,采用灰度聚类算法或者自适应阀值分割算法将字符串从背景图像中提取出来,并二值化表示(如果是进行HSV色彩分割处理,同样可以根据字符串区域图像的色彩,按照聚类算法来将字符串从图像中提取出来,并二值化表示)。
[0061]更优选地,所述字符分割子步骤,是对字符串分割步骤的结果图像,按照字符串二值化图像倾斜度调整步骤、字符分割步骤和字符归一化步骤来完成的,其中:
[0062]所述字符串倾斜度调整步骤,是将字符串按照宽度方向均分为前半部分和后半部分,通过计算字符串前半部分的形心坐标和后半部分形心坐标可以确定字符串与水平方向的夹角,获得夹角之后,可以将整个字符串沿着夹角的反方向旋转,从而将字符串调整为水平位置;
[0063]所述字符分割步骤,是在二值化字符串倾斜度调整步骤后,根据字符串前景色像素点在垂直方向和水平方向投影直方图来进行单个字符的分割处理;寻找垂直方向和水平方向投影直方图曲线的波谷,设定一个阀值,如果波谷位置对应的投影像素统计数值小于这个阀值,那么确定字符与字符的分割位置。确定字符与字符的分割位置后,可以将字符串图像分割为若干个单个字符;
[0064]所述字符归一化步骤,是对字符分割步骤后的若干个单个字符进行归一化处理,将分割后大小可能不同的单个字符转化为同一尺寸大小的字符,方便后续的字符特征提取处理。
[0065]更优选地,所述特征提取子步骤,是在字符分割步骤结束,通过提取不同类别字符的同种类型特征(如提取归一化字符的逐像素灰度特征等)将字符进行归类。常用的字符特征有逐像素灰度特征、水平垂直方向的灰度投影特征等
[0066]更优选地,所述字符识别子步骤,包括字符本部识别步骤和校验码字符识别步骤,这两个步骤可以同时进行;
[0067]所述字符本部识别步骤,按照特征提取的方法,提取不同类别字符的同一类型的特征,如果字符的类别是相同的,那么提取同一类型特征也将是极其相似,因而可以采集大量的字符样本,将这些样本分为不同的类别,对所有的样本采用同一种特征提取方法,同一种类别的字符特征将是非常相似,且与其它类别字符的特征形成差异,根据这些已知的字符样本相似性和差异的统计,可以形成字符分类器。当遇到新的字符时,将新的字符与已知样本形成的分类器中的所有类别字符的特征进行比对,找出与已知类别字符特征相似性最高的字符类别,并将新的字符类别置为与其相似性最高的字符类别。通常分类器的设计方法有多种,如神经网络分类器设计方法、基于向量机的分类器设计方法、聚类分类器设计方法等;
[0068]所述校验码识别步骤,因为校验码部分的字符与字符本部字符识别不一样,它不是由数字和字母组成的,因而不能与字符本部共用一套字符分类器来识别;校验码字符的识别可以根据其设计原则和本身具有的特性来实现的识别方法,根据这这套识别方法来识别校验码。
[0069]优选地,所述字符校验步骤,经过字符本部部分的识别,能够获得字符本部对应的字符串,而检验码部分的字符串按照校验码字符的识别方法也可以识别出来。由于校验码是字符本部字符串的每一个字符对应的ASCII码值,按照一定的校验法则,形成的16进制的字符串。一个字符本部字符串对应唯一一个校验码字符串,因而可以通过检验校验码字符串判断识别的字符本部字符串是否正确。[0070]与现有技术相比,本发明具有如下的有益效果:
[0071]本发明提出了一种可用于识别产品标识编号的方法和系统,该系统和方法可以用于钢铁和其他行业中不便使用标签读写器方式进行产品信息录入的地方,并提出了一种识别编码的校验码字符设计,该校验码识别容易,误识率低,能够有效保证该系统和方法识别编码的正确性。
【专利附图】

【附图说明】
[0072]通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0073]图1为本发明一实施例系统组成图;
[0074]图2为本发明一实施例字符生成部组成图;
[0075]图3为实施例产品编号字符串字符本部;
[0076]图4为实施例产品编号字符串校验码部分;
[0077]图5为实施例喷印字符图像识别及校验流程图;
[0078]图6为实施例产品A字符本部字符串;
[0079]图7为实施例一维码示意图;
[0080]图8为实施例校验码字符图案;
[0081]图9为实施例分割开的两个等腰直角三角形和相连的等腰直角三角形;
[0082]图10为实施例产品A表面标识字符串。
【具体实施方式】
[0083]下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
[0084]如图1所示,整个喷印字符图像识别与校验系统分四部分组成:字符生成、字符喷印、字符识别和字符校验。整套系统能够自动实现产品表面字符标识的自动识别和自动校验,无需人眼对识别的结果字符和表面实际喷印字符进行一一比对,有效的降低了劳动强度。下面介绍整个系统的四个部分。
[0085]I)字符生成部分
[0086]字符生成部分是整个系统的起始部分,如图2所示,字符生成部分可以分为三部分,字符本身部分(称字符本部)、校验码部分和衔接部分。
[0087]字符本部是指标识该产品的字符串,是字符生成部分的主体,一般由由字母或数字或两者混合组成,当一件产品处于流通环节的起始位置时,系统会为该产品分配一个标识该产品的标示符字符串,这部分字符串是由系统根据该产品的生产特性(如批号、材质等特性)自动生成的,是生产环节中能够唯一标识该产品的代码。如图3所示字符本部字符串,L表示是该产品是临时批次,0328表示生产的日期编号,58表示该当前生产日期生产同类产品的批次。该字符串的每一个字符可由M行N列的点阵构成,其中前景色(黑色)的点构成字符本身,背景色的点构成背景空白部分。[0088]校验码部分位于字符本部之后,是根据一定的校验法则(奇偶校验、BCC校验、CRC校验等)来校验字符本部识别是否是准确的字符,通常与字符本部不一样,是由特殊字符组成的(如BCC校验,是将字符本部识别出来的每一个字符对应的ASCII码进行异或,结果获得一个单字节的ASCII码,如果该ASCII码用16进制数表示,那么该数通常是由两个字符即0-9数字和A-F字母组成的字符串)。由此可见,校验码的字符范围包含在字符本部范围内。因此,如果校验码部分含有字符本部已经存在的字符,且字符本部该字符已经错误,那么校验码也不可能是正确的,识别的结果自然也是错误的。这样并不能实现校验码校验字符本部的功能。
[0089]鉴于此,校验码需具备一定的独立性和易识别性才能使校验码字符能够更加准确的校验字符本部的字符串正确与否,校验码应该满足以下要求:
[0090]I)校验码应该与字符本部的字符相关性低,也即是校验码要尽量与字符本部的字符不同,从而防止将校验码误识为字符本部的相关字符。
[0091]2)校验码应该设计和实现都应该简单,相对于字符本部,校验码部分的字符应该更加容易识别。
[0092]3)校验码的识别应当具有一定的冗余特性,即当校验码出现一定程度的破损,依然不影响识别的正确性。
[0093]当校验码满足上述条件时,校验码本身具有很高的识别精度,从而能够通过校验码的正确识别,判断已经识别出来的字符串是否正确。如图4所示的校验码字符,具有相当好的独立性、易识别性和冗余性,能够通过识别三角形这种简易图像达到识别校验码的目的。
[0094]衔接部分是连接字符本部和校验码部分的中间部分,衔接部分可以通过该部分的字符告知计算机字符本部的字符串已经结束和校验码部分的字符即将开始。当字符本部的字符串与校验码部分的字符差别不大时,可以通过设计衔接部分的字符来将两部分区别,从而得知哪一部分是字符本部,哪一部分是校验码。对于本发明,由于上述的校验码部分与字符本部字符串差别较大,能够比较明显的进行区分,因而可以不必设计衔接部分字符,故将衔接部分置为空。
[0095]2)字符喷印部分
[0096]字符喷印部分是整个系统的第二个部分,是字符生成部分生成的字符串在产品表面的喷印实现。当系统根据产品的生产特性为该产品分配一个标识字符串时,字符生成部分就会根据该标识字符串(字符本部),自动的将该标识字符串的校验码部分字符串和衔接部分字符串加到字符本部字符串后面,从而生成整个字符串,该字符串称为字符生成字符串。字符生成字符串会从上位机传输到下位机的喷印控制系统中,下位机的喷印控制系统则根据预定好的字符大小和喷印点数,将所有的字符生成字符串转化为喷印控制器能够识别喷印点阵图案,然后喷印控制器根据喷印点阵图案控制喷印执行机构在产品表面的某位置喷印字符生成字符串,从而形成可见的产品表面字符串。
[0097]3)字符识别部分
[0098]喷印完成后,产品表面带有唯一喷印标识的字符串会经过相应的流通环节,可以在这些流通环节将产品上的喷印字符串通过图像识别的方式将这些喷印字符串识别出来,从而记录该产品在该环节的流通记录。字符识别过程通常可以包括字符串分割、字符分割、特征提取和字符识别。
[0099]I字符串分割
[0100]字符串分割是指将喷印在产品表面的字符串从背景图像中分割出来,包括字符串图像读取、预处理、字符串分割三个步骤。字符串图像读取是指字符串图像通过终端图像采集设备采集并存储。字符串图像读取之后,需要对读取的图像进行灰度化和去噪处理等预处理(如果需要利用图像的色彩特征也可以不必进行灰度化)。预处理之后,可以根据字符串的整体特征(如色彩特征、灰度特征,或者灰度梯度特征等),根据字符串部分的灰度、色彩或灰度梯度特征与背景区域对应的特征不相同来将字符串从背景区域中提取出来,将提取出来的字符串部分二值化操作。最后形成的图像为二值化图像,字符串部分为前景色,其余部分为背景色。
[0101]2字符分割
[0102]将字符串从背景分割出来之后,需要将分割的字符串再拆分为单个的字符,这个过程为字符的分割。字符的分割通常包括字符串二值化图像倾斜度调整处理、单个字符的分割处理、单个字符的归一化处理。
[0103]由于字符串分割之后的二值化图像,字符串在图像中的位置可能是倾斜的,这样会对后续的处理过程和识别过程产生不利影响,因而需要进行倾斜度调整处理,来将字符串的位置调整为近似水平位置。将字符串按照宽度方向均分为前半部分和后半部分,通过计算字符串前半部分的形心坐标和后半部分形心坐标可以确定字符串与水平方向的夹角,获得夹角之后,可以将整个字符串沿着夹角的反方向旋转,从而将字符串调整为水平位置。
[0104]二值化字符串倾斜度调整为水平后,可以根据字符串前景色像素点在垂直方向和水平方向投影直方图来进行单个字符的分割处理。寻找垂直方向和水平方向投影直方图曲线的波谷,设定一个阀值,如果波谷位置对应的投影像素统计数值小于这个阀值,那么确定字符与字符的分割位置。确定字符与字符的分割位置后,可以将字符串图像分割为若干个单个字符。
[0105]分割后的若干个单个字符需要进行归一化处理,将分割后大小可能不同的单个字符转化为同一尺寸大小的字符,方便后续的字符特征提取处理。
[0106]3特征提取
[0107]字符之间不同的特征是区别字符类别的关键(如数字字符8有两个圈圈与数字字符I没有圈圈等),可以通过提取不同类别字符的同种类型特征(如提取归一化字符的逐像素灰度特征等)将字符进行归类。常用的字符特征有逐像素灰度特征、水平垂直方向的灰度投影特征等。
[0108]4字符识别
[0109]产品表面喷印的字符分为两部分,一部分是字符本部,是由普通的数字字符和字母字符构成;另一部分是校验码部分字符,是由一些特殊的设计图案构成。他们特征提取及以前的过程都是相同的,但是识别的过程是有区别的。
[0110]I)字符本部
[0111]按照特征提取的方法,能够提取不同类别字符的同一类型的特征,如果字符的类别是相同的,那么提取同一类型特征也将是极其相似,因而可以采集大量的字符样本,将这些样本分为不同的类别(如数字0-9,字母A-Z或a-ζ),对所有的样本采用同一种特征提取方法,同一种类别的字符特征将是非常相似,且与其它类别字符的特征形成差异,根据这些已知的字符样本相似性和差异的统计,可以形成字符分类器。当遇到新的字符时,将新的字符与已知样本形成的分类器中的所有类别字符的特征进行比对,找出与已知类别字符特征相似性最高的字符类别,并将新的字符类别置为与其相似性最高的字符类别。通常分类器的设计方法有多种,如神经网络分类器设计方法、基于向量机的分类器设计方法、聚类分类器设计方法等。
[0112]2)校验码字符
[0113]校验码部分的字符,与字符本部字符识别不一样,它不是由数字和字母组成的,因而不能与字符本部共用一套字符分类器来识别。校验码字符的识别可以根据其设计原则和本身具有的特性来独创一套识别方法,根据这这套识别方法来识别校验码。如图4的校验码识别,它最明显的特性就是字符由简易的三角形组合而成,因而可以通过对三角形的识别完成校验码的识别。
[0114]3)字符校验
[0115]产品表面喷印的字符串,包含两部分,一部分为字符本部字符串,一部分为校验码形成的字符串。经过字符本部部分的识别,能够获得字符本部对应的字符串。而检验码部分的字符串按照校验码字符的识别方法也可以识别出来。由于校验码是字符本部字符串的每一个字符对应的ASCII码值,按照一定的校验法则,形成的16进制的字符串。一个字符本部字符串对应唯一一个校验码字符串,因而可以通过检验校验码字符串判断识别的字符本部字符串是否正确。
[0116]当产品A处于流通环节的起始位置时,假定上位机系统根据产品A的生产特性分给产品A的生产单号为AS120722,采用一种喷印字符图像识别及校验和方法来识别产品A的单号,产品A的单号识别结构及步骤如图5所示。
[0117]I)从上位机获取产品A的生产单号AS120722,该生产单号即为字符生成部分的字符本部。
[0118]2)字符本部确定之后,选定字符校验方法。如果系统按照BCC校验方式来验证最后识别的字符是否正确,那么根据BCC校验法则,则不难获得生产单号AS120722的校验码为十六进制数16H。
[0119]3)选定字符喷印点阵图案方法,并进行校验码设计。产品A的生产单号为AS120722,该字符串的每一个字符都是由M行N列的点阵组成,如图6所示,根据校验码设计满足的三个原则,校验码设计如下:
[0120]①字符本部字符串的每一个字符是由M行N列(M>N)的点阵组成,则初步确定校验码每个字符大小为M行M列的正方形点阵组成。
[0121]②根据校验的法则,校验码总能通过2进制数O和I表示,用前景色点阵区域表示1,用背景色像素点阵区域表示O。由于喷印或印刷原因,字符整行或整列的前景像素点阵缺失情况较多,而其它情况点阵缺失的情况较少,如果采用类似一维码的编码原则,通过粗细不一的线条及空白的组合方式来表示不同的字符,那么当整行整列缺失的情况下(特别是整列),将会很容易的将正确的编码表示错误,如图7所示,图7左图为正确的,表示的二进制数位1010,而右图则是由于喷印过程中整列喷印缺失,造成粗线条变成了窄线条,结果表示的字符为二进制数00010,从而造成识别错误。[0122]③为应对上述问题,存在如下解决方法。
[0123]等腰直角三角形表示法。根据1,校验码每个字符是M行M列的正方形点阵,可以将正方形点阵按照对角线划分,则可以分为四个等腰直角三角形,采用等腰直角三角形前景像素点阵区域表示1,空白的等腰直角三角形背景像素点阵区域表示O。将四个相同大小的等腰直角三角形组成正方形,这种方式具有以下几个方面的优势:第一,三角形是最简单最基本的图形种类,非常容易识别;第二,正方形点阵区域一定的情况下,等腰直角三角形能够实现分割区域的数量较多(能够表示较多的二进制数O和1),且同时等腰直角三角形具有较多的垂直和水平穿越射线(水平垂直的穿越射线越多,则表明当出现整行整列喷印缺失的情况下,造成的影响越低);第三,等腰直角三角形中等腰和直角的特性,可以实现多种组合(如两个等腰直角三角形可以组成一个大的等腰直角三角形,四个可以组成正方形),且各种组合具有自己独特的特性,如单个等腰直角三角形可以根据斜边的外法线方向不同来规定二进制数O和I的排序(假定字符本部字符的顺序为从左到右,且斜边外法线方向按照逆时针顺序,那么图8的校验码可以表示为1110),而两个等腰直角三角形形成的大等腰直角三角形,其斜边法线方向与单个等腰直角三角形斜边法线方向不同。
[0124]上述校验码的识别方法为:1)统计前景色点阵的点数,确定正方形点阵存在的前景色形成的等腰直角三角形数目(通过所占整个正方形点阵的比率确定)和背景色形成的等腰三角形数目;2)根据三角形检测方法,检测获取三角形区域。等腰直角三角形所有组合类型中,只有二种组合类型,它的前景色点阵形成的组合形状为非三角形形状,一种如图8所示,它包含的前景色点阵区域为非三角形形状,但是背景色点阵形成的却是三角形形状,因而对于这种情况可以通过检测背景像素点形成的三角形区域来确定整个正方形点阵的三角形组成;另一种为正方形,也即是正方形整个点阵区域都为前景色或者都为背景色,那么这种情况也非常好检测,直接通过I)就可以知道。3)确定三角形斜边法线的大致方向,确定前景色等腰直角三角形的排列顺序,形成二进制数O或I的排列顺序。如果是单个的等腰直角三角形,如图9,校验码表示为1010,很容易的确定三角形斜边法线方向,如果是两个等腰直角三角形合成的大的等腰直角三角形,也很容易获得其斜边法线方向,其法线方向与小等腰直角三角形法线方向很不相同,可以根据其法线方向和I)确定的三角形数目共同确定校验码O或I的顺序。
[0125]4)确定字符本部字符串和字符校验码部分的字符之后,需要将字符本部的字符串及校验码部分的字符喷印在产品表面上。字符本部的字符串由数字和字母构成,喷印后仍然为字母加数字的形式;而校验码部分的字符,则主要是由等腰直角三角形组成的正方形点阵区域,字符本部的顺序是从左到右,那么校验码等腰直角三角形区域也将是按照从左到右的顺序,且为逆时针方向顺序。校验码为16H,其二进制数应为00010110,其中存在8个二进制数,因而需要8个小的等腰直角三角形组成的2个正方形点阵区域;而字符I的位置为从左到右的第4位、第6位和第7位,则外法线方向对应的从左到右逆时针方向的第4、
6、7个等腰直角三角形为前景像素区域,如果前景像素的灰度定义为黑色,则校验码部分的喷印字符图像如图8右图所不所不,而广品的整个字符串如图7左图所不。
[0126]5)整个产品的标识字符串生成之后,再由喷印或印刷设备将图7所示的字符串印到广品表面。
[0127]6)当该产品流通到某一生产环节,可以通过工业相机等图像采集设备(也可是手持式图像采集设备),将喷印在产品表面的字符串采集,形成的字符串数字图像如图7所示。
[0128]7)获取标识字符串之后,首先要将该字符串从背景图像中提取出来,可以采用的方法有许多,这里可以采用聚类算法(KMean)和自适应阀值分割算法相结合的方法来将字符串从背景图像中提取出来。
[0129]8)字符串从背景图像提取出来形成的图像是只包含字符串的二值化图像。然后计算二值化图像中字符串部分的左半部分像素的形心与右半部分的形心连线与图像基准坐标系X轴方向(图像的宽度方向)的夹角,从而可以调整字符串的倾斜角度,使之与图像宽度方向平行。
[0130]9)调整好字符串在图像中的水平位置之后,按照字符串前景像素段在宽度方向和高度方向的垂直投影,可以确定字符与字符之间的分割位置,从而将字符串分割成若干个字符,产品A的标识字符串可以分割成10个字符。
[0131]10)字符串分割成若干单个字符之后,由于每一个字符大小可能不同,确定一个字符串大小标准,建立所有字符串到标准字符串的映射关系,将大小不一致的字符转化为标准大小的字符(如都为M行N列)。
[0132]11)所有字符转化为相同大小的字符之后,提取每一个字符的特征,如逐像素特征提取法是根据字符前景像素的灰度来提取特征的,前景像素点的特征值为1,背景像素点的特征值为0,根据所在像素点的位置,将会形成一个由O和I组成的特征向量(M行N列的图像,将会存在M X N个O或I)。
[0133]12)由于整个标识字符串包含字符本部和校验码部分,将字符本部的每一个字符特征向量送到设计的分类器中进行分类,如神经网络分类器可以将特征向量作为神经网络输入层节点向量,按照神经中输入层节点到隐含层节点和隐含层节点到输出层节点的权值矩阵,可以计算出输出层节点的向量值,根据输出层向量,可以判定相应的输入层向量对应的字符类别。校验码部分的识别,根据三角形的位置和面积来进行识别,如图7右图,按照从左到右的逆时针顺序,可以看出,第一个正方形点阵包含一个等腰直角三角形,且等腰直角三角形的位置时第四位置,因而此字符的二进制数为0001,而第二个正方形点阵包含两个等腰直角三角形,其位置为2个和第三个位置,则第二个字符的二进制数为0110,将识别出来的两个二进制数进行合并,则可以获得的二进制数为00010110,为16进制数16.[0134]13)根据步骤11)可以分别识别出字符本部的各个字符和校验码部分的各个字符,如果经过图像采集和识别系统识别出来的产品A字符本部的识别结果为AS120722,则按照BCC校验法则,其校验码为16。而此时如果识别校验码部分的字符,能够获得16进制数字符串I和6,那么可以得之校验码部分获得的字符串与字符本部字符理论上的校验码相符,从而可以证明该字符串识别时是正确的。如果不相符,那么则证明该字符本部识别是错误的。
[0135]以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
【权利要求】
1.一种喷印字符图像识别与校验系统,其特征在于包括:字符生成部分、字符喷印部分、字符识别部分和字符校验部分,其中: 所述字符生成部分包括字符本部、校验码部分和衔接部分,字符本部是指标识该产品的字符串,是字符生成部分的主体;校验码部分位于字符本部之后或之前,是根据一定的校验法则来校验字符本部识别是否是准确的字符;衔接部分是连接字符本部和校验码部分的中间部分;当系统根据产品的生产特性为该产品分配一个标识字符串时,字符生成部分就会根据该标识字符串即字符本部,自动的将该标识字符串的校验码部分字符串和衔接部分字符串加到字符本部字符串后面或前面,从而生成整个字符串,该字符串称为字符生成字符串; 所述字符喷印部分,用于实现字符生成部分生成的字符串在产品表面的喷印; 所述字符识别部分,用于通过图像识别的方式识别出产品上的喷印字符串; 所述字符校验部分,对所述字符识别部分的识别结果采用校验法则计算校验码,判断识别结果是否正确。
2.根据权利要求1所述的喷印字符图像识别与校验系统,其特征在于,所述字符本部由字母或数字或两者混合组成,当一件产品处于流通环节的起始位置时,生产系统会为该产品分配一个标识该产品的标示符字符串,这部分字符串是由生产系统根据该产品的生产特性自动生成的,是生产环节中能够唯一标识该产品的代码。
3.根据权利要求2所 述的喷印字符图像识别与校验系统,其特征在于,所述校验码部分与字符本部不一样,校验码的字符范围不在字符本部范围内,是满足以下要求的特殊字符组成的: 1)校验码应该与字符本部的字符相关性低,也即是校验码的种类要尽量与字符本部的字符不同,从而防止将校验码误识为字符本部的相关字符; 2)校验码设计和实现都应该简单,相对于字符本部,校验码部分的字符应该更加容易识别; 3)校验码的识别应当具有一定的冗余特性,即当校验码出现一定程度的破损,依然不影响识别的正确性。
4.根据权利要求1所述的喷印字符图像识别与校验系统,其特征在于,所述衔接部分通过该部分的字符告知计算机字符本部的字符串已经结束和校验码部分的字符即将开始,当字符本部的字符串与校验码部分的字符差别不大时,通过设计衔接部分的字符来将字符本部和校验码两部分区别,从而得知哪一部分是字符本部,哪一部分是校验码;对于校验码部分与字符本部字符串差别较大,能够比较明显的进行区分,可以不必设计衔接部分字符,即将衔接部分置为空;对于字符本部字符数与校验码部分字符数都为固定的情况下,可以不必设计衔接部分字符,即将衔接部分置为空。
5.根据权利要求1所述的喷印字符图像识别与校验系统,其特征在于,所述字符喷印部分实现字符生成字符串在产品表面的喷印,字符生成字符串会从上位机传输到下位机的喷印控制系统中,下位机的喷印控制系统则根据预定好的字符大小和喷印点数,将所有的字符生成字符串转化为喷印控制器能够识别喷印点阵图案,然后喷印控制器根据喷印点阵图案控制喷印执行机构在产品表面的某位置喷印字符生成字符串,从而形成可见的产品表面字符串。
6.根据权利要求1所述的喷印字符图像识别与校验系统,其特征在于,所述字符识别部分包括字符串分割模块、字符分割模块、特征提取模块和字符识别模块,其中: 所述字符串分割模块,将喷印在产品表面的字符串从背景图像中分割出来; 所述字符分割模块,在字符串从背景分割出来之后,将分割的字符串拆分为单个的字符; 所述特征提取模块,通过提取不同类别字符的同种类型特征将字符进行归类; 所述字符识别模块,根据所述特征提取模块提取的特征,对字符进行识别。
7.根据权利要求6所述的喷印字符图像识别与校验系统,其特征在于,所述字符识别模块,包括字符本部识别子模块和校验码字符识别子模块,其中: 所述字符本部识别子模块,按照特征提取的方法提取不同类别字符的同一类型的特征,采集大量的字符样本,将这些样本分为不同的类别,对所有的样本采用同一种特征提取方法,同一种类别的字符特征将是非常相似,且与其它类别字符的特征形成差异,根据这些已知的字符样本相似性和差异的统计,形成字符分类器,当遇到新的字符时,将新的字符与已知样本形成的分类器中的所有类别字符的特征进行比对,找出与已知类别字符特征相似性最高的字符类别,并将新的字符类别置为与其相似性最高的字符类别; 所述校验码字符识别子模块,因为校验码部分的字符与字符本部字符识别不一样,它不是由数字和字母组成的,因而不能与字符本部共用一套字符分类器来识别,校验码字符的识别可以根据其设计原则和本身具有的特性来实现的识别方法,根据这这套识别方法来识别校验码。
8.根据权利要求1所述的喷印字符图像识别与校验系统,其特征在于,所述字符校验部分,将检验码部分的字符串按照校验码字符的识别方法识别出来,校验码是字符本部字符串的每一个字符对应的ASCII码值,按照校验法则形成的16进制的字符串,一个字符本部字符串对应唯一一个校验码字符串,通过检验校验码部分识别出来的字符串,与字符本部识别出来的字符串对应的校验码是否一致来判定识别是否正确。
9.一种采用权利要求1-8所述系统的喷印字符图像识别与校验方法,其特征在于,由以下步骤构成: 字符生成步骤:用于生成包括字符本部、校验码部和衔接部分的整个字符串; 字符喷印步骤:用于实现字符生成部分生成的字符串在产品表面的喷印; 字符识别步骤:用于通过图像识别的方式识别产品上的喷印字符串; 字符校验步骤:对字符本部的字符识别结果采用校验法则计算校验码,接着对校验码部分图像的识别获得识别校验码结果,然后比对计算校验码和识别校验码,如果一致则识别的结果是正确的,如果不一致则识别是错误的。
10.根据权利要求9所述的喷印字符图像识别与校验方法,其特征在于,所述字符识别步骤,包括字符串分割、字符分割、特征提取和字符识别四个子步骤; 所述字符识别子步骤,包括字符本部识别步骤和校验码字符识别步骤,这两个步骤独立或者同时进行; 所述字符本部识别步骤,按照特征提取的方法提取不同类别字符的同一类型的特征,采集大量的字符样本,将这些样本分为不同的类别,对所有的样本采用同一种特征提取方法,同一种类别的字符特征将是非常相似,且与其它类别字符的特征形成差异,根据这些已知的字符样本相似性和差异的统计,形成字符分类器,当遇到新的字符时,将新的字符与已知样本形成的分类器中的所有类别字符的特征进行比对,找出与已知类别字符特征相似性最高的字符类别,并将新的字符类别置为与其相似性最高的字符类别; 所述校验码识别步骤,校验码字符的识别根据其设计原则和本身具有的特性来实现的识别方法,根据这这套识别方法来识别校验码。
【文档编号】G06K9/54GK103914680SQ201310005117
【公开日】2014年7月9日 申请日期:2013年1月7日 优先权日:2013年1月7日
【发明者】张翼成, 陈欣, 陈良, 嵇小波, 戴锡春, 闻扬 申请人:上海宝信软件股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1