一种集装箱箱号识别方法

文档序号:6580169阅读:1178来源:国知局
专利名称:一种集装箱箱号识别方法
技术领域
本发明主要涉及光学字符识别(OCR)领域,尤其涉及一种集装箱箱号识 别方法。
背景技术
随着电脑技术的不断发展,越来越多的人期望机器能够自动快速并且正确 的阅读字符和数字用以提高人类的工作效率, 一个方面是汽车车牌的自动识别 技术,它被广泛的应用在交通部门,帮助有需要的部门日夜不停的检测通过视 频抓取系统抓取到的车牌号码,从而大大减少了人力成本,加快了工作效率以 及提高了工作准确率。而另 一个方面就是集装箱的箱号识别系统。
每一个集装箱都拥有它们独一无二的箱号,这些箱号在集装箱每一次的进 出港口,仓库,海关时都会被用到,箱号会出现在集装箱的五个面上(底面没 有箱号),而现阶段多数的码头,港口,海关和仓库都使用4喿作员去记录这些 箱号,然后输入到电脑中,这不仅浪费了大量时间与人力而且也会由于才喿作员 的各种疏忽导致记录错误。所以设计一款可以自动识别箱号并且可以将它与控 制系统紧密结合的软件是十分必要的。
然而自动识别系统的实现也面临着诸多困难,集装箱的箱号没有固定的字 体和大小,箱号的位置也会随着箱子的不同而发生变化,即^f吏同一个箱子中, 不同面上箱号的排列方向和位置也会不同,这些都会给识别带来一定的困难。 系统最初的带有箱号的集装箱图片来自于视频抓取装置(比较常用的是有自动 调焦性能的照相机,也可以使用摄像机等),可是白天的太阳光照强度,晚上 自动曝光系统的曝光能力,甚至集装箱箱面涂层的反光率都会大大影响系统最 后的识别结果,所以为了代替现有人手动记录箱号方式, 一款的稳定的,精确 地,对周围环境可适应强的自动字符识别系统的开发是极其有必要的。

发明内容
本发明的目的在于提供一种集装箱箱号识别方法,从而大大减少了人力成 本,加快了工作效率以及提高了工作准确率。
本发明所述的一种集装箱箱号识别方法,包括以下步骤
集装箱箱号的提取将得到包含集装箱箱号的图片经过图像处理技术切割 出有用的箱号,并对切割出的箱号再次经过图像标准化处理;
所述集装箱箱号的提取包括图像预处理、图像处理以及字符的切割与提 取;其中所述图像预处理包括图像的读取,图像灰度化以及为了降低噪音保持 图像平滑所使用的二维中值滤波器;所述图像处理包括图像去噪以及字符定 位、初次字符排列方向确定、图像二值化和最终字符排列方向确定;所述字符 的切割与提取包括字符提取、字符粘连部分切割以及抓取字符标准化处理;
字符识别得到经过图像标准化处理后的信息,使用神经网络技术和欧氏 距离法对切割后的字符进行识别。
本发明有益效果大大减少了人力成本,加快了工作效率以及提高了工作 准确率。


图1为本发明具体实施例所述的集装箱箱号识别方法的字符抓取流程图; 图2为本发明具体实施例所述的集装箱箱号识别方法中图像外拓和收窄 的示意图3为本发明具体实施例所述的集装箱箱号识别方法中中值滤波的示意
图4为本发明具体实施例所述的集装箱箱号识别方法中 径为二的星型膨胀的方法;
图5为本发明具体实施例所述的集装箱箱号识别方法中被认为是处于一 条直线(竖向)上的白色块状区域;
图6为本发明具体实施例所述的集装箱箱号识别方法中被认为是处于一 条横线(横向)上的白色块状区域;
图7本发明具体实施例所述的集装箱箱号识别方法中字符切割示意图; 图8为普通神经网络构造;
图9为本发明具体实施例所述的集装箱箱号识别方法中的第一层粗分神 经网络构造。
具体实施例方式
下面结合附图来说明本发明的具体实施方式

如图1所示本发明实施例所述的一种集装箱箱号识别方法,包括以下步

集装箱箱号的提取将得到包含集装箱箱号的图片经过图像处理技术切割 出有用的箱号,并对切割出的箱号再次经过图像标准化处理。
所述集装箱箱号的提取包括图像预处理、图像处理以及字符的切割与提 取。其中
所述图像预处理包括图像的读取和标准化、图像灰度化以及图像中值滤波。
所述图像的读取和标准化,是将照片输入格式全部转化为24位的BMP 图片格式作为输入样本,图像尺寸都会被缩放到768*576 (水平方向*竖直方 向)。
所述图像灰度化,使用的灰度计算公式是
<formula>formula see original document page 7</formula>
以上方程式中gray(ij)为图像处理后的点(i,j)处的灰度值,r(ij')是原图中点(i,j)处的红色像素值,g(ij),b(i,j)分别是原图中点(i,j)处的绿色和蓝色的像素值。由 以上方程式可以看出在经过灰度处理后的新图中,绿色所占的比例最大,所以 也有一些算法是直接使用绿色位面的像素值作为整幅图像的灰度值来进行运 算处理的,灰度化后,图片中任意坐标点所对应的灰度值范围都在(0 255)之
间,其中O为纯黑,255为纯白。
所述图像中值滤波,采用一个3*3的二维中值滤波器,首先对整张灰度化 后的图片进行扩边,如图2所示,将原图片最外面的那个像素进行了复制拓边, 结果使图像上下左右各个边缘像素向外拓了 一个像素。新的边界像素值与原来 边界像素值的完全相同。图2中粗线包围部分所框的数据为原始数据,原始数 据外面包裹的一层'壳,是拓边以后复制出来的数据,拓边以后的图像的尺寸 为770*578,即水平方向为(768+2),竖直方向为(576+2),在拓边以后的新 图中做3*3的中值滤波。所述3*3中值滤波是指把以图像中一个点(x,y)为中心 的3*3小窗内的所有像素的灰度从小到大的顺序排列,将中间大小的值作为(x,y) 处的灰度值,如图3所示。完成滤波以后全图像需要进行收窄已达到和原始图 ^象的一样的尺寸,即768*576,收窄图^象是指去掉原先加上去的'壳,,相当 于一个逆向的外拓,从而减少了图像噪音平緩突兀的色相变换。
所述图像处理包括图像去噪以及字符定位,求边阈值设定,边缘膨胀,填 充,和腐蚀,区域描边和第一次逻辑去噪,初次字符排列方向判断、图^象二值 化以及最终字符排列方向确定、滤噪与字符提取。
所述图像去噪以及字符定位,是过滤器使用一个边缘探测技术,求边阈值 设定,边框膨胀,填充,腐蚀技术,区域描边以及特定的逻辑判断技术。
所述边缘探测技术采用Sobel因子求边算法,Sobd因子其实是一对因子, 其中包括横向检测因子gl = [-1 -Ti -1 ; 0 0 0 ; 17t l]和竖向检测因子g2 = [-101; -兀0 7T; -1 0 l];主要的计算公式如下
乂'=0
+公式中Image是指要求被求边的灰度图像。即使相同的Sobel算法,不同的求 边因子对会产生不同的效果,经过实际的检验,发现使用gl = [-1 -3.1415 -1 ; 0 00 ; 1 3.1415 1]和g2: [-1 0 1 ; -3.1415 0 3.1415 ; -1 0 1]来计算,所得到的图 像边缘会比较清晰。经过Sobel因子求边之后的图像是一个具有特殊意义的灰 度图。图中的像素依然位于O到255之间,但与原来的灰度图略有差异,原图 中坐标点所对应的像素与相邻坐标点所对应的像素越接近,那么在新图中该点 所对应的像素就越接近0,反之,如果原图中坐标点所对应的像素与相邻坐标 点所对应的像素相差越大,那么在sobel因子求边后的新图中该点所对应的像 素就越接近255 (白色)。但是它仍然不是一个二值图,所以在这里需要加入 一个阈值来区分边缘。
所述求边阈值设定采用迭代法的算法,迭代法是一种用于求取平均权重的 方法,首先求取全图像的最大和最小像素,将它们的平均值作为迭代法的初始 变量threshold = (Px—max - Px—min)/2。然后在全图中求出大于初始变量的^f象 素平均数Px_p—ave,即大于初始变量的^f象素总(sumj )和除以它的个数 (p一count),和小于于初始变量的像素平均数Px—n—ave,即小于初始变量的像素 总和(sum—n)除以它的个数(n一count)。
Px_p—ave =sum_p / P—count, Px—n—ave =sum—n / n—count 。 如果Px_p—ave和Px—n—ave的平均值等于threshold,那么阈值就是 (Px_p—ave+Px_n_ave )/2,否者将(Px_p—ave+Px_ n ave ) /2代替threshold重 新开始计算, 一直到threshold与(Pxj—ave+Px—n一ave)/2相等。最后将得到阈 值对经过Sobel算法求边后的灰度图进行二值化处理,得到一张边际明显的專仑 廓图。
所述边缘膨胀,填充,和腐蚀,其中边缘膨胀使用星型膨胀方法,膨胀半 径是2个像素,即将原图中凡是像素是255的点都向上下左右拓展2个像素, 此膨胀方法是为了弥补求边算法的不足,目的是将非闭合的字符轮廓闭合,如 图4所示,经过边缘膨胀步骤以后,绝大多数的字符轮廓已经闭合,所述填充 是将封闭轮廓中的位图填白,也就是从左到右,从下到上开始检测填充图像, 首先将最左下角填白,如果已经是白色的话就不需要改变颜色,然后判断它的 相邻4个方位中是否有白色(255 )的像素点,如果没有,就4巴相邻的方向上(来的方向除外,即到达这个像素点的上一个像素点不算,否则会形成死循环) 填白,然后再以四个方向继续散射,如果遇到白色像素点或者是图片边界,那 么就不需要填白,也不可以越过边界或者白色轮廓,也就是说假设上方是边界 或者白色像素,那么对于本次检测而言就上方就不用散射了。重复执行直到没 有可以填白的地方为止,记录填白的个数,然后从左到右下到上检测是否有还 有黑色部分(例如被白色轮廓包围的封闭空间内没有填白),如果有再执行, 记录每个被填白区域的像素总量,将大于像素总量预设值的图像区域和它的轮 廓变回成黑色(因为可能是背景或者其他不可能包含字符的区域)。填充完毕 以后使用腐蚀的步骤,尽可能的将由膨胀所产生的噪音消除,将粘连的字符断 开,这里使用了一个半径为1的星型腐蚀法,即扫描图像,寻找白色像素点, 一旦发现,判断该像素点前后左右四个方向是否都是白色,如果是的话,那么 就在新图中将该点所对应的坐标填白,都则的话就在新图中该点所对应的坐标 点填黑。
所述区域描边和第一次逻辑去噪,其中区域描边是将可能是字符的白色区 域用长方形矩形框起来,记录可能是字符的白色区域所对应的图像位置,面积 大小,中心点位置等等信息,根据字符特点将那些完全不可能是字符的白色区 域去掉(比如说太小的区域和太大的区域)。
所述初次字符排列方向判断,将字符预:没为竖向,将^L矩形边框框住的可 能是字符的白色区域(以后简称白色块状区域)的最小X坐标按照从小到大 排列,将相邻X最小值只相差半个字符宽度的首尾X最小值相差不超过1.5 个字符宽度的白色块状区域认为是处于一条直线上的(如图5所示),如果在 包含最多块状区域个数的那条直线上块状区域个数大于6个,那么就认为在照 片中该集装箱的字符排列方向是竖向。如果个数小于2个那么直接认为是横 向,如果白色块状区域个数在2-6个之间那么需要判断,这几个白色块状区域 的长度相加是否大于7个字符高度之和,如果是,也被认定是竖向排列,如果 不是那么就认定为横向。如果是竖向排列的话,选取包含白色块状区域个数最 多且长度相加大于300 (像素)的那一段为以后分段式二值化所用,如果是横 向排列的话,将所有被矩形边框框住的可能是字符的白色区域(以后简称白色 块状区域)的最小Y坐标或者中心点Y轴坐标按照从小到大排列,将相邻Y
10值小于半个字符长度,首尾Y值相差不超过1.5个字符长度的白色块状区域认 为是处于一条横线上的如图6所示。选取包含白色块状区域个数最多且宽度相 加大于250 (像素)的那一段为以后分段式二值化所用。
所述图像二值化使用的是分段二值化方法。由于白天日光强弱和照射角度 不同导致照片表面光照分布不同,而在晚上或者光线灰暗的时候自动曝光系统 会开启,由于各个集装箱表面涂层的反光率不同,所以会导致集装箱表面亮暗 分布不均,这样如果在整张图像中使用同一个二值化阈值来二值化图像的话根 本无法保证清楚地将所需的集装箱字符完整的显示出来,基于这个原因, 一个 高适性的二值化方法是必须的。首先将已经选取了的被方框框住的白色区域映 射到灰度图中,求取单个方框内的平均灰度值,在这里本发明需要做一个判定, 在包含白色区域最多的那条线上,中间块状区域(如果有6个块状区域的话, 那么就是第三个6/2=3,如果有7个块状区域的话,那么就是第四个(7+1) /2=4。)的像素决定了字符二值化后的颜色。如果平均像素<127,那么二值化后 字符就是黑色,否则就是白色。如果箱号是竖向排列,那么横向分段二值化, 如果是横向排列的话就进行竖向分段二值化。其中PX1是字符E的平均灰度 值,它的二值化范围是从图像最左边到E和M的中间,PX2是字符M的平均 灰度值,它的二值化范围是从E和M的中间到M和C的中间,以此类图得到 一张分段式的二值化图。
所述最终字符排列方向确定、滤噪与字符提取,再一次使用了与初次字符 排列方法类似的方法,但是如杲字符的颜色是黑色时,那么将全图反色,就是 黑变白,白变黑,如果字符是白色则不变。然后判断字符排列方向,首先将所 有可能是字符的白色区域用矩形框框住,经完全不可能的矩形框删去(比如说 是特别大的或者特别小的)将方向预设为横向,将余下的被矩形边框框住的可 能是字符的白色区域(以后简称白色块状区域)的最小Y坐标或者中心点Y 轴坐标按照从小到大排列,将相邻Y值小于半个字符长度,首尾Y值相差不 超过1.5个字符长度的白色块状区域认为是处于一条横线上的如图6所示。如 果有一条横线上方框个数大于等于6个且宽度相加大于250,如果有,那么就 认为是横向排列,且这条横线上就包含了箱号。那么再此横线上最小的Y值 (MINY)为起始Y值,(MINY-100)为终点,寻找在这个范围之内是不是存在在同一横线上的大于三个的字符串。如果有那么就是箱主代码。以横线上最大
的Y值(MAXY)为起始Y值,(MAXY+100)为终点,寻找在这个范围之内是不 是存在在同一橫线上的大于三个的字符串。如果有那么就是箱型代码。如果最 初的横向上没有6个以上的矩形框的就被认为是竖直排列。将被矩形边框框住 的可能是字符的白色区域(以后简称白色块状区域)的最小X坐标4姿照从小 到大排列,将相邻X最小值只相差半个字符宽度的首尾X最小值相差不超过 1.5个字符宽度的白色块状区域认为是处于一条直线上的(如图5所示),如果 直线上的矩形块个数没有超过6个,那么就认为字符不全或者没有包含箱号直 接退出系统,如果在一条竖线上有超过6个矩形框的字符串那么就认为是竖直 排列,并且该竖直线上包含了箱主和箱号信息。以该竖直线上矩形框的最大X 坐标(MAXX)为起始坐标,(MAXX+100)为终点坐标检查是否存在同一竖线 上的大于三个的字符串。如果有那么就是箱型代码。将这些可能拥有箱主信息, 箱号,和箱型的矩形区域保存下来,其他的地方全部作为噪音滤掉(去掉原先 有的矩形框)。
所述字符的切割与提取包括粘连以及切割,字符标准化处理。 所述粘连以及切割,由于集装箱箱号的排列方式,箱主代码一共有四位, 箱号是六位,验证码是一位,箱型是四位或者六位(其中两位是国家代码), 当横向排列是如果是三行排列方式,那么最上一行是箱主信息(四个字符), 如果该行大于四个字符,假设是五个的话,那么需要判断最左边和左边第二个 矩形框之间的间距D1和最右边与最右边第二个矩形框之间的间距D2的大小 是否有一个超过2个字符宽度.如果D1超过了,那么最左边那一个被认为是噪 音,应该去掉,如果D2则将最右边的字符作为噪音去掉。如果都没有超过那 么判断D1与D2之间的大小,大的那一行则作为存在噪音的部分。如果大于 五个矩形框那么判断相邻字符的间距,如果有任意两个矩形框间距大于两个 字符宽度的就证明这两个矩形框中有一边存在着是非字符的噪音,判断左右两 边矩形框的数量,大于三个矩形框的那一边被认为是包含箱主代码的部分。如 果该行矩形框是三个,那么就要判断是否有两个字符相粘连,判断最大宽度的 那个矩形框的宽度是否超过另外两个矩形框宽度平均值的1.5倍。如果有(S1) 那么就认为宽度最大的那一个矩形框中包含了两个字符。求取该矩形框的灰度
12直方图,如图7所示,可以在灰度图中求,也可以在二值化后的图中求,如果
要在灰度图中求那么就要将该矩形根据相同的坐标点映射到灰度图中,找到最
低的波谷地区,记录X坐标点作为切割点将该矩形框切开。其他的箱号和箱 型部分与前面的箱主部分判断与去粘连类似只是所包含的字符个数不同。
所述字符标准化处理,是切割后的二值化字符在进入识别系统之前需要经 过缩放从而达到字符标准化,以供神经网络识别,在本发明中输入的字符标准 格式是12 (宽度)*20 (长度)。它的具体计算公式如下
其中P代表缩放以后的字符,Q代表缩放以前的字符,w是指缩放前字符 的宽度,h是指缩放前字符的长度。Int ()方程是一个用四舍五入法取整的方 程,即小数位小于0.5以下的将小数位去掉,整数位不变。小数位大于等于0.5 的小数位也去掉。整数位加一,x,y是标准化后字符网格的坐标。P(x,y)是指位 于新字符网格坐标(x,y)上的像素。在所有字符中有一个字符比较特别说以 需要经过特殊处理,这个字符就是验证码,箱号代码的后面,即最长字符的最 后一位。
字符识别得到经过图像标准化处理后的信息,使用神经网络技术和欧氏 距离法对切割后的字符进行识别。
所述神经网络,如图8所示普通神经网络包括输入层,隐藏层和输出层。 在本发明中,输入层一共拥有241个输入点,由于标准字符大小是12*20,所 以一共有240个点,然后加入一个偏移量(B),所以是241个在输入点,对于 一个隐藏层的神经元来讲241个输入点依次对应了 241个权值,由于神经网络 的设计不同,隐藏层的层数不同,每层的神经元个数不同,会导致不一样的识 别效果,在本发明中一共使用了一个隐藏层20个隐藏神经元,那么输入层所 对应的权值个数是241*20 = 4820个,对于一般的神经网络而言,输出层只有 一个输出元,因此输出层的权值等于隐藏层的神经元个数。输出层的数据最后 会进入一个活化函数F,最基础的活化函数是一个阶跃函数,即如果输入大于 等于0那么输出就是1如果输入小于O,那么输出就是O。
如图9所示是本发明使用的包含欧氏距离法的两次神经网络字符识别方法,在第一次神经网络中,我们将字符粗分为A-Z,0-9—共36个字符组,这些 字符组中的字符不一定就是当前字符,比如说3, B, 6, 9, 8, O,这些字符都有可 能被划分到字符组8中,这时因为第一次需要将输入字符在识别36个字符中 识别出来,对于一个只有一个隐藏层的回馈式的BP神经网络而言识别精确度 并不会很高,因此在这里本发明引入了第二个细分神经网络(也是一个带有回 馈功能的BP神经网络),将粗分后的字符组再次细分,由于细分网络中只需 要识别有限的几个字符,那么它的识别精度将会大大提高。以下将会阐述神经 网络的技术细节,在这里用在第一个粗分系统来作为例子,首先是训练过程。 粗分系统中输出层一共有6个神经元,因为2的六次方是64,完全可以包含 A Z和0 9最多36个字符.输入层一共包含241个输入点,其中字符网格点上 的输入为240个(XI...X240),偏置为1个(-1),第一层权值数量是241个 输 入 *20 个 神 经 元 一 共 是 4820 个 (W1.1.1...W1.1.241,W1.2.1...W1.2.241...W1.20.241 ),如图9所示每一个神经 元都对应了 241个输入,Wl,l,l中第一个1表示隐藏层,第二个1表示第一个 神经元,第三个l表示第一个输入点所对应的权值,那么隐藏层中第二个神经 元第一个输入点所对应的权值应该是W1.2.1,以此类推。输出层的神经元所对 应的权值是120个(即20*6), W2.U...W2.6.20,所有权值的初始的大小是 在-1到1之间随机的数值。隐藏层的输出更具以下公式可以求得
1 + exp(F)_ 1 + exp(^ (『! x X))
输出层公式可以表达为:
根据期望值可以求出输出误差,假设期望值是A
3输出-(A隱Z)xZx(1 —Z)
由此可以求出隐藏层误差
Yx(l-r)"输出xW:根据输出层与隐藏层的误差和学习率可以改变输出层与隐藏层的权值变 化从而使结果不停地接近期望值A。将训练好的参数(W)放到系统中那么就 可以进行识别了。识别网络和训练网络区分在于,识别网络不需要回馈,这也 就意味着识别系统不会改变权值以及偏置。
系统输出会通过欧氏距离法进行计算,欧氏距离法其实是将输出神经元的 输出值与以上每一个的期望值进行比较,即将一到六个输出神经元的实际输出
与期望输出的差的平方相加,在36个字符中找到最小的一个值,与之对应的 那个就是所求的字符了。方程如下<formula>formula see original document page 15</formula>
其中Zi是第i个输出神经元的实际输出值,Ax,i是指表格一中第X (36 个字符之内)个字符的第i个输出神经元的期望输出值。Min()方程是求出这 36个比较结果中的最小值,那么最小值所对应的X就是欧氏距离中最4妄近的 相似度最高的字符。
第二层神经网络与第一层类似,只是将以分类的字符和其相似的字符再次 进行精确分类,字符在第 一层网络识别结束以后需要根据识别结果分别进入所 对应的第二次识别系统。
权利要求
1、一种集装箱箱号识别方法,包括以下步骤集装箱箱号的提取将得到包含集装箱箱号的图片经过图像处理技术切割出有用的箱号,并对切割出的箱号再次经过图像标准化处理;所述集装箱箱号的提取包括图像预处理、图像处理以及字符的切割与提取;其中所述图像预处理包括图像的读取,图像灰度化以及为了降低噪音保持图像平滑所使用的二维中值滤波器;所述图像处理包括图像去噪以及字符定位、初次字符排列方向确定、图像二值化和最终字符排列方向确定;所述字符的切割与提取包括字符提取、字符粘连部分切割以及抓取字符标准化处理;字符识别得到经过图像标准化处理后的信息,使用神经网络技术和欧氏距离法对切割后的字符进行识别。
2、 如权利要求1所述的集装箱箱号识别方法,其特征在于所述图像灰 度化,使用的灰度计算公式是<formula>formula see original document page 2</formula>以上方程式中gmy(ij)为图像处理后的点(y)处的灰度值,r(i,j)是原图中点 (i,j)处的红色像素值,g(ij),b(i,j)分别是原图中点(ij)处的绿色和蓝色的像素值, 图片中任意坐标点所对应的灰度值范围都在(0 255)之间,其中O为纯黑,255 为纯白。
3、 如权利要求1所述的集装箱箱号识别方法,其特征在于所述图像预 处理中的图像读取将所读入的图片转化为BMP格式。
4、 如权利要求1所述的集装箱箱号识别方法,其特征在于所述图像处 理中的字符定位使用了半径为2的星型膨胀法将二值化的轮廓图进行膨胀从 而得到封闭区域,将封闭区域填充后使用半径为1的星型腐蚀法将图像腐蚀出 独立的包含字符的白色区域,将白色区域用矩形框框住以备后用。
5、 如权利要求4所述的集装箱箱号识别方法,其特征在于所述图^f象去 噪以及字符定位,是过滤器使用一个边缘探测技术,求边阈值设定,边框膨胀, 填充,腐蚀技术,区域描边以及特定的逻辑判断技术。
6、 如权利要求1-3任一条所述的集装箱箱号识别方法,其特征在于所 述图像处理使用了分段二值化,具体步骤如下首先根据集装箱箱号排列规律 找到包含字符的白色区域,将包含所述白色区域的边框映射到灰度图中,求取 单个方框内的平均灰度值,根据像素值进行分段二值化;再根据像素平均值大 小来判断字符颜色,将由于字符像素较小而被判断字符颜色是黑色的二值化图 像全部反色,保证二值化后字体颜色是白色,背景颜色是黑色;最后将二值化 以后的白色区域用矩形框框住,根据字符特点通过过滤器将非字符的区域删 掉。
7、 如权利要求5所述的集装箱箱号识别方法,其特征在于所述边缘#1 测技术采用Sobel因子求边算法,其中包括横向检测因子gl-[-l-7c-l;000; 17i l]和竖向检测因子g2 = [-1 0 1 ;-兀O兀;-1 0 l];主要的计算公式如下公式中Image是指要求被求边的灰度图像,图中的像素位于0到255之间。
8、如权利要求5所述的集装箱箱号识别方法,其特征在于所述求边阈 值设定采用迭代法的算法,首先求取全图像的最大和最小像素,将它们的平均 值作为迭代法的初始变量threshold = (Px一max - Px_min)/2;然后在全图中求 出大于初始变量的像素平均数Px_p—ave,即大于初始变量的像素总(sum—p)和 除以它的个数(j^count),和小于于初始变量的像素平均数Px—n—ave,即小于初 始变量的像素总和(sun^n)除以它的个数(n—count):
9、如权利要求1所述的集装箱箱号识别方法,其特征在于所述字符标 准化处理方法如下将被方框框住的字符保存到数组中,按照原始大小数组与 标准化后的数组大小之间关系进行缩放,主要的计算公式如下/e喊A / 、Px_p—ave =sum_p / P一count, Px—n一ave =sum—n / n一count。其中P代表缩放以后的字符,Q代表缩放以前的字符,w是指缩放前字符的宽 度,h是指缩放前字符的长度,Int ()方程是一个用四舍五入法取整的方程, x,y是标准化后字符网格的坐标。P(x,y)是指位于新字符网格坐标(x,y)上的 像素。
10、 如权利要求9所述的集装箱箱号识别方法,其特征在于对所述字符 标准化处理标准化设计特殊双次神经网络,包括以下步骤1) 设计一个神经网络, 一次性粗略识别0 9, A Z —共36个字符,使用 欧氏距离法来筒化网络;2) 归一化标准化以后的字符数组,即将所有255变为1,以便运用在字 符识别中;3) 设计了另外一组神经网络,再一次对比较接近的字符进行识别,也使 用欧氏距离法简化网络。
11、 如权利要求10所述的集装箱箱号识别系统中,特征在于所述欧氏 距离法使一个网络一次性识别36个字符;输出层使用了6个神经元,可以表 达64个不同的输出结果;所述欧氏距离法是将输出神经元的输出值与每一个 期望值进行比较,在36个字符中找到误差最小的一个值,与之对应的那个就 是所求的字符了,方程如下其中Zi是第i个输出神经元的实际输出值,Ax,i是指表^"一中第X个字符的 第i个输出神经元的期望输出值,Min()方程是求出这36个比较结果中的最小值。
全文摘要
本发明公开了一种集装箱箱号识别方法,包括以下步骤集装箱箱号的提取将得到包含集装箱箱号的图片经过图像处理技术切割出有用的箱号,并对切割出的箱号再次经过图像标准化处理;字符识别得到经过图像标准化处理后的信息,使用神经网络技术和欧氏距离法对切割后的字符进行识别。本发明有益效果大大减少了人力成本,加快了工作效率以及提高了工作准确率。
文档编号G06K9/00GK101650780SQ20091017022
公开日2010年2月17日 申请日期2009年9月8日 优先权日2009年9月8日
发明者梁 任, 刘国庆, 徐勇军, 亮 杨, 郭寒军 申请人:宁波中科集成电路设计中心有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1