手写板坯号自动识别方法及识别装置的制作方法

文档序号:6464974阅读:642来源:国知局
专利名称:手写板坯号自动识别方法及识别装置的制作方法
技术领域
本发明涉及一种号码符号自动识别方法,尤其是钢铁制造等领域 的在线手写体板坯号自动识别的方法,及相应的识别装置。
技术背景随着炼钢、热轧生产自动化程度的不断提高以及生产节奏的日益 加快,在全自动的生产中出现的瓶颈问题之一是对手写体板坯号的识 别,落后的人工识别方式严重阻碍了产能的提高。经调查,目前钢铁企业对板坯号的识别方式均采用人工方式,即24小时人工值守,通过肉眼识别生产线板坯号,手动输入相应监 控系统进行核对,这样不但大大降低了识别效率,还容易出现辨识错 误或录入错误,导致数据出现不一致或不完整。当前,现有的号码识别工具或设备通常分为如下三种 一种是 对印刷体识别的系统,如最常见的汽车牌照的自动识别,这种方式抓取图像范围广,图像边界容易检测,而板坯号处在一个背景复杂的画 境中,没有明显的边界可以识别,利用汽车牌照的自动识别设备显然 行不通;另一种是通过写入时的笔画顺序或笔势来识别,如计算机以 及一些手机上的手写笔,由于板坯号往往存在明显的连笔,因此此类 识别装置对板坯号的识别也不可行;还有一种是对手写体的识别,如 邮政系统中的邮件的自动分拣系统,这种方式看似与板坯号的识别比 较类似,但是,经过对现场大量板坯号数据的测试发现,由于板坯书 写时的温度比较高,热空气造成字迹扭曲,同时,手写板坯号在炙热 的板坯上也有可能出现断字、模糊、淡化的结果。在这种情况下,手 写板坯号提取任务需要研究以下的一些内容书写笔划往往既涂草, 又相互粘连、覆盖,而且书写字体会产生倾斜,因此无法采用现有设备对手写字体切分识别。实验证明,以上三种方式对板坯号的识别率极低,都4于不通。发明内容本发明的目的在于针对上述现有技术无法识手写板坯号的现 状,提出 一种手写板坯号自动识别方法,同时给出相应的识别方装置, 从而解决钢铁企业全自动生产中出现的瓶颈问题,提高生产效率和管 理水平。为了达到以上目的,本发明的手写板坯号自动识别方法包括以下 步骤摄取步骤,摄取板坯号图像;存储步骤,存储对应不同字符数据信息的字符高宽比,以及摄取的待识别板坯号图像;图像处理步骤,抓取并处理存储的待识别板坯号图像;其中包括 图像转换抓取待识别板坯号图像,将其转换成灰度图像; 图像增强通过建立转换后灰度图像的直方图,并对直方图均衡化,使图像增强;去 噪对增强图像进行平滑滤波处理,去除图像中的背景噪音;二值化将去噪后的图像转化为二值图像;字符切分对二值图像进行水平和垂直方向的投影,得到投影直 方图,从中以预定的阈值分离出字符和背景信息,根据分离出的字符 数据信息从存储装置中调取相应的字符高宽比进行字符切分;提取特征量逐一提取切分后字符数据中的图像不变性特征量、 方向统计特征量和特征矢量;字符识别根据提取的字符特征量,采用预定的比较识别方法识 别出字符。本发明相应的手写板坯号自动识别装置包括摄像头,用于摄取板坯号图像;存储装置,用于存储对应不同字符数据信息的字符高宽比,以及摄取 的板坯号图像;图像处理装置,用于将抓取并处理存储的待识别板坯号图像;其中含 有图像转换装置,用于抓取待识别板坯号图像,将其转换成灰度图像;图像增强装置,用于通过建立转换后灰度图像的直方图,并对直方图均衡化,使图像增强;去噪装置,用于对增强图像进行平滑滤波处理,去除图像中的背景噪音;二值化装置,用于将去噪后的图像转化为二值图像; 字符切分装置,用于对二值图像进行水平和垂直方向的"t殳影,得 到投影直方图,从中以预定的阈值分离出字符和背景信息,根据分离 出的字符数据信息从存储装置中调取相应的字符高宽比进行字符切分;特征量提取装置,用于逐一提取切分后字符数据中的图像不变性特征量、方向统计特征量和特征矢量;字符识别装置,用于根据提取的字符特征量,采用预定的比较识 别方法逐一识别出手写字符。以上过程中图像数字的准确切分十分关键,由于数字识别需要单 个进行,所以必须把包含一系列数字的图像准确的切分开来,可以说, 图像数字切分的准确度将直接影响识别的准确率。由于板坯号的手写 体有可能产生粘连、笔画覆盖和字体倾斜,因此不能直接采用一般的 水平和垂直切分法,以上过程对图像进行水平和垂直方向的^:影、分离出字符信息,并且考虑到每个书写笔迹具有特定规律的字符高宽 比,因此根据处理后分离出的字符信息,调取预先统计存储的字符高 宽比,即可进行字符的合理切分,保证后续识别的准确率。总之,本发明不仅根据现场手写字符的特点,采用各种有效措施 去除干扰,使其清晰化,而且抓住了每个书写笔迹具有特定规律字符 高宽比的特点,在对字符图像进行必要处理之后,根据处理结果调取 预先统计的字符高宽比进行合理切分,从而保证了后续识别的准确 率,解决钢铁企业全自动生产中出现的瓶颈问题,提高生产效率和管 理水平。


下面结合附图对本发明作进一步的说明。 图1是本发明一个实施例的流程图。图2是图1实施例的图像二值化前后对照图。 图3是图1实施例的图像字符切割前后对照图。
具体实施方式
实施例一本实施例的手写板坯号自动识别方法包括图像摄取、存储、图像 转换、图像增强、去噪、二值化、字符切分、特征矢量化、字符识别 等主要步骤9 (参见图1)。具体过程如下图像获取和存储一一借助摄像头摄取板坯号图像;借助硬盘录像 机之类的存储装置存储摄取的待识别板坯号图像,并且根据对现场书 写者实际情况的统计,存储对应不同书写者笔迹特点的字符高宽比, 并使之与反映其书写特点的相应字符数据信息对应,该统计可以不断 进行,从而使存储内容通过学习训练不断丰富完善。以下过程借助计算机完成图像转换一一将彩色图像转换成灰度图像。摄像头采集的图像一言是不必要的冗余信息,所以在识别之前将彩色图像转化为8位灰度图像。一般的彩色图像都采用RGB颜色,根据彩色编码方程,把一副彩 色图像转化为灰度图像,其公式为Gm"0.3A + 0.59G + 0.11B ①图像增强 一 一 图像增强的目的是突出相关的专题信息,提高图像 的视觉效果,其具体过程为建立直方图,数字图像的直方图是图像每一个灰度级的概率统计 分布图,反映图像灰度分布的概貌。令变量r和s分别代表图像增强前后的像素灰度级,相应灰度级分布的概率密度分别为?,("、 P》)。 如像素灰度值已经归一化在区间
,则在灰度级坐标中r=0表示黑, r=l表示白。对区间[W]内任一个r值按变换函数"^。进行变换, TW满足两个条件(l)单值单调增加函数;(2) 0^n""。条件(1)使灰度级保持从黑到白的次序,条件(2 )保证映射变 换后像素灰度值在允许的范围内。从s到r的反变换为r = :r_10),o^"i <2〉同样,规定变量s也满足条件(1 )和(2 )。由概率理论知,若A(。和变换函数^7(。已知厂、)是单值单调增加函数,则有.〈3〉建立直方图实质是通过变换函数T("控制图像灰度级的概率密 度函数而改变图像的外貌。直方图均衡化,又称直方图平坦化,实质上是对图像进行非线性 拉伸,重新分配图像象元值,使一定灰度范围内象元值的数量大致相 等。对图像的直方图均衡化过程是通过变换函数&W"来完成的,s、r分别为目标图像和原始图像上的像素点(x,y)。对于连续图像,变换 函数为此式右边为累积分-CDF),由该式对r求导有<4〉<5〉代入公式2-4得到: 1 )=,尸 1,0 S " 1<6>这说明,在变换后变量s在定义域内,《")是均匀概率密度。 在图像增强意义上,这相当于像素的动态范围增加。对于离散图像,灰度级^的概率值为P _L,0" Sl,yt = 0,l,2,.."£ —1《/〉其中,n表示图像中像素的总数, 是在图像中出现这种灰度级的次数,L表示灰度级的数目,A&)为第k级灰度级的概率。与连 续图像的公式〈4〉相对应,离散形式为〈8〉7=0 〃 乂=0反变换为&="(&),0^S1 〈9>可见,在离散的条件下能够直接利用公式〈8〉从所给的图像计算出变换函数T")。这样即可得到所有的源图像各灰度级到目标图像各灰度级的映 射关系,再按照该映射关系对源图像各点像素进行灰度转换,即可完成对源图的直方图均衡化。去噪一一也称为对图像的平滑滤波过程,常用的滤波去噪方法主要有高斯平滑滤波去噪法;均值滤波去噪法;中值滤波去噪法;最 佳滤波去噪法。中值滤波器可以去除孤点噪声,不会使图像的边界模 糊,比较适合于数字图像的去噪处理,因此,本实施例采用中值滤波 法来进行噪声处理。该方法是将邻域中的像素按灰度级进行排序,然 后选择该组的中间值代替指定点(窗口的中心点)的灰度值,对于奇 数个元素,中值是指按大小排序后中间的数值;对于偶数个元素,中 值是指排序后中间两个元素灰度值的平均值。具体步骤是(1)将模 板在图像中漫游,并将模板中心与图像中某个像素的位置重合;(2) 读取模板下各对应像素的灰度值,并将这些灰度值从小到大排成一 列,找出这些值里面排在中间的一个(或两个),如果是两个,则计 算平均值;(3)将这个中间值赋给对应才莫板中心位置的像素。以上处 理步骤不断地重复循环进行,以达到突出目标对象的效果。灰度图像二值化 一 一 将图像二值化后背景和数字图像都单一 化,为字符的准确切分奠定基础。釆用最大类间差法寻找最佳阈值、 自适应阈值分割、分水岭法寻找阈值、通过大量固定阈值均可,其处 理效果如图2所示。字符切分一一由于图像数字的识别是单个进行的,所以必须把包 含一系列数字的图片准确的切分开来,图片数字切分的准确度将直接 影响识别的准确率。本步骤对图像进行水平和垂直方向的投影得到投 影直方图,选取预定的阈值分离出字符和背景信息,并根据分离出的 字符数据信息从存储装置中调取相应的字符高宽比进行字符切分;必 要时做归一化处理,以便下一步的特征提取。切分效果如图3所示。特征量提取一 一 包括图像的不变性特征量提取、方向统计特征量 的提取和矢量特征的提取等。其具体过程为1) 变换系数投影变换系数法是一种典型的统计模式识别方法,它将字符图像 区域看成二维点阵图形,通过求二维图形的变换系数作为分类的特征,常用的变换有Karhuren-Loeve变换、Walsh变换、Fourier变 换、Rapid变换等,在此采用的是Rapid变换。2) 图像的不变性特征量提取图像的不变性特征量提取是对图像进行初等几何变换,再求各阶 中心矩构成特征量。其中,0阶矩是图像中对象物的面积(字符的像 素总和),1阶矩可以得到字符的重心坐标(iG, jG),等等。3) 方向统计特征量的提取方向统计特征量提取是将图像像素在八个方向上的分布特征提 取出来,然后与要识别的图像特征进行对比,求出识别的字符。4) 矢量特征的提取通过跟踪线划的方向,选定有较大曲率的节点,提取出矢量信息, 并以坐标组的形式进行存储。用矢量形式进行目标识别,减少了特征 的尺度,从而减少了计算量,提高了识别的效率和准确度。手写板坯号识别一一具体实现可以采用现有基于规则的方法、基 于统计的方法和基于神经网络的方法。采用基于规则的方法具体过程为根据0/1矩阵的特征对矩阵所 描述的图形表示的内容进行描述。本实施例采用对矩阵的一行为一步 进行特征判断。可以事先规定阿拉伯数字在矩阵中靠左上角显示,则有这样的规 则如果矩阵第一行中有两个值为1,而且这两个1之间有大于1个 的0,则这个矩阵所表示的数字为4。用规则的方法进行识别时,可 以采用规则树的结构进行判断,树的每一层对应矩阵某一行的规则, 比如,对于n行矩阵,树的第k层对应矩阵的第k行的规则(l<=k<=n),树中的节点是"规则(满足规则的数字的集合)"的形式。 在运行该算法时,从根节点(开始节点)开始根据规则沿着某条 分支到达叶节点,算法结束,输出节点集合中的元素。本实施例中, 矩阵有8行,则最多需要进行8步判断可以得出识别结果。可见,算 法的复杂度与规则树的分叉数无关。而规则分的越细,分叉数越多, 对象的区分度越好,搜索过程中对树的遍历深度越少,识别的正确率 就越高。当然,也可以每一步按每列的规则进行判断,方法与上面的叙述 类似。理论和实践证明,本实施例的手写板坯号自动识别方法即使在识 别目标处在高温辐射中、目标背景复杂且与目标颜色相近、识别目标 没有严格的边界区分且书写涂草、字迹模糊、存在连写和笔画覆盖的 恶劣条件下,也能由于采用了各种有效措施去除干拔"^使字符号清晰 化,而且抓住了每个书写笔迹具有特定规律字符高宽比的特点,在对 字符图像进行必要处理之后,根据处理结果调取预先统计的字符高宽 比进行合理切分,从而保证使识别率可以达到95%以上,达到与人眼 识别相近或更好的识别效果,解决了钢铁企业全自动生产中出现的瓶 颈问题,提高了生产效率和管理水平。
权利要求
1.一种手写板坯号自动识别方法,包括以下步骤摄取步骤,摄取板坯号图像;存储步骤,存储对应不同字符数据信息的字符高宽比,以及摄取的待识别板坯号图像;图像处理步骤,抓取并处理存储的待识别板坯号图像;其中包括图像转换抓取待识别板坯号图像,将其转换成灰度图像;图像增强通过建立转换后灰度图像的直方图,并对直方图均衡化,使图像增强;去噪对增强图像进行平滑滤波处理,去除图像中的背景噪音;二值化将去噪后的图像转化为二值图像;字符切分对二值图像进行水平和垂直方向的投影,得到投影直方图,从中以预定的阈值分离出字符和背景信息,根据分离出的字符数据信息从存储装置中调取相应的字符高宽比进行字符切分;提取特征量逐一提取切分后字符数据中的图像不变性特征量、方向统计特征量和特征矢量;字符识别根据提取的字符特征量,采用预定的比较识别方法逐一识别出字符。
2. 根据权利要求l所述手写板坯号自动识别方法,其特征在于 所述去噪步骤采用中值滤波法。
3. 根据权利要求2所述手写板坯号自动识别方法,其特征在于 所述字符识别步骤采用基于规则法。
4. 一种手写板坯号自动识别装置,包括用于摄取板坯号图像的摄像头;其特征在于还包括存储装置,用于存储对应不同字符数据信息的字符高宽比,以及摄取 的板坯号图像;图像处理装置,用于将抓取并处理存储的待识别板坯号图像;其中含 有图像转换装置,用于抓取待识别板坯号图像,将其转换成灰.度图像;图像增强装置,用于通过建立转换后灰度图像的直方图,并对直 方图均衡化,使图像增强;去噪装置,用于对增强图像进行平滑滤波处理,去除图像中的背 景噪音;二值化装置,用于将去噪后的图像转化为二值图像; 字符切分装置,用于对二值图像进行水平和垂直方向的投影,得 到投影直方图,从中以预定的阔值分离出字符和背景信息,根据分离 出的字符数据信息从存储装置中调取相应的字符高宽比进行字符切 分;特征量提取装置,用于逐一提取切分后字符数据中的图像不变性 特征量、方向统计特征量和特征矢量;字符识别装置,用于根据提取的字符特征量,采用预定的比较识 别方法逐一识别出手写字符。
5.根据权利要求4所述手写板坯号自动识别装置,其特征在于 所述去噪装置中含有中值滤波器。
全文摘要
本发明涉及一种号码符号自动识别方法及相应的识别装置。该方法包括摄取板坯号图像、存储对应不同字符数据信息的字符高宽比,以及摄取的板坯号图像、图像处理步骤,处理步骤包括图像转换、图像增强、去噪、二值化、字符切分、提取特征量、字符识别。本发明不仅根据现场手写字符的特点,采用各种有效措施去除干扰,使其清晰化,而且抓住了每个书写笔迹具有特定规律字符高宽比的特点,在对字符图像进行必要处理之后,根据处理结果调取预先统计的字符高宽比进行合理切分,从而保证了后续识别的准确率。从而解决钢铁企业全自动生产中出现的瓶颈问题,提高生产效率和管理水平。
文档编号G06K9/00GK101615244SQ200810122709
公开日2009年12月30日 申请日期2008年6月26日 优先权日2008年6月26日
发明者孙建林, 曹德亮, 王宏学, 贾银芳 申请人:上海梅山钢铁股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1