手写体数字识别方法及装置的制作方法

文档序号:6592668阅读:191来源:国知局
专利名称:手写体数字识别方法及装置的制作方法
技术领域
本发明涉及手写体数字识别技术领域,特别是涉及一种手写体数字识别方法及装置。
背景技术
作为世界各国通用符号的阿拉伯数字的手写体频繁出现在邮政系统、银行支票、工业应用等各领域中。而随着计算机技术和数字图像处理技术的飞速发展,手写体数字识别技术得到了广泛应用,给人们的工作带来了极大的方便。由于数字在各个领域中往往代表精确的数值,微小的错误很可能带来不可预知的后果,因此,具有较高正确率的简单高效的手写体数字识别方法一直是重要的研究方向。而随着机器学习技术的普及应用,很多物理学家和化学家开始广泛使用李群理论研究相关领域的数据;相应的,在 手写体数字识别技术领域,李群结构数据以其良好的数学结构已被广泛应用。其中,李群均值分类器(IieMeans)是由J.A.Hartigan等人在文章“A K-MeansClustering Algorithm”中提出的一种简单有效的分类方法,然而其选择单一的协方差特征实现分类,使得其梯度下降法找到的解只是局部极小值,而不一定是全局最小值,在处理多分类问题时性能欠佳。可见,现有的基于李群均值分类器的手写体识别方法通过选择单一的协方差特征实现分类,其不能充分利用待识别图像的空间信息,导致识别准确性不高。

发明内容
为解决上述技术问题,本发明实施例提供了一种手写体数字识别方法及装置,以提高手写体数字的识别准确性,技术方案如下:一方面,本发明实施例提供了一种手写体数字识别方法,包括:确定待识别图像,所述待识别图像中包含手写体形式的待识别数字类别标签;依据像素点的灰度值,确定所述待识别图像中的特定的像素点的至少三种像素特征;依据所述特定的像素点的至少三种像素特征,分别确定所述待识别图像的相应协方差,其中,每一种像素特征唯一对应一个协方差;分别计算所述待识别图像的每一协方差与预设的训练图像集合所包含每一类数字类别标签相应的李群均值之间的距离;其中,所述训练图像集合中每一训练图像包含一手写体形式的数字类别标签,所述训练图像集合所包含的数字类别标签涉及所有的数字类另Ij,并且,所述训练图像集合中每一类数字类别标签对应至少三个李群均值,所述待识别图像的每一个协方差对应每一类数字类别标签的一个李群均值;分别将为所述待识别图像的每一个协方差所确定出的多个距离中的最小距离所对应数字类别标签确定为备用数字类别标签;
将所述备用数字类别标签中个数最多的数字类别标签确定为所述待识别数字类别标签。其中,当确定所述待识别图像中的特定的像素点的三种像素特征时所依据的计算公式包括:
权利要求
1.一种手写体数字识别方法,其特征在于,包括: 确定待识别图像,所述待识别图像中包含手写体形式的待识别数字类别标签; 依据像素点的灰度值,确定所述待识别图像中的特定的像素点的至少三种像素特征;依据所述特定的像素点的至少三种像素特征,分别确定所述待识别图像的相应协方差,其中,每一种像素特征唯一对应一个协方差; 分别计算所述待识别图像的每一协方差与预设的训练图像集合所包含每一类数字类别标签相应的李群均值之间的距离;其中,所述训练图像集合中每一训练图像包含一手写体形式的数字类别标签,所述训练图像集合所包含的数字类别标签涉及所有的数字类别,并且,所述训练图像集合中每一类数字类别标签对应至少三个李群均值,所述待识别图像的每一个协方差对应每一类数字类别标签的一个李群均值; 分别将为所述待识别图像的每一个协方差所确定出的多个距离中的最小距离所对应数字类别标签确定为备用数字类别标签; 将所述备用数字类别标签中个数最多的数字类别标签确定为所述待识别数字类别标签。
2.根据权利要求1所述的方法,其特征在于,当确定所述待识别图像中的特定的像素点的三种像素特征时所依据的计算公式包括:
3.根据权利要求2所述的方法,其特征在于,依据所述特定的像素点的三种像素特征,分别确定所述待识别图像的相应协方差所依据的计算公式包括:
4.根据权利要求3所述的方法,其特征在于,分别计算所述待识别图像的每一个协方差与预设的训练图像集合所包含每一类数字类别标签相应的李群均值之间的距离所依据的计算公式包括:
5.根据权利要求4所述的方法,其特征在于,所述预设的训练图像集合所包含每一类数字类别标签的李群均值的确定方式包括: 依据像素点的灰度值,确定所述预设的训练图像集合中每一训练图像的三种像素特征; 依据所述特定的像素点的三种像素特征,为每一训练图像分别确定相应协方差,其中,每一种像素特征唯一对应一个协方差; 将所有训练图像对应的关于同一种像素特征的协方差输入相应李群均值分类器,以确定出每一类数字类别标签的关于所述像素特征的李群均值。
6.根据权利要求1所述的方法,其特征在于,所述待识别图像中的特定的像素点包括: 所述待识别图像中的所有像素点; 或者, 所述待识别图像中的部分像素点,且所述部分像素点为所述待识别图像中的手写区域的像素点,所述手写区域为所述待识别图像中的一部分图像区域。
7.一种手写体数字识别装置,其特征在于,包括: 待识别图像确定模块,用于确定待识别图像,所述待识别图像中包含手写体形式的待识别数字类别标签; 像素特征确定模块,用于依据像素点的灰度值,确定所述待识别图像中的特定的像素点的至少三种像素特征; 协方差确定模块,用于依据所述特定的像素点的至少三种像素特征,分别确定所述待识别图像的相应协方差,其中,每一种像素特征唯一对应一个协方差; 距离确定模块,用于分别计算所述待识别图像的每一协方差与预设的训练图像集合所包含每一类数字类别标签相应的李群均值之间的距离;其中,所述训练图像集合中每一训练图像包含一手写体形式的数字类别标签,所述训练图像集合所包含的数字类别标签涉及所有的数字类别,并且,所述训练图像集合中每一类数字类别标签对应至少三个李群均值,所述待识别图像的每一个协方差对应每一类数字类别标签的一个李群均值; 备用标签确定模块,用于分别将为所述待识别图像的每一个协方差所确定出的多个距离中的最小距离所对应数字类别标签确定为备用数字类别标签; 待识别标签确定模块,用于将所述备用数字类别标签中个数最多的数字类别标签确定为所述待识别数字类别标签。
全文摘要
本发明公开了一种手写体数字识别方法及装置。该手写体数字识别方法,包括确定待识别图像;依据像素点的灰度值,确定该待识别图像中的特定的像素点的至少三种像素特征;依据该特定的像素点的至少三种像素特征,分别确定该待识别图像的相应协方差;分别计算该待识别图像的每一协方差与预设的训练图像集合所包含每一类数字类别标签相应的李群均值之间的距离;分别将为该待识别图像的每一个协方差所确定出的多个距离中的最小距离所对应数字类别标签确定为备用数字类别标签;将该备用数字类别标签中个数最多的数字类别标签确定为待识别图像中的待识别数字类别标签。可见,通过利用本方案,可以有效提高手写体数字的识别准确性。
文档编号G06K9/20GK103218613SQ20131012308
公开日2013年7月24日 申请日期2013年4月10日 优先权日2013年4月10日
发明者张莉, 周伟达, 王晓乾, 何书萍, 王邦军, 杨季文, 李凡长 申请人:苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1