手写体数字识别方法及装置的制作方法

文档序号：6592670阅读：167来源：国知局

专利名称：手写体数字识别方法及装置的制作方法
技术领域：
本发明涉及手写体数字识别技术领域，特别是涉及一种手写体数字识别方法及装置。
背景技术：
作为世界各国通用符号的阿拉伯数字的手写体频繁出现在邮政系统、银行支票、工业应用等各领域中。而随着计算机技术和数字图像处理技术的飞速发展，手写体数字识别技术得到了广泛应用，给人们的工作带来了极大的方便。由于数字在各个领域中往往代表精确的数值，微小的错误很可能带来不可预知的后果，因此，具有较高正确率的简单高效的手写体数字识别方法一直是重要的研究方向。而随着机器学习技术的普及应用，很多物理学家和化学家开始广泛使用李群理论研究相关领域的数据；相应的，在手写体数字识别技术领域，李群结构数据以其良好的数学结构已被广泛应用。其中，李群Means 是由 J.A.Hartigan 等人在文章 “A K-Means ClusteringAlgorithm”中提出的一种简单有效的分类方法，然而其梯度下降法找到的解只是局部极小值，而不一定是全局最小值，在处理多分类问题时性能欠佳。2011年，高聪等人提出了李群Fisher学习算法，该方法在处理多类问题时的效果也不是很好。而2006年，Tuzel 0，Porikli F7Meer P等人提出的李群KNN方法中，将区域图像的协方差作为李群KNN分类问题的特征；但是，对于手写体数字识别而言，能够体现空间信息的笔画位置可以有助于识别手写体数字，也就是，像素点的灰度值有助于识别手写体数字，因此，基于李群KNN方法，直接利用依据区域图像确定的特征的手写体数字识别会损失空间信息，影响手写体数字识别的准确性。

发明内容
为解决上述技术问题，本发明实施例提供了一种手写体数字识别方法及装置，以提高手写体数字的识别准确性，技术方案如下:—方面，本发明实施例提供了一种手写体数字识别方法，包括:确定待识别图像，所述待识别图像中包含手写体形式的待识别数字类别标签；依据像素点的灰度值，确定所述待识别图像中的特定的像素点的像素特征；依据所述特定的像素点的像素特征，确定所述待识别图像的协方差；基于李群KNN算法，依据预设的训练图像集合中的各训练图像的协方差和所述待识别图像的协方差，确定所述待识别图像的近邻标签集；其中，每一训练图像中包含一手写体形式的数字类别标签，所述训练图像集合所包含的数字类别标签涉及所有的数字类别，并且，所述待识别图像的协方差与所述近邻标签集中各数字类别标签对应协方差的距离不大于其与所述训练图像集合相应的剩余任意一协方差之间的距离；将所述近邻标签集中个数最多的数字类别标签确定为所述待识别数字类别标签。
其中，所述基于李群KNN算法，依据预设的训练图像集合中的各训练图像的协方差和所述待识别图像的协方差，确定所述待识别图像的近邻标签集，包括:分别计算所述待识别图像的协方差与预设的训练图像集合中的各训练图像的协方差之间的距离；选择第一数量的距离作为近邻距离，其中，所述近邻距离不大于剩余的任意一距离；将所述近邻距离对应的训练图像的数字类别标签构成所述待识别图像的近邻标签集。其中，所述确定所述待识别图像中的特定的像素点的像素特征所依据的计算公式包括:
权利要求
1.一种手写体数字识别方法，其特征在于，包括: 确定待识别图像，所述待识别图像中包含手写体形式的待识别数字类别标签；依据像素点的灰度值，确定所述待识别图像中的特定的像素点的像素特征；依据所述特定的像素点的像素特征，确定所述待识别图像的协方差；基于李群KNN算法，依据预设的训练图像集合中的各训练图像的协方差和所述待识别图像的协方差，确定所述待识别图像的近邻标签集；其中，每一训练图像中包含一手写体形式的数字类别标签，所述训练图像集合所包含的数字类别标签涉及所有的数字类别，并且，所述待识别图像的协方差与所述近邻标签集中各数字类别标签对应协方差的距离不大于其与所述训练图像集合相应的剩余任意一协方差之间的距离；将所述近邻标签集中个数最多的数字类别标签确定为所述待识别数字类别标签。
2.根据权利要求1所述的方法，其特征在于，所述基于李群KNN算法，依据预设的训练图像集合中的各训练图像的协方差和所述待识别图像的协方差，确定所述待识别图像的近邻标签集，包括: 分别计算所述待识别图像的协方差与预设的训练图像集合中的各训练图像的协方差之间的距离；选择第一数量的距离作为近邻距离，其中，所述近邻距离不大于剩余的任意一距离；将所述近邻距离对应的训练图像的数字类别标签构成所述待识别图像的近邻标签集。
3.根据权利要求2所述的方法，其特征在于，所述确定所述待识别图像中的特定的像素点的像素特征所依据的计算公式包括:
4.根据权利要求3所述的方法，其特征在于，所述确定所述待识别图像的协方差所依据的计算公式包括:
5.根据权利要求4所述的方法，其特征在于，计算所述待识别图像的协方差与预设训练图像集合中的各个训练图像的协方差之间的距离所依据的计算公式包括:
6.根据权利要求2所述的方法，其特征在于，所述待识别图像中的特定的像素点包括: 所述待识别图像中的所有像素点；或者，所述待识别图像中的部分像素点，且所述部分像素点为所述待识别图像中的手写区域的像素点，所述手写区域为所述待识别图像中的一部分图像区域。
7.一种手写体数字识别装置，其特征在于，包括: 待识别图像确定模块，用于确定待识别图像，所述待识别图像中包含手写体形式的待识别数字类别标签；像素特征确定模块，用于依据像素点的灰度值，确定所述待识别图像中的特定的像素点的像素特征；协方差确定模块，用于依据所述特定的像素点的像素特征，确定所述待识别图像的协方差; 近邻确定模块，用于基于李群KNN算法，依据预设的训练图像集合中的各训练图像的协方差和所述待识别图像的协方差，确定所述待识别图像的近邻标签集；其中，每一训练图像中包含一手写体形式的数字类别标签，所述训练图像集合所包含的数字类别标签涉及所有的数字类别，并且，所述待识别图像的协方差与所述近邻标签集中各数字类别标签对应协方差的距离不大于其与所述训练图像集`合相应的剩余任意一协方差之间的距离；待识别标签确定模块，用于将所述近邻标签集中个数最多的数字类别标签确定为所述待识别数字类别标签。
全文摘要
本发明公开了一种手写体数字识别方法及装置。该手写体数字识别方法，包括确定待识别图像，该待识别图像中包含手写体形式的待识别数字类别标签；依据像素点的灰度值，确定该待识别图像中的特定的像素点的像素特征；依据该特定的像素点的像素特征，确定该待识别图像的协方差；基于李群KNN算法，依据预设的训练图像集合中的各训练图像的协方差和该待识别图像的协方差，确定该待识别图像的近邻标签集；将该近邻标签集中个数最多的数字类别标签确定为该待识别数字类别标签。可见，与现有技术相比，本方案中，作为分类问题的特征的协方差依据特定的像素点的灰度值获得，有效利用了待识别图像的空间信息，因此，提高了手写体数字的识别准确性。
文档编号G06K9/20GK103164701SQ201310123349
公开日2013年6月19日申请日期2013年4月10日优先权日2013年4月10日
发明者何书萍, 张莉, 王晓乾, 王邦军, 杨季文, 李凡长申请人:苏州大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何书萍;张莉;王晓乾;王邦军;杨季文;李凡长
技术所有人：苏州大学
我是此专利的发明人

上一篇：雾霾图像快速去雾处理组件的制作方法
上一篇：面向图像检索的自适应哈希重排方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。