一种手写体数字识别方法及系统的制作方法

文档序号:6534754阅读:215来源:国知局
一种手写体数字识别方法及系统的制作方法
【专利摘要】本申请公开了一种手写体数字识别方法,包括:根据距离和标签类别,对训练样本构造类内邻接图和类间邻接图;根据所述类内邻接图、所述类间邻接图和所述训练样本组成的矩阵,确定目标维数和投影变换矩阵;将所述训练样本按照所述投影变换矩阵变换到判别子空间中;利用所述投影变换矩阵,将待测样本映射到所述判别子空间中,得到测试样本;利用最近邻分类器,对所述测试样本进行分类。本申请对于每个样本分别在同类近邻样本中找近邻和在异类样本中找近邻,从而克服了样本分布不均衡造成的分类性能差的问题。
【专利说明】一种手写体数字识别方法及系统
【技术领域】
[0001]本申请涉及模拟识别【技术领域】,更具体地说,涉及一种手写体数字识别方法及系统。
【背景技术】
[0002]手写体数字识别一直是模拟识别【技术领域】的研究热点。在现代社会中,与手写体数字识别的相关领域不胜其数,例如:邮件分拣、财税、金融等领域。随着经济的发展,每天等待处理的财会报表、支票等日益增多,如果能够用计算机自动处理,将会节省很大的财力、物力和人力,因此针对这类问题的解决办法就是设计一种可靠性高、识别率高的手写体数字识别方法。
[0003]现有技术中,一种方法是采用K近邻分类器,但是该分类器对每个待分类的样本都要计算它到全体已知样本的距离,才能求出它的K个最近邻点,这样计算量特别大。为此,又提出了一种新的基于K近邻分类标准的特征变换算法,该算法将数据映射到更低维空间,可以降低K近邻分类的计算代价。但是,这种方法对于样本分布不均衡的情况下,构建的邻接图并不能很好的保持局部结构,从而使分类性能会变得很差。

【发明内容】

[0004]有鉴于此,本申请提供了一种手写体数字识别方法及系统,用于解决现有的K近邻分类算法针对样本分布不均衡的情况,构建的邻接图并不能很好保持局部结构,使得分类性能差的问题。
[0005]为了实现上述目的,现提出的方案如下:
[0006]一种手写体数字识别方法,包括:
[0007]根据距离和标签类别,对训练样本构造类内邻接图和类间邻接图;
[0008]根据所述类内邻接图、所述类间邻接图和所述训练样本组成的矩阵,确定目标维数和投影变换矩阵;
[0009]将所述训练样本按照所述投影变换矩阵变换到判别子空间中;
[0010]利用所述投影变换矩阵,将待测样本映射到所述判别子空间中,得到测试样本;
[0011]利用最近邻分类器,对所述测试样本进行分类。
[0012]优选地,所述根据距离和标签类别,对训练样本构造类内邻接图和类间邻接图,包括:
[0013]将训练样本集定乂为
【权利要求】
1.一种手写体数字识别方法,其特征在于,包括: 根据距离和标签类别,对训练样本构造类内邻接图和类间邻接图; 根据所述类内邻接图、所述类间邻接图和所述训练样本组成的矩阵,确定目标维数和投影变换矩阵; 将所述训练样本按照所述投影变换矩阵变换到判别子空间中; 利用所述投影变换矩阵,将待测样本映射到所述判别子空间中,得到测试样本; 利用最近邻分类器,对所述测试样本进行分类。
2.根据权利要求1所述的方法,其特征在于,所述根据距离和标签类别,对训练样本构造类内邻接图和类间邻接图,包括: 将训练样本集定义为忟,乃
3.根据权利要求2所述的方法,其特征在于,所述根据所述类内邻接图、所述类间邻接图和所述训练样本组成的矩阵,确定目标维数和投影变换矩阵,包括: 对XSXt进行特征分解,其中X是由所述训练样本Xi组成的训练样本矩阵,S=Db-Fb-Dw+Fw, Dw是一个对角矩阵,且对角线上的元素为
4.根据权利要求3所述的方法,其特征在于,所述将所述训练样本按照所述投影变换矩阵变换到判别子空间中,包括: 将所述训练样本Xi按照投影变换矩阵P进行变换,获得所述训练样本Xi在判断子空间中的表示Vi=P1Xi ; 确定所述判别子空间的训练集为e F。
5.根据权利要求4所述的方法,其特征在于,所述利用所述投影变换矩阵,将待测样本映射到所述判别子空间中,得到测试样本,包括:利用所述投影变换矩阵P,将待测样本X变换到所述判别子空间中; 得到所述判别子空间中的测试样本v=PTx。
6.根据权利要求5所述的方法,其特征在于,所述利用最近邻分类器,对所述测试样本进行分类,包括: 计算所述测试样本V与多个所述训练样本Vi之间的距离; 确定与所述测试样本V的距离最小的训练样本Vi,并将该训练样本Vi对应的类别标签yi赋予给所述测试样本V。
7.根据权利要求6所述的方法,其特征在于,所述计算所述测试样本V与多个所述训练样本Vi之间的距离具体为: 计算所述测试样本V与多个所述训练样本Vi之间的欧氏距离。
8.一种手写体数字识别系统,其特征在于,包括: 邻接图构造单元,用于根据距离和标签类别,对训练样本构造类内邻接图和类间邻接图; 投影变换矩阵确定单元,用于根据所述类内邻接图、所述类间邻接图和所述训练样本组成的矩阵,确定投影变换矩阵和目标维数; 待测样本获取单元,用于获取待测样本; 样本变换单元,用于将所述训练样本按照所述投影变换矩阵变换到判别子空间中,将待测样本按照所述投影变换矩阵映射`到所述判别子空间中,得到测试样本; 分类处理单元,用于利用最近邻分类器,对所述测试样本进行分类。
9.根据权利要求8所述的系统,其特征在于,所述样本变换单元包括: 训练样本变换单元,用于将所述训练样本按照所述投影变换矩阵变换到判别子空间中; 待测样本变换单元,用于将待测样本按照所述投影变换矩阵映射到所述判别子空间中,得到测试样本。
10.根据权利要求8所述的系统,其特征在于,所述分类处理单元包括: 距离计算单元,用于计算所述测试样本V与多个所述训练样本Vi之间的距离; 距离比较单元,用于比较所述测试样本V与多个所述训练样本Vi之间的距离,并将距离最小的训练样本Vi选取出来; 类别标签确定单元,用于将选取出来的训练样本Vi对应的类别标签yi赋予给所述测试样本Vo
【文档编号】G06K9/62GK103679207SQ201410001403
【公开日】2014年3月26日 申请日期:2014年1月2日 优先权日:2014年1月2日
【发明者】张莉, 丁春涛, 严晨, 王邦军, 李凡长 申请人:苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1