基于核局部线性表示的分类方法

文档序号:6536352阅读:268来源:国知局
基于核局部线性表示的分类方法
【专利摘要】本发明公开了基于核局部线性表示的分类方法,利用训练样本集识别测试样本所属的类别。首先对训练样本集和测试样本中的所有样本分别进行预处理,得到新的训练样本集和新的测试样本,然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集,各个样本类别的近邻训练样本构成子近邻训练样本集,再使用近邻训练样本集中的样本去线性表示新的测试样本,得到一组线性表示系数,并计算新的测试样本在各个子近邻训练样本集中的重构误差,最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类。本发明基于核局部线性表示的分类方法相较于现有技术大大提高了识别精度。
【专利说明】基于核局部线性表示的分类方法
【技术领域】
[0001]本发明涉及基于核局部线性表示的分类方法,属于模式识别的【技术领域】。
【背景技术】
[0002]模式分类是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式分类可以应用到文字识别、语音识别、指纹识别、数据挖掘、遥感图像识别、医学诊断等多个领域。 [0003]用于模式分类的方法很多,比如,中国专利申请201310059766.2于2013年2月26日公开的“基于局部线性表示的模式分类方法”,首先使用测试样本的部分近邻训练样本去线性表示该测试样本,得到一组线性表示系数;然后计算使用这些近邻训练样本中每个类的样本和相应的线性表示系数去重构测试样本的重构误差;最后根据重构误差来对测试样本进行分类。通过减少训练样本数目,降低了计算难度,但是识别率不高。

【发明内容】

[0004]本发明的目的,在于提供一种基于核局部线性表示的分类方法,提高了识别精度。
[0005]为了实现上述目的,本发明所采用的技术方案如下:
[0006]基于核局部线性表示的分类方法,利用训练样本集识别测试样本所属的类别,首先对训练样本集和测试样本中的所有样本分别进行预处理,得到新的训练样本集和新的测试样本,然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集,各个样本类别的近邻训练样本构成子近邻训练样本集,再使用近邻训练样本集中的样本去线性表示新的测试样本,得到一组线性表示系数,并计算新的测试样本在各个子近邻训练样本集中的重构误差,最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类,所述预处理为采用核主成分分析方法(Kernel Principal ComponentAnalysis, KPCA)对待处理样本做降维运算,再对降维后的所有样本做归一化运算。
[0007]所述选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集的方法如下:
[0008]在新的训练样本集中提取前K个最近邻训练样本构成近邻训练样本集,其中:K的取值如下:
[0009]当mirKNpNy …,Nc) >50 时,K=max (N1, N2,...,NC);
[0010]当20〈max(N1, N2,...,NC) < 50 时,K=3Xmax(N1, N2,...,NC);
[0011]^ max(N1, N2, Nc) < 20 且 c>10 时,Ι^δΧηκχ^, N2,…,Nc);
[0012]^max(N1, N2,…,Nc)≤ 20 且 c ≤ 10 时,K=N/2 ;
[0013]其中,Ni为训练样本集中第i类别的样本个数,i=l,2,…,c,c为训练样本总类别,N为训练样本总数。
[0014]优选的,所述归一化运算采用的方法为L2-norm归一化方法。[0015]一种人脸识别方法,对人脸数据库中的人脸图像进行预处理,从预处理后的人脸图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化,利用数字化和列向量化后得到的训练样本和测试样本数据,使用如上所述基于核局部线性表示的分类方法识别测试样本所属的类别。
[0016]一种手写体数字识别方法,对手写体数字数据库中的数字图像进行预处理,从预处理后的数字图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化,利用数字化和列向量化后得到的训练样本和测试样本数据,使用如上所述基于核局部线性表示的分类方法识别测试样本所属的类别。
[0017]采用上述方案后,本发明的基于核局部线性表示的分类方法相比于现有技术,将训练样本集和测试样本中的所有样本预先分别进行核化处理后再进行模式分类,进一步提高了识别精度。
【具体实施方式】
[0018]下面对本发明的技术方案作进一步详细的说明。
[0019]利用包括C个类别的训练样本集X识别测试样本y所属的类别,包括如下步骤。
[0020]令X= [X1, X2,…,XJ,4 Xi2,…,Xw,]表示第i类训练样本集,Xi包含Ni个样本,Xij e Rd(Rd表示d维的实向量集合)表示第i类的第j个训练样本,(i = I, 2,…,c ;
【权利要求】
1.基于核局部线性表示的分类方法,利用训练样本集识别测试样本所属的类别,首先对训练样本集和测试样本中的所有样本分别进行预处理,得到新的训练样本集和新的测试样本,然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集,各个样本类别的近邻训练样本构成子近邻训练样本集,再使用近邻训练样本集中的样本去线性表示新的测试样本,得到一组线性表示系数,并计算新的测试样本在各个子近邻训练样本集中的重构误差,最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类,其特征在于:所述预处理为采用核主成分分析方法对待处理样本做降维运算,再对降维后的所有样本做归一化运算。
2.如权利要求1所述基于核局部线性表示的分类方法,其特征在于:所述选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集的方法如下: 在新的训练样本集中提取前K个最近邻训练样本构成近邻训练样本集,其中:K的取值如下:
当 mirKNpNr …,Nc) >50 时,K=max (N1, N2,…,Nc); ^ 20^βχ(Ν!, N2,…,Nc)≤50 时,I^SXmaxd N2,…,Nc); ^ max(N1, N2,…,Nc)≤ 20 且 c>10 时,I^SXmaxd N2,…,Nc);
当 max (N1, N2,…,Nc)≤ 20 且 c ≤ 10 时,K=N/2 ; 其中,Ni为训练样本集中第i类别的样本个数,i=l, 2,…,c,c为训练样本总类别,N为训练样本总数。
3.如权利要求1所述基于核局部线性表示的分类方法,其特征在于:所述归一化运算采用的方法为L2-norm归一化方法。
4.一种人脸识别方法,其特征在于:对人脸数据库中的人脸图像进行预处理,从预处理后的人脸图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化,利用数字化和列向量化后得到的训练样本和测试样本数据,使用如权利要求1-3任一项所述基于核局部线性表示的分类方法识别测试样本所属的类别。
5.一种手写体数字识别方法,其特征在于:对手写体数字数据库中的数字图像进行预处理,从预处理后的数字图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化,利用数字化和列向量化后得到的训练样本和测试样本数据,使用如权利要求1-3任一项所述基于核局部线性表示的分类方法识别测试样本所属的类别。
【文档编号】G06K9/62GK103778438SQ201410026849
【公开日】2014年5月7日 申请日期:2014年1月21日 优先权日:2014年1月21日
【发明者】刘茜 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1