基于核局部线性表示的分类方法

文档序号：6536352阅读：268来源：国知局

基于核局部线性表示的分类方法
【专利摘要】本发明公开了基于核局部线性表示的分类方法，利用训练样本集识别测试样本所属的类别。首先对训练样本集和测试样本中的所有样本分别进行预处理，得到新的训练样本集和新的测试样本，然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集，各个样本类别的近邻训练样本构成子近邻训练样本集，再使用近邻训练样本集中的样本去线性表示新的测试样本，得到一组线性表示系数，并计算新的测试样本在各个子近邻训练样本集中的重构误差，最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类。本发明基于核局部线性表示的分类方法相较于现有技术大大提高了识别精度。
【专利说明】基于核局部线性表示的分类方法
【技术领域】
[0001]本发明涉及基于核局部线性表示的分类方法，属于模式识别的【技术领域】。
【背景技术】
[0002]模式分类是指对表征事物或现象的各种形式的信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。模式分类可以应用到文字识别、语音识别、指纹识别、数据挖掘、遥感图像识别、医学诊断等多个领域。 [0003]用于模式分类的方法很多，比如，中国专利申请201310059766.2于2013年2月26日公开的“基于局部线性表示的模式分类方法”，首先使用测试样本的部分近邻训练样本去线性表示该测试样本，得到一组线性表示系数；然后计算使用这些近邻训练样本中每个类的样本和相应的线性表示系数去重构测试样本的重构误差；最后根据重构误差来对测试样本进行分类。通过减少训练样本数目，降低了计算难度，但是识别率不高。

【发明内容】

[0004]本发明的目的，在于提供一种基于核局部线性表示的分类方法，提高了识别精度。
[0005]为了实现上述目的，本发明所采用的技术方案如下:
[0006]基于核局部线性表示的分类方法，利用训练样本集识别测试样本所属的类别，首先对训练样本集和测试样本中的所有样本分别进行预处理，得到新的训练样本集和新的测试样本，然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集，各个样本类别的近邻训练样本构成子近邻训练样本集，再使用近邻训练样本集中的样本去线性表示新的测试样本，得到一组线性表示系数，并计算新的测试样本在各个子近邻训练样本集中的重构误差，最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类，所述预处理为采用核主成分分析方法(Kernel Principal ComponentAnalysis, KPCA)对待处理样本做降维运算，再对降维后的所有样本做归一化运算。
[0007]所述选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集的方法如下:
[0008]在新的训练样本集中提取前K个最近邻训练样本构成近邻训练样本集，其中:K的取值如下:
[0009]当mirKNpNy …，Nc) >50 时，K=max (N1, N2,...，NC)；
[0010]当20〈max(N1, N2,...，NC) < 50 时，K=3Xmax(N1, N2,...，NC)；
[0011]^ max(N1, N2, Nc) < 20 且 c>10 时，Ι^δΧηκχ^, N2,…，Nc);
[0012]^max(N1, N2,…，Nc)≤ 20 且 c ≤ 10 时，K=N/2 ;
[0013]其中，Ni为训练样本集中第i类别的样本个数，i=l，2，…，c，c为训练样本总类别，N为训练样本总数。
[0014]优选的，所述归一化运算采用的方法为L2-norm归一化方法。[0015]一种人脸识别方法，对人脸数据库中的人脸图像进行预处理，从预处理后的人脸图像中选取训练样本和测试样本，对训练样本和测试样本数字化和列向量化，利用数字化和列向量化后得到的训练样本和测试样本数据，使用如上所述基于核局部线性表示的分类方法识别测试样本所属的类别。
[0016]一种手写体数字识别方法，对手写体数字数据库中的数字图像进行预处理，从预处理后的数字图像中选取训练样本和测试样本，对训练样本和测试样本数字化和列向量化，利用数字化和列向量化后得到的训练样本和测试样本数据，使用如上所述基于核局部线性表示的分类方法识别测试样本所属的类别。
[0017]采用上述方案后，本发明的基于核局部线性表示的分类方法相比于现有技术，将训练样本集和测试样本中的所有样本预先分别进行核化处理后再进行模式分类，进一步提高了识别精度。
【具体实施方式】
[0018]下面对本发明的技术方案作进一步详细的说明。
[0019]利用包括C个类别的训练样本集X识别测试样本y所属的类别，包括如下步骤。
[0020]令X= [X1, X2，…，XJ，4 Xi2，…,Xw,]表示第i类训练样本集，Xi包含Ni个样本，Xij e Rd(Rd表示d维的实向量集合)表示第i类的第j个训练样本，(i = I, 2，…，c ;
【权利要求】
1.基于核局部线性表示的分类方法，利用训练样本集识别测试样本所属的类别，首先对训练样本集和测试样本中的所有样本分别进行预处理，得到新的训练样本集和新的测试样本，然后从新的训练样本集中选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集，各个样本类别的近邻训练样本构成子近邻训练样本集，再使用近邻训练样本集中的样本去线性表示新的测试样本，得到一组线性表示系数，并计算新的测试样本在各个子近邻训练样本集中的重构误差，最后将测试样本归为重构误差最小的子近邻训练样本集所对应的那一类，其特征在于:所述预处理为采用核主成分分析方法对待处理样本做降维运算，再对降维后的所有样本做归一化运算。
2.如权利要求1所述基于核局部线性表示的分类方法，其特征在于:所述选取一部分距离新的测试样本最近的训练样本构成近邻训练样本集的方法如下: 在新的训练样本集中提取前K个最近邻训练样本构成近邻训练样本集，其中:K的取值如下:
当 mirKNpNr …，Nc) >50 时，K=max (N1, N2,…，Nc)； ^ 20^βχ(Ν!, N2,…，Nc)≤50 时，I^SXmaxd N2,…，Nc); ^ max(N1, N2,…，Nc)≤ 20 且 c>10 时，I^SXmaxd N2,…，Nc);
当 max (N1, N2,…，Nc)≤ 20 且 c ≤ 10 时，K=N/2 ；其中，Ni为训练样本集中第i类别的样本个数，i=l, 2，…，c，c为训练样本总类别，N为训练样本总数。
3.如权利要求1所述基于核局部线性表示的分类方法，其特征在于:所述归一化运算采用的方法为L2-norm归一化方法。
4.一种人脸识别方法，其特征在于:对人脸数据库中的人脸图像进行预处理，从预处理后的人脸图像中选取训练样本和测试样本，对训练样本和测试样本数字化和列向量化，利用数字化和列向量化后得到的训练样本和测试样本数据，使用如权利要求1-3任一项所述基于核局部线性表示的分类方法识别测试样本所属的类别。
5.一种手写体数字识别方法，其特征在于:对手写体数字数据库中的数字图像进行预处理,从预处理后的数字图像中选取训练样本和测试样本,对训练样本和测试样本数字化和列向量化，利用数字化和列向量化后得到的训练样本和测试样本数据，使用如权利要求1-3任一项所述基于核局部线性表示的分类方法识别测试样本所属的类别。
【文档编号】G06K9/62GK103778438SQ201410026849
【公开日】2014年5月7日申请日期:2014年1月21日优先权日:2014年1月21日
【发明者】刘茜申请人:南京信息工程大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘茜
技术所有人：南京信息工程大学
我是此专利的发明人

上一篇：信息收集系统的制作方法
上一篇：一种实现网上购物的方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。