基于局部线性表示的模式分类方法

文档序号：6587193阅读：270来源：国知局

专利名称：基于局部线性表示的模式分类方法
技术领域：
本发明公开了基于局部线性表示的模式分类方法，属于模式识别的技术领域。
背景技术：
SRC (Sparse Representation-based Classification,稀疏表不分类器)，以全部样本作为字典，稀疏表不测试样本与训练样本的关系。相对于传统的最近邻分类器来说，SRC分类器取得了较好的分类性能。但是，SRC分类器最大的问题就是，计算稀疏系数的时间复杂度很高，随着训练样本个数的增长，计算时间呈指数阶增长。

发明内容
本发明所要解决的技术问题是针对上述背景技术的不足，提供了基于局部线性表示的模式分类方法。本发明为实现上述发明目的采用如下技术方案:基于局部线性表示的模式分类方法，利用包括c个类别的训练样本集识别测试样本I所属的类别，所述C为自然数，包括如下步骤:步骤1，对于测试样本γ,构建其近邻训练样本集；步骤2，根据步骤I所述的近邻训练样本集，得到测试样本y在近邻训练样本集内的线性表示系数；步骤3，将近邻训练样本集按照训练样本类别划分成c个子近邻训练样本集，利用子近邻训练样本集及其对应的线性表示系数计算测试样本y在每一个子近邻训练样本集内的重构误差；步骤4，比较测试样本y在每一个子近邻训练样本集内的重构误差:当测试样本y在第M类的子近邻训练样本集内的重构误差最小时，将测试样本y归为第M类，所述M为小于或者等于c的自然数。所述基于局部线性表示的模式分类方法，步骤I中所述的近邻训练样本集构建方法如下:步骤1-1，计算测试样本I到训练样本集中每个训练样本的距离；步骤1-2，在训练样本集中提取前K个最近邻训练样本构成近邻训练样本集，其中:κ的取值如下:当min (N1, N2,...，Nc) >50 时，K=max (N1, N2,...，Nc)；当20〈max (N1, N2,…，Nc) < 50 时，K=3 Xmax (N1, N2,...，Nc)；当max (N1, N2,…，Nc) < 20 且 c>10 时，K=5 Xmax (N1, N2,…，Nc)；当max (N1, N2,...，Nc)彡 20 且 c 彡 10 时，K=N/2 ；其中，N1为训练样本集中第一类别样本个数，N2为训练样本集中第二类别样本个数，Nc为训练样本集中第c类样本个数，N为训练样本总数。本发明采用上述技术方案，具有以下有益效果:通过减少训练样本数目，降低了计算难度；在提高识别率的同时缩减了计算时间。
具体实施例方式下面对发明的技术方案进行详细说明:利用包含C个类别的训练样本集X识别测试样本y所属的类别，包括如下步骤。X=LX11X2,...,Xc], Xi=[xn, xi2,...，xiNi]表示第 i 类训练样本集，Xi 包含 Ni 个样
本，Xij e Rd (Rd表示d维的实向量集合)表示第i类的第j个训练样本，
权利要求
1.基于局部线性表示的模式分类方法，利用包括C个类别的训练样本集识别测试样本y所属的类别，所述c为自然数，其特征在于包括如下步骤: 步骤I,对于测试样本y,构建其近邻训练样本集；步骤2，根据步骤I所述的近邻训练样本集，得到测试样本y在近邻训练样本集内的线性表示系数；步骤3，将近邻训练样本集按照训练样本类别划分成c个子近邻训练样本集，利用子近邻训练样本集及其对应的线性表示系数计算测试样本y在每一个子近邻训练样本集内的重构误差；步骤4，比较测试样本y在每一个子近邻训练样本集内的重构误差:当测试样本y在第M类的子近邻训练样本集内的重构误差最小时，将测试样本y归为第M类，所述M为小于或者等于c的自然数。
2.根据权利要求1所述的基于局部线性表示的模式分类方法，其特征在于步骤I中所述的近邻训练样本集构建方法如下: 步骤1-1，计算测试样本y到训练样本集中每个训练样本的距离；步骤1-2，在训练样本集中提取前K个最近邻训练样本构成近邻训练样本集，其中:K的取值如下: 当 min (N1, N2,…，Nc) >50 时，K=max (N1, N2,…，Nc)；当 20〈max (N1, N2,...，Nc)≤ 50 时，K=3 Xmax (N1, N2,…，Nc)；当 max (N1, N2,…，Nc)≤ 20 且 c> 10 时，K=5 Xmax (N1, N2,…，Nc)；当 max (N1, N2,…，Nc)≤ 20 且 c ≤ 10 时，K=N/2 ；其中，N1为训练样本集中第一类别样本个数，N2为训练样本集中第二类别样本个数，Nc为训练样本集中第c类样本个数，N为训练样本总数。
全文摘要
本发明公开了基于局部线性表示的模式分类方法，属于模式识别的技术领域。首先使用测试样本的部分近邻训练样本去线性表示该测试样本，得到一组线性表示系数；然后计算使用这些近邻训练样本中每个类的样本和相应的线性表示系数去重构测试样本的重构误差；最后根据重构误差来对测试样本进行分类。在计算测试样本的线性表示时，通过减少训练样本数目，降低了计算难度；在提高识别率的同时缩减了计算时间。
文档编号G06K9/66GK103246892SQ20131005976
公开日2013年8月14日申请日期2013年2月26日优先权日2013年2月26日
发明者刘茜, 马杰良, 王丽娜申请人:南京信息工程大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘茜;马杰良;王丽娜
技术所有人：南京信息工程大学
我是此专利的发明人

上一篇：一种基于云基因表达式编程的音乐情感识别方法
上一篇：一种语音识别中的标点添加方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。