基于局部线性表示的模式分类方法

文档序号:6587193阅读:270来源:国知局
专利名称:基于局部线性表示的模式分类方法
技术领域
本发明公开了基于局部线性表示的模式分类方法,属于模式识别的技术领域。
背景技术
SRC (Sparse Representation-based Classification,稀疏表不分类器),以全部样本作为字典,稀疏表不测试样本与训练样本的关系。相对于传统的最近邻分类器来说,SRC分类器取得了较好的分类性能。但是,SRC分类器最大的问题就是,计算稀疏系数的时间复杂度很高,随着训练样本个数的增长,计算时间呈指数阶增长。

发明内容
本发明所要解决的技术问题是针对上述背景技术的不足,提供了基于局部线性表示的模式分类方法。本发明为实现上述发明目的采用如下技术方案:基于局部线性表示的模式分类方法,利用包括c个类别的训练样本集识别测试样本I所属的类别,所述C为自然数,包括如下步骤:步骤1,对于测 试样本γ,构建其近邻训练样本集;步骤2,根据步骤I所述的近邻训练样本集,得到测试样本y在近邻训练样本集内的线性表示系数;步骤3,将近邻训练样本集按照训练样本类别划分成c个子近邻训练样本集,利用子近邻训练样本集及其对应的线性表示系数计算测试样本y在每一个子近邻训练样本集内的重构误差;步骤4,比较测试样本y在每一个子近邻训练样本集内的重构误差:当测试样本y在第M类的子近邻训练样本集内的重构误差最小时,将测试样本y归为第M类,所述M为小于或者等于c的自然数。所述基于局部线性表示的模式分类方法,步骤I中所述的近邻训练样本集构建方法如下:步骤1-1,计算测试样本I到训练样本集中每个训练样本的距离;步骤1-2,在训练样本集中提取前K个最近邻训练样本构成近邻训练样本集,其中:κ的取值如下:当min (N1, N2,...,Nc) >50 时,K=max (N1, N2,...,Nc);当20〈max (N1, N2,…,Nc) < 50 时,K=3 Xmax (N1, N2,...,Nc);当max (N1, N2,…,Nc) < 20 且 c>10 时,K=5 Xmax (N1, N2,…,Nc);当max (N1, N2,...,Nc)彡 20 且 c 彡 10 时,K=N/2 ;其中,N1为训练样本集中第一类别样本个数,N2为训练样本集中第二类别样本个数,Nc为训练样本集中第c类样本个数,N为训练样本总数。本发明采用上述技术方案,具有以下有益效果:通过减少训练样本数目,降低了计算难度;在提高识别率的同时缩减了计算时间。
具体实施例方式下面对发明的技术方案进行详细说明:利用包含C个类别的训练样本集X识别测试样本y所属的类别,包括如下步骤。X=LX11X2,...,Xc], Xi=[xn, xi2,...,xiNi]表示第 i 类训练样本集,Xi 包含 Ni 个样
本,Xij e Rd (Rd表示d维的实向量集合)表示第i类的第j个训练样本,
权利要求
1.基于局部线性表示的模式分类方法,利用包括C个类别的训练样本集识别测试样本y所属的类别,所述c为自然数,其特征在于包括如下步骤: 步骤I,对于测试样本y,构建其近邻训练样本集; 步骤2,根据步骤I所述的近邻训练样本集,得到测试样本y在近邻训练样本集内的线性表示系数; 步骤3,将近邻训练样本集按照训练样本类别划分成c个子近邻训练样本集,利用子近邻训练样本集及其对应的线性表示系数计算测试样本y在每一个子近邻训练样本集内的重构误差; 步骤4,比较测试样本y在每一个子近邻训练样本集内的重构误差:当测试样本y在第M类的子近邻训练样本集内的重构误差最小时,将测试样本y归为第M类,所述M为小于或者等于c的自然数。
2.根据权利要求1所述的基于局部线性表示的模式分类方法,其特征在于步骤I中所述的近邻训练样本集构建方法如下: 步骤1-1,计算测试样本y到训练样本集中每个训练样本的距离; 步骤1-2,在训练样本集中提取前K个最近邻训练样本构成近邻训练样本集,其中:K的取值如下: 当 min (N1, N2,…,Nc) >50 时,K=max (N1, N2,…,Nc);当 20〈max (N1, N2,...,Nc)≤ 50 时,K=3 Xmax (N1, N2,…,Nc);当 max (N1, N2,…,Nc)≤ 20 且 c> 10 时,K=5 Xmax (N1, N2,…,Nc);当 max (N1, N2,…,Nc)≤ 20 且 c ≤ 10 时,K=N/2 ; 其中,N1为训练样本集中第一类别样本个数,N2为训练样本集中第二类别样本个数,Nc为训练样本集中第c类样本个数,N为训练样本总数。
全文摘要
本发明公开了基于局部线性表示的模式分类方法,属于模式识别的技术领域。首先使用测试样本的部分近邻训练样本去线性表示该测试样本,得到一组线性表示系数;然后计算使用这些近邻训练样本中每个类的样本和相应的线性表示系数去重构测试样本的重构误差;最后根据重构误差来对测试样本进行分类。在计算测试样本的线性表示时,通过减少训练样本数目,降低了计算难度;在提高识别率的同时缩减了计算时间。
文档编号G06K9/66GK103246892SQ20131005976
公开日2013年8月14日 申请日期2013年2月26日 优先权日2013年2月26日
发明者刘茜, 马杰良, 王丽娜 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1