基于鉴别线性表示的模式分类方法

文档序号:6587195阅读:422来源:国知局
专利名称:基于鉴别线性表示的模式分类方法
技术领域
本发明公开了基于鉴别线性表示的模式分类方法,属于模式识别的技术领域。
背景技术
SRC (Sparse Representation-based Classification,稀疏表不分类器),以全部样本作为字典,稀疏表不测试样本与训练样本的关系。相对于传统的最近邻分类器来说,SRC分类器取得了较好的分类性能。但是,SRC分类器最大的问题就是,计算稀疏系数的时间复杂度很高,随着训练样本个数的增长,计算时间呈指数阶增长。

发明内容
本发明所要解决的技术问题是针对上述背景技术的不足,提供了基于鉴别线性表示的模式分类方法。本发明为实现上述发明目的采用如下技术方案:基于鉴别线性表示的模式分类方法,利用包括c个类别的训练样本集识别测试样本I所属的类别,所述C为自然数,包括如下步骤:步骤I, 将训练样本集按照样本类别划分为c个子训练样本集;步骤2,计算测试样本y在各子训练样本集内的线性表示系数;步骤3,计算测试样本y在每一个子训练样本集内的重构误差;步骤4,比较测试样本y在各个子训练样本集内的重构误差:当测试样本y在第M类子训练样本集内的重构误差最小时,将测试样本y归为第M类,所述M为小于或者等于c的自然数。本发明采用上述技术方案,具有以下有益效果:确定测试样本在每一类子样本集中的线性表示系数,通过减少训练样本数目,降低了计算难度;在提高识别率的同时缩减了计算时间。
具体实施例方式下面对发明的技术方案进行详细说明:利用包含C个类别的训练样本集X识别测试样本y所属的类别,包括如下步骤。X=LX11X2,...,Xc], X1= [xlt,X12,-、」表示第i类训练样本集,Xi包含Ni个样本,
Xij e Rd (Rd表示d维的实向量集合)表示第i类的第j个训练样本,N = Ini,y e Rd,c为
J i=l
自然数,Ni为自然数。步骤1,将训练样本集按照样本类别划分为c个子训练样本集。步骤2,计算测试样本y在各子训练样本集内的线性表示系数:对第i类子训练样本集Xi利用表达式11InIi y_x晶&确定测试样本y在第i类子训练样本集Xi内的线性表示系
数A =[Ai,A2....,ftN,]TeRNi O
步骤3,计算测试样本y在第i类子训练样本集Xi内的重构误差Ti (y) = Iy-Xi β i I I2Q=I, 2,…,c)。步骤4,比较测试样本y在各个子训练样本集内的重构误差:当测试样本y在第M类子训练样本集内的重构误差最小时,将测试样本y归为第M类,所述M为小于或者等于c的自然数。SRC分类器与本发明所述基于鉴别线性表示的模式分类方法相比,不同之处在于:SRC分类器利用包含c个类别的训练样本集X,得到测试样本y在训练样本集X内的稀疏表示系数α,依据表达SmjnI10=II1 〃.=.>’或者-.<4 < ε确定稀疏表示系数α ;再利用稀疏表示系数α、训练样本集X计算用每个类的训练样本和相应的稀疏表示系数去重构测试样本I的重构误差。由于SRC分类器中,训练样本个数至少要等于样本维数d,才能保证Xa = y ;或者,训练样本个数要比较接近d,才能保证在ε比较小的情况下,满足Il Xa-y| |2〈 ε,但是d通常都是比较大的数字。稀疏系数中的非零系数主要对应着与测试样本同类的训练样本,这是SRC分类器的原理。本发明分别使用每个类的训练样本来线性表示测试样本,可以获得不低于SRC分类器的识别效果。此外,本发明通过分别使用每个类的训练样本来线 性表示测试样本,将一个规模较大的线性规划问题拆分为c个规模较小的线性规划问题来获得线性表示系数,可以大大减少计算时间。下面选用Yale B人脸数据库(The Yale Face Database B)和MNIST手写体数字数据库验证本发明所述的基于鉴别线性表示的模式分类方法。Yale B人脸数据库由10个人,共5760张图片组成,每人576张32X 32的灰度图像,有光照变化、姿态变化等。实验中每个人选择70张图像作为训练样本、20张图像作为测试样本。MNIST手写体数字数据库由10个阿拉伯数字,共10000张图片组成,每个数字有863 1127张28X28的灰度图像,包含了各种形式的手写阿拉伯数字。实验中每个人选择100张图像作为训练样本、30张图像作为测试样本。实验统计SRC分类器和鉴别线性表示分类器(即本发明所述的基于鉴别线性表示的模式分类方法)的平均识别率和平均计算时间,见表I。从表I中可以看出,鉴别线性表示分类器的平均计算时间明显少于SRC分类器,并且鉴别线性表示分类器的平均识别率明显高于SRC分类器。
权利要求
1.基于鉴别线性表示的模式分类方法,利用包括C个类别的训练样本集识别测试样本I所属的类别,所述C为自然数,其特征在于包括如下步骤: 步骤I,将训练样本集按照样本类别划分为c个子训练样本集; 步骤2,计算测试样本y在各子训练样本集内的线性表示系数; 步骤3,计算测试样本y在每一个子训练样本集内的重构误差; 步骤4,比较测试样本y在各个子训练样本集内的重构误差:当测试样本y在第M类子训练样本 集内的重构误差最小时,将测试样本y归为第M类,所述M为小于或者等于c的自然数。
全文摘要
本发明公开了基于鉴别线性表示的模式分类方法,属于模式识别的技术领域。本发明将训练样本集按照样本类别划分为子训练样本集,计算测试样本在各子训练样本集内的线性表示系数,然后计算测试样本在每一个子训练样本集内的重构误差,当测试样本在某类子训练样本集内的重构误差最小时,将测试样本归为这一类。本发明确定测试样本在每一类子训练样本集中的线性表示系数,通过减少训练样本数目,降低了计算难度;在提高识别率的同时缩减了计算时间。
文档编号G06K9/62GK103226710SQ20131006043
公开日2013年7月31日 申请日期2013年2月26日 优先权日2013年2月26日
发明者刘茜, 王丽娜, 马杰良 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1