基于线性表示鉴别字典学习的分类方法与流程

文档序号:11143534阅读:381来源:国知局
本发明具体涉及基于线性表示鉴别字典学习的分类方法,属于模式识别
技术领域

背景技术
:现有的“基于鉴别线性表示的模式分类方法”(DLRC,刘茜、王丽娜、马杰良,“基于鉴别线性表示的模式分类方法”,专利号:ZL201310060437.X,专利申请日:2013.02.26,专利授权日:2016.02.10.):设X=[X1,X2,...,Xc]表示包含c个类别的训练样本集,表示第i个类别的训练样本集,Xi包含Ni个样本,xij∈Rd(Rd表示d维的实向量集合)表示第i类的第j个训练样本,y∈Rd表示一个测试样本。DLRC方法通过求解下面的问题获得对应Xi的一组线性表示系数计算用每个类的训练样本去重构测试样本y的重构误差,如下:ri(y)=||y-Xiβi||2(i=1,2,…,c)如果rk(y)在r1(y),r2(y),…,rc(y)中最小,DLRC方法将y归到第k类。上述DLRC方法直接使用每个类的原始训练样本集作为字典去重构测试样本,得到的所有重构样本很可能都与原始测试样本之间存在较大的误差。在重构误差都比较大的情况下再根据这些误差去进行分类,很可能对分类结果产生不利的影响。技术实现要素:发明目的:基于线性表示鉴别字典学习的分类方法使用训练样本集进行字典学习,对每个类学习得到一个能够更加精确地表示该类样本的字典,同时要求该字典不能精确表示其他类的样本,然后再分别使用每个学习得到的字典去重构测试样本来进行分类,可以有效地提高分类效果。在YaleB人脸数据库(A.S.Georghiades,P.N.Belhumeur,andD.J.Kriegman,“FromFewtoMany:IlluminationConeModelsforFaceRecognitionunderVariableLightingandPose”,IEEETrans.PatternAnalysisandMachineIntelligence,vol.23,no.6,pp.643-660,2001)和MNIST手写体数字数据库(Y.Mizukami,K.Tadamura,J.Warrell,P.Li,andS.Prince,“CUDAImplementationofDeformablePatternRecognitionandItsApplicationtoMNISTHandwrittenDigitDatabase”,Int.Conf.PatternRecognition,pp.2001-2004,2010)上做仿真实验,证明基于线性表示鉴别字典学习的分类方法能够更好地对测试样本进行分类。技术方案如下:设X=[X1,X2,...,Xc]表示包含c个类别的训练样本集,表示第i个类别的训练样本集,Xi包含Ni个样本,xij∈Rd(Rd表示d维的实向量集合)表示第i类的第j个训练样本,y∈Rd表示一个测试样本。A、在训练阶段,基于线性表示鉴别字典学习的分类方法通过求解下面的问题获得(1)对应第i个类别的字典(表示d×Ni阶实矩阵集合),i=1,2,…,c;(2)使用Di分别去线性表示X1,X2,...,Xc的c个线性表示系数矩阵通过依次更新和Di进行迭代求解,可以得到这两组变量的解。B、在分类测试阶段,步骤1,基于线性表示鉴别字典学习的分类方法通过求解下面的问题获得线性表示系数向量计算用第i个类别的字典Di去重构测试样本y的重构误差,如下:ri(y)=||y-Diβi||2(i=1,2,…,c)步骤2,如果rk(y)在r1(y),r2(y),…,rc(y)中最小,基于线性表示鉴别字典学习的分类方法将y归到第k类。有益效果本发明采用以上技术方案与现有技术相比,具有以下有益效果:基于线性表示鉴别字典学习的分类方法使用训练样本集进行字典学习,对每个类学习得到一个能够更加精确地表示该类样本的字典,同时使该字典不能精确表示其他类的样本,然后再分别使用每个学习得到的字典去重构测试样本来进行分类,相较于现有技术有效提高了字典的分类能力,明显提高了分类精度。具体实施方式以下具体说明本发明的技术方案。实验验证选用YaleB人脸数据库(A.S.Georghiades,P.N.Belhumeur,andD.J.Kriegman,“FromFewtoMany:IlluminationConeModelsforFaceRecognitionunderVariableLightingandPose”,IEEETrans.PatternAnalysisandMachineIntelligence,vol.23,no.6,pp.643-660,2001)和MNIST手写体数字数据库(Y.Mizukami,K.Tadamura,J.Warrell,P.Li,andS.Prince,“CUDAImplementationofDeformablePatternRecognitionandItsApplicationtoMNISTHandwrittenDigitDatabase”,Int.Conf.PatternRecognition,pp.2001-2004,2010)。YaleB人脸数据库由10个人,共5760张图片组成,每人576张32×32的灰度图像,有光照变化、姿态变化等。实验中每个人选择70张图像作为训练样本、20张图像作为测试样本。MNIST手写体数字数据库由10个阿拉伯数字,共10000张图片组成,每个数字有863~1127张28×28的灰度图像,包含了各种形式的手写阿拉伯数字。实验中每个数字选择100张图像作为训练样本、30张图像作为测试样本。实验统计DLRC和基于线性表示鉴别字典学习的分类方法(即表中的LRDDL)的平均识别率,见表1。从表1中可以看出,基于线性表示鉴别字典学习的分类方法的平均识别率明显高于DLRC,这说明字典学习有效地提高了字典的分类能力。表1DLRC和LRDDL的平均识别率(%)分类器YaleB人脸数据库MNIST手写体数字数据库DLRC51.1390.58LRDDL83.3892.50当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1