基于核空间的分类聚集稀疏表示的人脸识别方法与流程

文档序号:12544280阅读:195来源:国知局
基于核空间的分类聚集稀疏表示的人脸识别方法与流程
本发明模式识别技术领域,具体地说,涉及一种基于核空间的分类聚集稀疏表示的人脸识别方法。

背景技术:
随着科技的发展,诸多领域均面临着日益膨胀的大量数据,例如地震数据、地球物理数据、音频数据、天文数据、工业控制数据、基因数据等等,如何对这些庞大的数据实现灵活、有效和自适应的表达逐渐成为人们关注的问题之一。图像处理、信息传输、计算机视觉等诸多领域一直在寻求信号与图像的稀疏而简洁地表示方式,这种稀疏表示的好处就在于,非零系数揭示了信号与图像的内在结构与本质属性,同时非零系数具有显式的物理意义。人脸识别作为计算机视觉和模式分类领域的重要技术,越来越受到人们的关注与重视。人脸识别是利用计算机对人脸信息进行特征的提取并进行分类识别的过程,通常包含两个阶段:一是特征提取,二是构造分类器和标签预测。不同于指纹识别、步态识别、虹膜识别等一般的生物特征识别技术,人脸识别因其便捷性、友好性、高效性,已成为图像处理、模式识别、机器视觉和心理人脸识别具有广泛的应用意义和巨大的应用前景。目前,人脸识别技术主要应用于以下几个方面:刑侦破案、自动化智能管理、机器人学习、智能化相机、网络应用等。近些年,最近邻子空间的方法受到了关注,通过比较一副测试图像在每一类中的重建误差,为其分配标签。在近邻子空间的方法体系下,Huang等人(参见K.HuangandS.Aviyente.Sparserepresentationforsignalclassification.InNIPS,2006.)在一个随机基上对一个信号进行稀疏编码,根据信号的编码向量对其分类。Zhang等人提出了基于协同表示的人脸识别方法,该方法首先对一幅测试图像在训练集上进行协同表示,然后计算该幅图像与每类训练集上协同表示的重构误差得到最终的判决结果,该方法实现起来比较简单,而且性能良好。Wright等人(参见J.Wright,A.Y.Yang,A.Ganesh,S.S.Sastry,andY.Ma.Robustfacerecognitionviasparserepresentation.IEEEPAMI,31(2):210–227,2009)将稀疏编码用于鲁棒人脸识别,首先将一副测试的人脸图像在模板图像上稀疏编码,然后根据产生最小编码误差的类别决定分类结果。这种基于稀疏表达的分类器方法,即SRC,在人脸识别领域取得了极大成功,同时也促进了基于模式分类的稀疏性研究。不少研究学者探索了分类词典学习的方法,并取得了瞩目的成果。Yang等人(参见Yang,M.,Zhang,L.,Yang,J.,Zhang,D.,2010.Metafacelearningforsparserepresentationbasedfacerecognition.In:Proceedingsofthe17thICIP.IEEE,pp.1601–1604.2)使用稀疏表示为每一类学习一个词典,并将其运用到人脸识别中。此外,在核空间词典学习领域,Gemert等人(参见vanGemertJ,VeenmanC,SmeuldersA,GeusebroekJ.Visualwordambiguity.IEEETransactionsonPatternAnalysisandMachineIntelligence,32(7):1271-1283,2010.)提出了一种高斯RBF核的词典,在词典学习的过程中,首先将特征映射到高斯RBF核空间,然后在新的空间使用K-means算法。高斯RBF核的引入提升了图像分类性能,这是因为高斯RBF核将距离近的点映射到新空间后距离变的更近,将距离远的点映射到新空间后距离变的更远,具有一定近邻约束的性质。Wu等人(参见WuJ,RehgJM.Beyondtheeuclideandistance:Creatingeffectivevisualcodebooksusingthehistogramintersectionkernel[C]//ComputerVision,2009IEEE12thInternationalConferenceon.IEEE,2009:630-637)提出了在直方图交叉核空间词典,由于图像分类的特征本身就是一种直方图,直方图交叉核函数更适合度量直方图间的距离,并且取得了不错的分类效果。这几种方法都是基于K-means算法的扩展,由于K-means算法自身的强约束性,分类性能受到一定的影响,很难有太大的进展。Gao等人(参见GaoS,TsangI,ChiaL.Sparserepresentationwithkernels.IEEETransactiononImageProcessing,22(2):423-434,2013.)直接将欧式空间中SR算法求取的过完备基映射到再生核希尔伯特空间,完成再生核希尔伯特空间的稀疏表达。Gao等人首次将核函数引入到了稀疏编码算法中,形成核空间的SR算法。该方法将图像特征和词典都映射到核空间,然后在核空间执行SR算法。该方法取得了不错的效果,但是存在着一定的不足,首先,图像特征空间与词典空间映射到同一个核空间未必合理,这是因为对于图像分类问题,图像特征一般说来每个bin都是正数,是位于欧式空间的某个特定区间,而词典的各个bin则有正有负,在欧式空间中,线性拟合的方式没有问题,然而映射到高维非线性核空间,这种线性拟合的假设并不准确;其次,该方法所有的推导都是基于高斯RBF核的,所以推广性不强。综上所述,传统的人脸识别方法大多都是直接使用训练样本构造子空间,利用测试样本在构造子空间中拟合,这种方式导致测试样本在子空间中的拟合误差较大。而传统的词典学习方法将原始样本转换到稀疏子空间时,并不能保证稀疏子空间内每类样本的稀疏编码聚集在一起,不利于人脸的识别。此外,常用的词典学习方法都是在原始欧式空间进行的,是的隐藏在数据中的非线性结构无法被捕捉,会导致人脸的非线性结构信息丢失。

技术实现要素:
本发明针对现有人脸识别方法存在拟合误差大、精确度不高等上述不足,提供一种基于核空间的分类聚集稀疏表示的人脸识别方法,该方法在稀疏表达约束中加热分类集中约束项,使同类样本在子空间中更加聚集,不同类样本在子空间中相对分散,有利于样本在高维子空间中的聚类,提高了识别效果。本发明的技术方案是:一种基于核空间的分类聚集稀疏表示的人脸识别方法,含有以下步骤:步骤一:采用卷积神经网络对人脸图像提取人脸特征。步骤二:训练分类聚集词典,其训练步骤为:(一)输入训练样本,采用包含C个种类的图片样本训练分类词典,训练样本空间用X表示,表示为X=[X1,X2,…,Xc,…,XC]∈RD×N,D表示训练样本的特征维度,N是训练样本总的个数,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…Nc+…+NC;(二)对训练样本进行二范数归一化,得到归一化的训练样本集X;(三)对每一类训练样本分别训练其聚集词典,训练词典的过程为:1、取出第c类样本Xc,将Xc映射到核空间φ(Xc);2、稀疏编码词典φ(Xc)Wc的训练需要满足约束条件,所述约束条件的目标函数为:式中,α为稀疏编码算法中稀疏项约束的惩罚系数,η为稀疏编码词典Xc中分类聚集约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc,φ表示样本在核空间中的映射;3、对步骤2中约束条件的目标函数进行求解,即对公式(1)求解,求解方法为:首先,对Wc和Sc进行初始化,随机生成两个矩阵,其中,Wc是Nc×K矩阵,Sc是K×Nc矩阵;然后,交替迭代更新Wc和Sc,求取最优的权重矩阵Wc和稀疏表示矩阵Sc,使得目标函数值最小,将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,该权重矩阵W即为分类聚集词典;步骤三:对图像进行识别,其步骤为:(一)采用卷积神经网络提取待识别测试样本的图像特征,定义y∈RD×1表示一幅待识别的测试样本图像特征;并将测试样本图像特征y映射到核空间φ(y);(二)使用步骤二中获得的权重矩阵W,对核空间φ(y)进行拟合,获取拟合函数;(三)对步骤(二)中获取的拟合函数进行求解;(四)核空间φ(y)在每类样本所构成子空间的拟合误差;(五)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。作为优选,所述步骤二的步骤3中,对步骤2中约束条件的目标函数进行求解的具体过程为:(1)固定Wc,更新Sc;将Wc带入约束条件的目标函数,这时该目标函数转化成为一个关于Sc的l1范数正则化最小二乘问题,即目标函数转化为:忽略常数项,上述公式(2)可以简化为:κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数。去掉常数项,获得以下公式:对Sc矩阵中的每一个元素进行更新,使公式(4)最优,对Sc矩阵中的每一个元素进行更新的方法步骤为:定义Sc中的第k行第n列的元素为更新Sc矩阵,使Sc矩阵满足公式(3)的约束条件为:逐次更新Sc矩阵每一行每一列的元素;设第k行第n列的元素为未知,Sc矩阵其它元素为已知,则公式(3)可以变形为:上述公式(5)为变量的一元二次方程,则的最优解为变量满足如下方程:其中,E=WcTκ(Xc,Xc)Wc;依次遍历Sc矩阵每一个元素,即求取最优的稀疏表示矩阵Sc;(2)固定步骤(1)中求取的稀疏表示矩阵Sc,更新权重矩阵Wc,这时约束条件的目标函数转换为权重矩阵Wc的l2范数约束的最小二乘问题,即目标函数转化为:采用拉格朗日乘子的方法计算l2范数约束的最小二乘问题,忽略公式(7)中的常数项约束,则公式(7)变化为:式中,λk为拉格朗日乘子;根据Karush-Kuhn-Tucker条件,上述公式(8)取得最优解需要满足如下条件:对权重矩阵Wc的每一列逐次进行更新,更新某一列时,其余列则为固定值;通过求解公式(9)获得Wc的每一列更新值为:式中,表示在满足公式(7)的约束条件下的权重矩阵Wc的第k列的最优值;F=ScScT,遍历Wc的每一列来更新Wc的权值;(3)交替更新上述步骤(1)和步骤(2)来更新稀疏表示矩阵Sc和权重矩阵Wc的权值,当上述公式(1)的目标函数值f(Wc,Sc)趋于稳定时,稀疏表示矩阵Sc和权重矩阵Wc更新完毕;(4)依次训练每一类训练样本的稀疏表示矩阵Sc和权重矩阵Wc;(5)将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,权重矩阵W表示为:上述获得的权重矩阵W即为分类聚集词典。进一步的,步骤三的步骤(二)中获取的拟合函数为:式中,s表示测试样本φ(y)的稀疏编码,φ(X)表示训练样本X在核空间的映射。进一步的,步骤三的步骤(三)中,对步骤(二)中公式(12)表示的拟合函数进行求解,其求解结果为:式中,sk表示s中的第k个元素,进一步的,步骤三的步骤(四)中,核空间φ(y)在每类样本所构成子空间的拟合误差用r(c)表示,其表达式为:式中,φ(y)为测试样本图像特征y在核空间的映射。本发明的有益效果是:本发明考虑了用训练样本对测试样本进行稀疏表达时,每个训练样本对子空间构造的权重的不同,以及离类中心近的训练样本对构造子空间应当具有更大的权重,采用φ(Xc)Wc矩阵构造新的稀疏表达词典,其中φ(Xc)是每类训练样本,Wc为本发明提出的词典权重矩阵;本发明在稀疏表达约束中加入分类集中约束项,使同类样本在子空间中更加聚集,不同类样本在子空间中相对分散,并推倒出该人脸识别方法的迭代优化方法。与现有技术相比,本发明提出的人脸识别方法能够有效的降低测试样本在相应子空间内的拟合误差,且使得相同类别的样本在稀疏空间内能够聚集在一起,从而提升了人脸识别性能;推广至核空间后,本发明人脸识别方法处理非线性结构和关系的能力增强,能够有效发掘复杂数据的隐藏特征,进一步提升人脸识别性能。附图说明图1为本发明具体实施例训练分类聚集词典的流程图。图2为本发明具体实施例对样本进行图像识别的流程图。具体实施方式下面结合附图对本发明作出进一步说明。一种基于核空间的分类聚集稀疏表示的人脸识别方法,含有以下步骤:步骤一:采用卷积神经网络对人脸图像提取人脸特征。本实施例中,选用VGG模型(Deepfacerecognition,O.M.ParkhiandA.VedaldiandA.Zisserman,DeepFaceRecognition,ProceedingsoftheBritishMachineVisionConference(BMVC),2015)。首先,将人脸图像尺度大小变为224×224大小,然后调用VGG模型,得到人脸图像的特征。步骤二:训练分类聚集词典,其训练步骤为:(一)输入训练样本,采用包含C个种类的图片样本训练分类词典,训练样本空间用X表示,表示为X=[X1,X2,…,Xc,…,XC]∈RD×N,D表示训练样本的特征维度,N是训练样本总的个数,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…Nc+…+NC;(二)对训练样本进行二范数归一化,得到归一化的训练样本集X;(三)对每一类训练样本分别训练其聚集词典,训练词典的过程为:1、取出第c类样本Xc,将Xc映射到核空间φ(Xc);2、稀疏编码词典φ(Xc)Wc的训练需要满足约束条件,所述约束条件的目标函数为:式中,α为稀疏编码算法中稀疏项约束的惩罚系数,η为稀疏编码词典Xc中分类聚集约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc,φ表示样本在核空间中的映射,φ是未知的,但可以通过核函数计算其内积,例如:κ(x,y)=<φ(x),φ(y)>。3、对步骤2中约束条件的目标函数进行求解,即对公式(1)求解,求解方法为:首先,对Wc和Sc进行初始化,随机生成两个矩阵,其中,Wc是Nc×K矩阵,Sc是K×Nc矩阵;然后,交替迭代更新Wc和Sc,求取最优的权重矩阵Wc和稀疏表示矩阵Sc,使得目标函数值最小,将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得权重矩阵W,该权重矩阵W即为分类聚集词典;其具体求解过程为:(1)固定Wc,更新Sc;将Wc带入约束条件的目标函数,这时该目标函数转化成为一个关于Sc的l1范数正则化最小二乘问题,即目标函数转化为:忽略常数项,上述公式(2)可以简化为:κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数。去掉常数项,获得以下公式:对Sc矩阵中的每一个元素进行更新,使公式(4)最优,对Sc矩阵中的每一个元素进行更新的方法步骤为:定义Sc中的第k行第n列的元素为更新Sc矩阵,使Sc矩阵满足公式(3)的约束条件为:逐次更新Sc矩阵每一行每一列的元素;设第k行第n列的元素为未知,Sc矩阵其它元素为已知,则公式(3)可以变形为:上述公式(5)为变量的一元二次方程,则的最优解为变量满足如下方程:其中,E=WcTκ(Xc,Xc)Wc;依次遍历Sc矩阵每一个元素,即求取最优的稀疏表示矩阵Sc。(2)固定步骤(1)中求取的稀疏表示矩阵Sc,更新权重矩阵Wc,这时约束条件的目标函数转换为权重矩阵Wc的l2范数约束的最小二乘问题,即目标函数转化为:采用拉格朗日乘子的方法计算l2范数约束的最小二乘问题,忽略公式(7)中的常数项约束,则公式(7)变化为:式中,λk为拉格朗日乘子;根据Karush-Kuhn-Tucker条件,上述公式(8)取得最优解需要满足如下条件:对权重矩阵Wc的每一列逐次进行更新,更新某一列时,其余列则为固定值;通过求解公式(9)获得Wc的每一列更新值为:式中,表示在满足公式(7)的约束条件下的权重矩阵Wc的第k列的最优值;F=ScScT,遍历Wc的每一列来更新Wc的权值;(3)交替更新上述步骤(1)和步骤(2)来更新稀疏表示矩阵Sc和权重矩阵Wc的权值,当上述公式(1)的目标函数值f(Wc,Sc)趋于稳定时,稀疏表示矩阵Sc和权重矩阵Wc更新完毕;(4)依次训练每一类训练样本的稀疏表示矩阵Sc和权重矩阵Wc;(5)将每一类训练样本的权重矩阵Wc放置到一个大的矩阵当中,获得维数为N行C×K列的权重矩阵W,权重矩阵W表示为:上述获得的权重矩阵W即为分类聚集词典。步骤三:对图像进行识别,其步骤为:(一)采用卷积神经网络提取待识别测试样本的图像特征,具体如下:将测试样本图像尺度变为224×224mm大小,然后调用VGG模型,提取该测试样本图像的特征,定义y∈RD×1表示一幅待识别的测试样本图像特征。(二)使用步骤二中获得的权重矩阵W,对核空间φ(y)进行拟合,获取拟合函数,获取的拟合函数为:式中,s表示测试样本φ(y)的稀疏编码,φ(X)表示训练样本X在核空间的映射。(三)对步骤(二)中获取的拟合函数进行求解,其求解结果为:式中,sk表示s中的第k个元素,(四)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:式中,φ(y)为测试样本图像特征y在核空间的映射。(五)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。通过本发明上述方法进行人脸识别,一方面能够有效地降低测试样本在相应子空间内的拟合误差,识别精确度高,另一方面,使得相同类别的测试样本在稀疏空间内能够聚集在一起,从而提升人脸识别的性能。由于本发明人脸识别方法处理非线性结构和关系的能力增强,能够有效发掘复杂数据的掩藏特征,进一步提升了人脸识别性能。以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1