基于鲁棒性自适应图结构学习算法的人脸识别方法

文档序号:26486215发布日期:2021-08-31 17:41阅读:129来源:国知局
基于鲁棒性自适应图结构学习算法的人脸识别方法
本发明公开涉及机器学习的
技术领域
,尤其涉及一种基于鲁棒性自适应图结构学习算法的人脸识别方法。
背景技术
:人脸识别技术作为生物特征识别领域的一个分支,在生物、人机交互和信息安全等领域中得到了广泛的应用,同时使它成为模式识别和计算机视觉领域中一个非常重要的研究课题。尽管已有大量研究者提出了各种相关算法来提高人脸识别系统的性能,但它仍然是一个极具有挑战性的问题。这是因为真实环境下拍摄的人脸图像极其容易受到光照、年龄、姿势、面部表情和伪装等影响。而且,遮挡和噪声等因素也会影响人脸识别算法的性能。如果能够在一定的程度上克服这些因素的影响,可以使人脸识别系统更加具有鲁棒性。随着信息技术的飞速发展,大多数真实世界的数据可以通过图构建的方式来描述样本之间的相似度关系。因此,图学习在数据挖掘和机器学习领域发挥着重要的作用。近年来,研究者们提出了大量的图学习方法。其中,热核函数是一种应用最广泛的图构造方式。然而,参数的选择十分具有挑战性,将直接影响后续任务的性能。此外,上述方法通常依赖于数据,并且独立于相似度度量,导致构建的图结构对噪声十分敏感。为了解决上述问题,学者们利用稀疏表示来构建l1图或稀疏图。虽然l1图可以揭示单个点与其它点之间的线性关系,但仍然存在如下局限性。首先,l1图过度依赖于较强的假设,即重构字典要求是过完备的,而这在许多实际应用中较难满足,特别是在图学习问题中;其次,l1图仅考虑了数据稀疏性,而忽略了样本之间的相关性,无法对数据进行平滑表示。在实际应用中,研究人员发现,数据之间的关系往往呈现高维非线性特征,上述线性表示方法很难取得良好的性能。目前,许多研究者更注重揭示感兴趣数据点之间的非线性关系。例如:yu等人发现稀疏编码的非零系数总是分配给查询样本的近邻样本。为了实现编码的局部性,peng等人提出了局部性约束的协同表示方法,经实验验证,该方法比传统的非局部性方法取得更好的分类性能。最近,chen等人将局部性约束和lsr相融合,设计了一种局部性约束的lsr(lclsr)方法,并将其用于子空间聚类任务。lclsr方法是从数据点的全局结构和局部线性关系出发,设计一种图学习目标函数,从而使得数据点的表示更倾向于邻域点的选择。虽然lclsr考虑了数据的局部结构关系,但仍存在以下局限性:一方面,lclsr的目标函数是基于l2范数,因此该方法对噪声敏感;另一方面,样本重构过程忽略了样本表示之间的关系,即相似的样本应该具有相似的编码表示系数,从而弱化了图学习的有效性。技术实现要素:鉴于此,本发明提供了一种基于鲁棒性自适应图结构学习算法的人脸识别方法,以提升图结构的有效性,增强图学习的鲁棒性,改善图像识别的效果。本发明提供的技术方案,具体为,一种基于鲁棒性自适应图结构学习算法的人脸识别方法,该方法包括如下步骤:s1:获取多张人脸图像数据;s2:采用基于鲁棒性自适应图结构学习算法,计算获得所述多张人脸图像数据对应的权值矩阵w;s3:基于所述权值矩阵w对待识别的人脸图像数据进行分类,完成人脸识别;步骤s2中所述基于鲁棒性自适应图结构学习算法,具体为:其中,α和β为平衡参数;x为高维样本集,且x=[x1,x2,...,xn]∈rd×n,n为所述高维样本集中包含的样本个数,每个样本xi的维度为d;w=(xtgx+αq+βl)-1xtgx;lt+1=dt+1-rt+1;||·||2,1表示矩阵的l2,1范数,||·||2表示为矩阵的l2范数,ε表示一个非常小的非负常数,wi和wj分别为xi和xj的重构稀疏系数,sij表示样本xi和xj的相似性权值,d为对角矩阵,其对角元素为优选,所述基于鲁棒性自适应图结构学习算法中,α和β的取值均为0.1-1。进一步优选,步骤s2:采用基于鲁棒性自适应图结构学习算法,计算获得所述多张人脸图像数据对应的权值矩阵w,具体为:s201:输入人脸图像数据矩阵x=[x1,x2,...,xn],迭代次数t=30,以及两个平衡参数α和β;s202:初始化时,gt和qt均为单位矩阵,w为随机矩阵,t=1;s203:计算所述输入人脸图像数据矩阵的相似矩阵s;s204:更新矩阵s205:计算矩阵和拉普拉斯矩阵lt+1=dt+1-rt+1;s206:更新矩阵wt+1=(xtgtx+αqt+βlt+1)-1xtgtx;s207:更新矩阵s208:更新矩阵s208:令t=t+1,重复步骤s204-步骤s208,直至收敛,此时,对应的权值矩阵w为求得的权值矩阵w。进一步优选,步骤s3:基于所述权值矩阵w对待识别的人脸图像数据进行分类,完成人脸识别,具体为:s301:在所述权值矩阵w的基础上,采用局部保持投影的方法将待识别的人脸图像数据进行降维;s302:利用最近邻分类器,对降维后的人脸图像数据进行分类,完成人脸识别。进一步优选,步骤s301:在所述权值矩阵w的基础上,采用局部保持投影的方法将待识别的人脸图像数据进行降维,具体为:利用公式y=ptx,将高维的待识别的人脸图像数据x降为低维y;其中,xlxtp=λxdxtp,x为待识别的人脸图像数据,l=d-w是一个拉普拉斯矩阵,d为对角矩阵,其对角元素为λ为求解出特征向量p所对应的特征值。本发明提供的基于鲁棒性自适应图结构学习算法的人脸识别方法,将鲁棒性的自适应图结构学习算法应用在人脸识别任务中,其中的鲁棒性的自适应图结构学习算法,不同于现有的图学习方法,提出的算法利用自表示和自适应近邻方法来挖掘数据的全局结构信息和局部结构信息。同时,为了降低噪声点对图结构的影响,本发明通过引入基于l2,1范数的流形约束来提高算法对噪声的鲁棒性,以达到鲁棒性的图构建目的。本发明提供的基于鲁棒性自适应图结构学习算法的人脸识别方法,充分地挖掘了数据的局部结构信息和全局结构信息,提升了图结构的有效性;同时,将基于l2,1范数的流形约束引入到图学习过程中,增强了图学习的鲁棒性,改善识别效果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明的公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1四个标准的人脸图像数据库中的部分人脸图像示例,其中,(a)yale数据库,(b)ar数据库,(c)cmupie数据库,(d)extendedyaleb数据库;图2本实施方案在不同数据库和不同参数取值情况下的分类准确率直方图,其中,(a)yale数据库,(b)ar数据库,(c)cmupie数据库,(d)extendedyaleb数据库。具体实施方式下面将结合具体的实施方案,对本发明进行进一步的解释说明,但是并不用于限制本发明的保护范围。本实施方案将鲁棒性的自适应图结构学习算法应用在人脸识别任务中,提供了一种基于鲁棒性自适应图结构学习算法的人脸识别方法,该方法包括如下步骤:获取多张人脸图像数据x作为样本,其中,x=[x1,x2,...,xn]∈rd×n,该人脸图像数据x中包含n个样本,且每个样本xi的维度为d。对于一个矩阵b∈rd×n,该矩阵的l2,1范数定义为为了使学到的图结构不仅对噪声具有鲁棒性,同时也充分地考虑数据的局部结构信息,为此,本实施方案设计了总体目标函数,具体如下:其中,α和β为平衡参数,w为图权重矩阵。上述的总体目标函数共包含三大项,其中前两项是约束图结构对噪声的鲁棒性,最后一项是数据局部结构约束项。为了增强图学习算法对噪声的鲁棒性和图结构的全局判别性,本实施方案将基于l2,1范数的度量准则引入传统最小二乘回归问题中:其中,||·||2,1表示矩阵的l2,1范数,g和q分别定义为和ε表示一个非常小的非负常数,防止分母为零。在重构过程中,为了确保相似样本(如:xi和xj)具有相似的重构稀疏系数(如:wi和wj),从而实现流形结构的有效保持。该过程可通过最小化如下目标函数来实现:其中,||·||2表示为矩阵的l2范数,sij表示样本xi和xj的相似性权值,矩阵r中的元素定义为d为对角矩阵,其对角元素为矩阵l为拉普拉斯矩阵。算法优化,由于目标函数(1)中涉及l2,1范数,因此,目标函数关于图权重变量w是非凸的。所以本实施方案提出一种迭代优化求解的方法。具体过程如下:1)固定矩阵g,q和r,更新矩阵w,从公式(1)中移除不重要的项后,将其约简为:mintr(xtgx-2wtxtgx+wtxtgxw)+αtr(wtqw)+βtr(wtlw)(4)2)对公式(4)求导,并令导数等于零,获得如下等式:-2xtgx+2xtgxw+2αqw+2βlw=0(5)3)根据公式(5),w的更新公式如下:w=(xtgx+αq+βl)-1xtgx(6)4)固定w,更新g,q,和r基于上述的总体目标函数,计算获得上述多张人脸图像数据对应的权值矩阵w,具体过程为:1)输入:数据矩阵x=[x1,x2,...,xn],迭代次数t=30,以及两个平衡参数α和β。2)初始化:gt和qt为单位矩阵,w为随机矩阵,t=1。3)计算样本相似矩阵s;重复执行如下步骤:3.1)更新矩阵3.2)计算矩阵和拉普拉斯矩阵lt+1=dt+1-rt+1;3.3)更新矩阵wt+1=(xtgtx+αqt+βlt+1)-1xtgtx;3.4)更新矩阵3.5)更新矩阵3.6)另t=t+1,重复步骤3.13.1)-3.6),直至收敛,此时,对应的权值矩阵w为求得的权值矩阵w。基于获得的权值矩阵w对人脸图像数据分类:在获得w的基础上,本实施方案采用局部保持投影方法来进行降维,并利用最近邻分类器实现人脸图像分类。具体实施过程如下:假设给定近邻图权重矩阵w,如果原始高维样本xi和xj是近邻样本,则经过局部近邻保持投影降维后,获得的低维样本yi和yj也应该是近邻关系。对于一个给定的权重矩阵wij,局部保持投影矩阵的获得可以通过最小化如下目标函数实现:其中,l=d-w是一个拉普拉斯矩阵,d为对角矩阵,其对角元素为tr(s)表示矩阵s的迹。dii用于测量xi的局部样本密度,其中,dii的值越大,表明yi越重要。因此,得到约束ytdy=i。利用y=ptx,则上述局部保持投影可以被重新改写为:投影矩阵p可以由前d个最小非零特征值(λ0,λ1,...,λd-1)所对应的特征向量(p0,p1,...,pd-1)构成,该过程可以通过求解如下等式获得:xlxtp=λxdxtp(12)对于一个给定的高维数据x,利用上述获得的投影矩阵p,可以获得对应的低维数据表示y=ptx。在获得的低维表示基础上,通过分类算法,如:最近邻,可以实现样本的分类。下面结合具体的实施例对本发明进行更进一步的解释说明,但是并不用于限制本发明的保护范围。本实施例将提出的鲁棒性自适应图结构学习算法应用到人脸图像分类问题中。同时,在目前四个公开的人脸图像数据库中,包括:yale,ar,cmupie以及extendedyaleb,进一步验证提出方案的有效性。四个图像数据库的具体信息如表1所示。表1:数据库的详细信息数据库名图像大小样本数类别数每类样本数yale32×321651511ar32×32140010014cmupie32×3216326824extendedyaleb32×3224323864在yale人脸数据库中,共包含15名测试者的165张面部图像。对于每一个测试者,分别在不同的光照、面部表情以及是眼镜遮挡等情况下,拍摄11张不同的人脸图像。图1(a)中展示的是来自于yale人脸数据库中属于同一个人的不同人脸图像。在ar人脸数据库中,一共包含70个男人和56个女人的4000幅正面人脸图像,其中,每一个人都包含来自不同条件下拍摄的26张人脸图像,这些人脸图像中的变化主要体现在光照条件、面部表情和面部遮挡等三个方面。在我们的实验中,选取该数据库中的一个子集,即:选取一个包含50个男人和50个女人的人脸图像集,并将它作为我们实验中的数据集。图1(b)中给出了来自于ar人脸数据库中的部分人脸图像。在cmupie人脸数据库中,共包含68个测试者的41368张面部图像。每个测试者的人脸图像都是在不同的光照、不同的姿势和面部表情条件下拍摄的。图1(c)中给出了来自于cmupie人脸数据库中的部分人脸图像。在extendedyaleb人脸数据库中,共包含38个人,对于每个人,均在不同的光照、微小的头部姿态和面部表情变化条件下拍摄64张正面人脸图像。图1(d)中给出了来自于extendedyaleb人脸数据库中的部分人脸图像。为了验证上述实施方案提供的算法的有效性,我们将提出的算法与目前比较主流的图构建算法进行比较,包括:knn,lle,l1,lrr,lsr,lclsr和sgls。实验平台为intel(r)core(tm)i7-4790,双核gpu,频率为3.60hz,内存为8g,系统为64位windows10系统,全部实验都是基于matlab2016编程实现的。在实验中采用局部保持投影子空间学习方法来验证图学习方法的有效性,即采用不同的图作为w进行子空间学习,从而获得样本的低维表示;然后采用最近邻分类器对低维样本进行分类,并将分类准确率作为性能评价指标。对于每个数据库,我们从每个类中随机选取l幅图像作为训练样本,剩下的图像作为测试样本。yale数据库、ar数据库、cmupie数据库和extendedyale数据库的l值分别设置为{4,5,6}、{4,5,6}、{6,8,10}、{10,15,20}。为了更有效、公正地测试所提方法的性能,将随机样本选择重复20次,以平均分类准确率和标准差作为最终结果进行比较。不同方法在4个人脸数据库上的实验结果,如表2至表5所示。表2:不同方法在yale数据库上的平均分类准确率(%)和标准方差(%)方法l=4l=5l=6knn+lpp74.86±2.7077.56±2.3979.07±3.27lle+lpp77.71±4.2279.78±1.5580.13±3.23l1+lpp81.52±2.3084.79±2.1985.07±3.31lrr+lpp79.43±2.7082.33±2.5982.93±4.06lsr+lpp84.29±4.0786.00±2.5886.40±5.02lclsr+lpp82.57±3.8485.56±2.9285.73±4.71sgls+lpp83.33±4.1585.33±3.1885.20±3.74本实施方案+lpp84.95±4.1286.89±1.7286.53±4.14表3:不同方法在ar数据库上的平均分类准确率(%)和标准方差(%)表4:不同方法在cmupie数据库上的平均分类准确率(%)和标准方差(%)方法l=6l=8l=10knn+lpp85.37±0.8186.56±0.7086.63±0.99lle+lpp87.55±0.9288.05±0.9187.95±0.80l1+lpp88.95±0.8688.97±0.7388.09±1.13lrr+lpp90.08±0.3790.18±0.8790.11±0.99lsr+lpp89.90±0.5590.26±0.8190.21±0.89lclsr+lpp90.32±0.4490.68±0.7390.68±0.83sgls+lpp89.72±0.6890.08±0.5790.09±0.93本实施方案+lpp90.46±0.8192.72±0.6393.60±0.48表5:不同方法在extendedyaleb数据库上的平均分类准确率(%)和标准方差(%)方法l=10l=15l=20knn+lpp65.38±2.3369.62±1.1264.49±1.54lle+lpp73.93±1.7175.00±1.1872.05±1.17l1+lpp75.77±4.1075.97±1.8467.70±1.69lrr+lpp82.67±1.0285.97±0.7184.53±1.19lsr+lpp84.20±0.6686.19±0.8485.14±0.71lclsr+lpp85.59±0.7588.06±0.7587.62±0.62sgls+lpp84.83±0.7386.64±0.7387.09±0.94本实施方案+lpp86.14±0.6590.99±0.4892.68±0.54从表2至表5的实验结果中可得到如下结论:(1)基于knn和lle图的分类性能要低于其它构图方法,其主要原因是基于欧式距离的knn和lle图对数据中的噪声点、局外点以及参数取值非常敏感。(2)由于在lrr和lsr的构图过程中考虑了数据的全局结构信息,因此,它们的性能要优于l1图的方法。(3)由于lrr、lsr和sgls的图构建方法忽略了数据的局部结构信息,因此,它们分类性能要低于lclsr方法。(4)由于提出的算法充分地挖掘了数据的局部结构信息和全局结构信息,提升了图结构的有效性;同时,将基于l2,1范数的流形约束引入到图学习过程中,增强了图学习的鲁棒性。因此,我们的算法在性能上明显地优于全部对比算法。在提出的算法中包含两个参数α和β。在实验中,我们以网格搜索的方式变化参数α和β的取值,参数的取值范围均为{0.001,0.01,0.1,1,10,100}。图2显示了本算法在不同参数以及不同数据库上的分类准确率。通过观察图2可以得知,当参数α和β取值较小时,提出算法所获得的分类准确率相对较低。随着α和β值的不断增加,提出算法的性能会逐渐提升。当提出的算法取得最佳性能后,算法的性能将会随着α和β值的增加而逐渐下降。综上所述,当参数取中间值时,如:0.1~1区间时,提出算法可以取得最优的分类性能。与现有的图构建算法相比,本实施方案提出的鲁棒性自适应图结构学习算法可以充分地挖掘数据的局部结构和全局结构信息,提升图结构学习的有效性;同时,本发明将l2,1范数正则化准则引入到图学习过程中,进一步提升图学习模型的鲁棒性。因此,本发明可以通过挖掘数据的结构特性,学习一种高效且鲁棒的图,为后续的数据挖掘和机器学习任务提供核心的技术支撑。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本
技术领域
中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。应当理解的是,本发明并不局限于上面已经描述的内容,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1