一种基于多核关联集成降维的人脸识别方法与流程

文档序号:16147228发布日期:2018-12-05 16:41阅读:317来源:国知局
一种基于多核关联集成降维的人脸识别方法与流程

本发明属于计算机视觉领域,尤其涉及一种基于多核关联集成降维的人脸识别方法。

背景技术

随着信息技术的飞速发展,人们希望对某个人身份的确认更加高效的自动进行。每个人所拥有的特征信息大不相同,具有很大的差异性,因此,可以用来进行身份的验证。人脸识别技术已经成为一个热门的研究技术,它的研究和应用都愈加重要。随着研究的深入,也受到了社会更加广泛的关注。近年来,作为生物特征识别中的一个重要组成部分,它在视频监控、人机交互、多媒体管理等领域得到了广泛的应用,如重要场合的出入安检、银行的实时监控、边境的检查、犯罪嫌疑人的照片对比、乃至手机的脸部识别解锁生活的方方面面。

之所以在人脸识别中引入降维技术,是由人脸图像集的特点决定的。在实际应用中,我们所采集到的人脸图像样本的维数往往很高,而样本个数却远远小于图像维数,这就造成了人脸图像在高维空间中的分布比较稀疏,不利于分类和识别,此外,对高维数据进行分析所需要的计算代价也是巨大的。为了得到人脸图像的内在低维特征并提高计算效率,就必须利用数据降维技术对高维人脸图像进行处理。因此,利用降维技术对高维数据进行处理就显得尤为重要。数据降维是指将高维空间中的数据降低到低维的空间中,以消除原有的数据冗余性,提高数据的后续处理能力。

数据降维技术的研究是一个经典问题。在20世纪初,主成分分析等方法就已经被提出。这些算法具有实现简单、容易计算、解释性强等特点。在非线性降维方法中,比较具有代表性的是基于核的降维学习方法。基于核的降维方法利用核方法将原始数据隐式地映射到更高维的特征空间,并期望在原始空间中呈非线性结构的数据集可以在核空间利用线性方法进行处理。已有的线性降维算法大多都可以被扩展为对应的基于核的非线性方法,如:核主成分分析、核线性判别分析、核独立成分分析等。

此外,核典型关联分析也是降维方法中不可忽略的一种高效降维方法。虽然基于核的方法在处理非线性数据时较之线性方法具有一定的优势,但也存在一定的局限性。由于在算法中引入了核方法,如何选择合适的核函数并对函数中的参数进行适当的设置,就成为了一个难点。因此,在实际应用中,人们经常需要根据某些经验和先验知识对核函数的类型进行选择。



技术实现要素:

本发明根据现有技术的不足与缺陷,提出了一种基于多核关联集成降维的人脸识别方法,目的在于解决了人脸识别原始数据维度高,处理难的问题,以及基于核的典型关联分析降维方法中需要选择核函数和函数中参数的问题,从而获得更高的人脸识别率。

一种基于多核关联集成降维的人脸识别方法,包括以下步骤:

对人脸图片数据进行预处理,获得训练样本矩阵,对数据样本矩阵用多核关联集成进行数据降维处理,提取特征值和特征向量,根据每个和核模型的权重加权匹配分类器,对降维后的数据进行分类;

进一步,所述对人脸图片数据进行预处理过程为:读取训练集上的所有图片,根据图片像素值生成训练样本矩阵x=[x1,x2,...,xi]∈rn×m和y=[y1,y2,…,yi]∈rn×p,其中,i=1,2,...,n,n为样本数,m为矩阵x的维度,p为矩阵y的维度;

进一步,所述对训练样本矩阵用多核关联集成进行数据降维处理,提取特征值和特征向量,包括以下步骤:

步骤1,读取训练样本矩阵x=[x1,x2,…,xi]∈rn×m和y=[y1,y2,...,yi]∈rn×p

步骤2,在核函数库选择多种合适的核函数;

步骤3,构造多核关联集成模型,提取矩阵的特征值和特征向量,并标准化特征向量;

步骤4,根据特征值和特征向量确定每个核模型的权重,从而加权匹配分类器;

进一步,所述核函数库包括有线性核函数、多项式核函数、径向基核函数、高斯核函数和sigmoid核函数等;

进一步,构造多核关联集成模型,提取矩阵的特征值和特征向量的方法如下:

步骤3.1,构造多核关联集成模型如下:

其中,wi为模型权重,特征向量αi=[α1,α2,...αn]t,特征向量βi=[β1,β2,...βn]t是内核gram矩阵的基本元素,g为核函数个数。

步骤3.2将多核关联集成模型根据拉格朗日函数的构造,添加扰动来确保矩阵可逆,并且正则化目标函数,给定优化问题有一个相对的对偶公式,得到一个推导如下:

其中,li为整体模型的损失函数,λ为特征值,γ为平滑基础框架的参数。

步骤3.3,简化模型,求解得到出特征值与特征向量。

其中,i为构造的n×n的单位矩阵。

进一步,将步骤3.3得到特征值对应的特征向量组成新的矩阵,然后将训练样本x、y投影在新的矩阵上,得到该训练集x、y降维后的矩阵;

进一步,根据特征值和特征向量确定每个核模型的权重的方法:wi=[w1,w2...wg]是多个基本模型的权重向量。特征值λ2是α和β之间的关联性的度量值。本发明认为wi代表多个基本模型权重的控制参数。考虑多核关联集成模型的偏导数总和为1,可以进一步求解出权重:

其中,i=1,2,...,g,r为多个基本模型的权重的控制参数。

本发明的有益效果:

(1)基于训练样本多属性的高维特点,有效地度量数据之间的差异性;

(2)在高维的特征空间中,实现了多属性非线性数据去除冗余信息相关,利于分类模型的泛化;

(3)通过多核的集成,解决了内核和参数选择的问题,在一组集合内核cca池中自动寻找适当类型的内核函数及其参数;

(4)在集成框架中使用多个内核关联模型以使再生核心希尔伯特空间(rkhs)中的总体最小平方损失最小化。具有更好的数据相关性的两个数据变量之间的个体内核关联模型被自动分配更多的权重,这使降维的分类性能有较大提升。

本发明的数据降维方法解决了数据维度过高引起的维度诅咒的问题以及后续处理能力下降的问题。同时,发明中基于多核关联集成模型的构造,解决了内核及其参数选取较复杂的问题,为图像后期的匹配处理提供了较大的帮助。缩短了匹配时间、降低了匹配难度,使得人脸识别过程会更加准确地实现,获得更高识别准确率。

附图说明

图1是基于数据降维方法的人脸识别方法的流程图;

图2是基于多核关联集成的降维方法的流程图;

图3是人脸数据集上识别方法的准确性。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。

如图1所示,一种基于多核关联集成降维的人脸识别方法,包括以下步骤:

对人脸图片数据进行预处理,读取训练集上的所有图片,根据图片像素值生成样本矩阵x,y。对于高维特征空间r,设其中有两个样本集x=[x1,x2,...,xi]∈rn×m和y=[y1,y2,...,yi]∈rn×p,其中,i=1,2,...,n,n为样本数,m为矩阵x的维度,p为矩阵y的维度;。

如图2,对数据样本矩阵用多核关联集成进行数据降维处理,提取特征值和特征向量;包括以下步骤:

步骤1,读取训练样本矩阵x=[x1,x2,...,xi]∈rn×m和y=[y1,y2,...,yi]∈rn×p

步骤2,在核函数库选择多种合适的核函数,其中核函数库有线性核函数、多项式核函数、径向基核函数、高斯核函数和sigmoid核函数等。多项式核函数:k1(x,y)=(axty+b)c;径向基核函数:高斯核函数:sigmod核函数:k4(x,y)=tanh(axty+c)。其中,a,b,c,μ,σ为参数,事先给定核函数参数以及主元个数选定个数的初值。

步骤3,构造多核关联集成模型,提取矩阵的特征值和特征向量,并标准化特征向量;

3.1,构造多核关联集成模型如下:

其中,wi为模型权重,αi、βi为特征向量是由核函数引起的x和y的投影操作,特征向量αi=[α1,α2,...αn]t,特征向量βi=[β1,β2,...βn]t是内核gram矩阵的基本元素。g为核函数个数,本事实例中g∈{10,20,50,100,150};

步骤3.2,将多核关联集成模型根据拉格朗日函数的构造,添加一个小扰动来确保矩阵可逆,并且正则化目标函数,给定优化问题有一个相对的对偶公式,得到一个推导如下:

其中,λ为特征值,γ为平滑基础框架的参数,γ设置为0.1。

步骤3.3,简化模型,令从而得到最终模型转化为特征值与特征向量表达形式,求出特征值与特征向量:

其中,

将步骤3.3得到特征值对应的特征向量组成新的矩阵,然后将训练样本x、y投影在新的矩阵上,得到该训练集x、y降维后的矩阵;

特征值λ是α和β之间的关联性的度量值,本发明认为权重向量wi代表多个基本模型权重的控制参数,设定r>1,r是多个基本模型的权重的控制参数,设置为2,并选择多个基础模型,考虑整体优化模型的偏导数总和为1,可以进一步推导出权重:

最后根据获取的特征矩阵对数据进行分类;使用分类器对训练集x、y降维后的矩阵进行人脸识别。在本实施例中本发明运用k最近邻分类算法,k取值为4。

在人脸识别中,数据集是已有的人脸样本。将人脸库的图像分为训练集和测试集两部分,然后将训练集的图片用多核关联集成的方法进行降维,得到投影矩阵,接着将这些训练集图片投影在这个矩阵上,得到新的矩阵样本,再对这个矩阵样本用knn分类器分类,这样就可以用测试集上的图片进行识别分类。人脸图片经过特征提取以后,可以很大程度上降低特征向量的维度,保留了那些差异最大的特征,代表不同人的相关特征,作为区分的依据。

orl数据集共有40个不同年龄、不同性别和不同种族的对象。每个人10幅图像共计400幅灰度图像组成,图像背景为黑色,人脸部分表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,共有4096维,400个实例。extendyaleb人脸数据库,一共38个人,每人64张照片。根据人脸与摄像机的方向角将每人的64张照片分为5个子集。共有1024维和2414个实例。

对于每个数据集,我们比较多核关联集成与其他方法的人脸识别性能,如cca(典型关联分析),kcca(核典型关联分析),kpca(核主成分分析),kpls(核最小二乘法),akcca(交替核典型关联分析)和lmkdcca(局域化多核辨别典型关联分析)。下面提供几组实验数据集,更加直观的说明本发明实验效果以及验证本发明提出的方法的有效性。以下是针对不用数据集的测试结果。

图3描述的是在人脸数据集中的实验结果。在orl数据集上,基于线性关联分析的识别准确率为94.20%,而基于多核关联集成(kcce)的识别准确率为95.63%,高于cca1.43%,高于kcca为0.98%,高于kpca为0.8%,高于kpls为0.88%,高于akcca为0.58%,高于lmkdcca0.37%。在extendedyaleb数据集上,kcce的准确率为95.97%,cca为91.05%,kcca为93.18%,kpca为93.63%,kpls为92.81%,akcca为94.77%,lmkdcca为95.34%,由此可见,基于多核关联集成人脸识别准确率明显高于其余测试方法。

从上述实验效果来看,本发明提出的基于多核关联集成的实验方案比线性关联和单核的线性关联实验结果有所提升。通过多组数据的实验对比,本发明规避了实验有可能诱发偶然性的同时,证明了这种多核集成的高效决策模型的有效性。

以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1