基于流形学习的人脸识别方法

文档序号：6441593阅读：926来源：国知局

专利名称：基于流形学习的人脸识别方法
技术领域：
本发明涉及的是一种图像处理技术领域的方法，具体是一种基于流形学习的人脸识别方法。
背景技术：
随着信息时代的到来，数据集较以往有了显著的变化，其主要特点可以归纳为高数据量、高维数、高数据增长率、非结构化以及不能被人的感知单独处理，一方面可以获取的知识量更大了；另一方面仍面临着艰巨的问题，即不能从数据中合理、有效地找到所需要的知识。很多问题的表示方法，使得信息十分稀疏，如何将信息稠密化是一个困难的问题。
经对现有技术的文献检索发现，M.Turk等人在《Journal of CognitiveNeuroscience》Vol.3，No.1，1991，71-86(认知神经科学，第3卷，第1期，1991年，71-86页)上，阐述了主分量分析方法，并将其应用在人脸数据的降维上。主分量分析通过最大化总的离散度矩阵来寻找高维数据的低维表达。其在重建的意义上是最优的。近年来的研究发现，人脸图像的变化可以由一些连续的变量来参数化，这些变量可以为姿势，光照，和表情，也就是说，人脸图像属于本质上低维的子流形。传统的降维方法比如主分量分析方法等不能够发现高维人脸数据的本质结构。主分量分析处理的是数据的全局结构，没有很好的利用数据的局部几何信息。

发明内容
本发明的目的在于克服现有技术中的不足，提出一种基于流形学习的人脸识别方法，使其采用局部保存的降维的方法识别人脸，以实现更好的人脸流形学习，提高识别率。
本发明是通过以下技术方案实现的，本发明从数据的局部结构出发，提出保存人脸数据的局部类别关系；然后利用排列技术，将每个点的局部最优转化为全局最优；通过对排列矩阵与原始训练样本及其转置的乘积进行特征分解，得到数据由高维到低维的投影矩阵；通过该投影矩阵，将待识别的人脸图像投影到低维空间；最后，在低维空间用最近邻法分类完成人脸识别。
本发明具体步骤如下(1)将原始的人脸图像行堆叠为一个M维长向量，从而所有的数据构成一个矩阵X，作为训练样本。
(2)对于每一个人脸数据点xi，寻找到它的k个同类点，组成一个局部。对于该数据点xi和它的k个同类点，使它们在低维空间的点对距离最小，并得到相应的局部最优化的表达。
(3)对于所有的人脸数据点，都有步骤(2)所述的优化，从而将每一个局部的优化用排列技术叠加起来，得到排列矩阵L，从而得到全局意义上的优化。
(4)将原始数据集X乘以排列矩阵L，再乘以原始数据集的转置XT，从而得到XLXT。这实际上实现了优化矩阵的构建。对XLXT进行特征分解，假设所求低维空间为d维，将求得的特征值由小到大排列取前d个，其所对应的d个特征向量则组成M×d投影矩阵A。
(5)对于每一个待识别的人脸数据xi，用投影矩阵A的转置AT乘以xi，便得到其低维表达yi＝ATxt，在低维空间里，用最近邻方法对人脸数据进行分类则完成了人脸识别。
所述的对于该数据点xi和它的k个同类点，使它们在低维空间的点对距离最小，是指设xi表示为xi0，xi1，L，xik表示xi的同类点，设Yi=[yi0,yi1,L,yik]]]>为它们在低维空间所对应的点。为了得到忠实的映射，本发明期望近邻的点仍然保持近邻，也就是说，点yi0仍然靠近于yi1，L，yik。于是有这样的优化minΣj=1k||yi0-yij||2,]]>该公式的含义是最小化邻域的点对距离。为了给出更清晰的表达，将这种局部意义上的优化转化成这种形式min tr(YiLiYiT)，其中Li被为局部的排列矩阵，tr(g)表示矩阵的迹。这样，就完成了局部最优化的表达。
所述的排列技术，是指一种由局部优化叠加为全局优化的技术，本发明用一个迭代函数来实现L(Ii，Ii)←L(Ii，Ii)+Li，i＝1，L，N。式中的Ii是一个索引函数，它指示了每一个数据点xi和它的同类点的标号，Li是局部优化的表达，N表示有N个数据点。这样就可以的到最终的全局排列矩阵L，它代表了全局意义上的优化。
所述的对XLXT进行特征分解，是指最终的优化问题转化为对一个特征值问题的求解XLXTf＝λf，上式中，f代表特征向量，λ代表特征值。将特征值由小到大排列，取前d个，投影矩阵A由其所对应的特征向量组成。
所述的最近邻方法，是指把某一个待识别的人脸图像归类到离它最近的训练样本所属的类中。
与现有技术相比，本发明能够探测嵌入在高维人脸数据中的低维流形结构，由此而能够得到比较高的人脸识别率。实验证明，本发明在ORL数据库上进行人脸识别，识别率对于5个训练样本的情况能达到97.42％，明显高于主分量分析方法得到的识别率88.15％。
具体实施例方式
下面对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。
实施例采用了一个公用的人脸数据库ORL数据库。ORL数据库包含40个人，每个人10张图像。每张图的大小为40×40。首先将人脸图像将其行堆叠为1600维长向量，然后所有的数据组成一个1600×400矩阵X＝[x1，L，x400]。对于每一人，随机选择5个样本进行训练，余下的用于识别。对于每一个给定的训练样本数，产生20组随机的训练——识别样本集，在此基础上计算出平均识别率。本发明首先找到每一个数据点的4个同类点，记为Xi=[xi0,xi1,L,xi4]]]>，并用Ii＝{i0，i1，L，i4}作为对它们的索引的记录。然后，对于每一个点和它的邻域点，有这样的优化minΣj=14||yi0-yij||2]]>，它的意图是让这些点在低维空间仍然保持近邻关系。随后，局部优化转化为这种形式min tr(YiLiYiT)，这样，局部的排列矩阵，就可以提取出来。按照这种方法，本发明可以得到200个局部优化，相应的有200个局部排列矩阵。然后，本发明根据排列技术，将这200个局部优化转化为全局意义上的最优，依据这样的迭代公式L(Ii，Ii)←L(Ii，Ii)+Li，i＝1，L，200，其中，Ii即为前面所提到的每一个数据点和它近邻点的索引，注意，本专利将L的初始值设为0。这样，就完成了对排列矩阵的构建。最终，优化问题转化为对一个特征值问题的求解XLXTf＝λf，其中，L为求得的排列矩阵。上式的含义实际上就是对XLXT进行特征分解。设α1，α2Λ，αd为求得的特征向量，其对应于特征值λ1＜λ2＜Λ＜λd。那么，投影矩阵A为A＝(α1，α2Λ，αd)。接下来，本发明运用投影矩阵A将待识别的人脸图像投影到低维空间，然后与低维的训练人脸图像比对，将待识别的人脸图像归类到离它最近的训练样本所属的类中，即用最近邻法分类。至此，本发明完成了人脸识别的全过程。
本发明对于ORL数据库5个训练样本的情况，识别率能达到97.42％，明显高于主分量分析方法得到的识别率88.15％。
权利要求
1.一种基于流形学习的人脸识别方法，其特征在于，具体步骤如下(1)将原始的人脸图像行堆叠为一个M维长向量，从而所有的数据构成一个矩阵X，作为训练样本；(2)对于每一个人脸数据点xi，寻找到它的k个同类点，组成一个局部，对于该数据点xi和它的k个同类点，使它们在低维空间的点对距离最小，并得到相应的局部最优化的表达；(3)对于所有的人脸数据点，都经步骤(2)所述的优化，从而将每一个局部的优化用排列技术叠加起来，得到排列矩阵L，从而得到全局意义上的优化；(4)将原始数据集X乘以排列矩阵L，再乘以原始数据集的转置XT，从而得到XLXT，实现了优化矩阵的构建；(5)对XLXT进行特征分解，假设所求低维空间为d维，将求得的特征值由小到大排列取前d个，其所对应的d个特征向量则组成M×d投影矩阵A；(6)对于每一个待识别的人脸数据xt，用投影矩阵A的转置AT乘以xt，便得到其低维表达yt＝ATxt，在低维空间里，用最近邻方法对人脸数据进行分类则完成了人脸识别。
2.根据权利要求1所的基于流形学习的人脸识别方法，其特征是，所述的对于该数据点xi和它的k个同类点，使它们在低维空间的点对距离最小，是指设xi表示为xi0，xi1，L，xik表示xi的同类点，设Yi=[yi0,yi1,L,yik]]]>为它们在低维空间所对应的点，对其进行优化该公式的含义是最小化邻域的点对距离。
3.根据权利要求1所述的基于流形学习的人脸识别方法，其特征是，所述局部最优化的表达，是指将转化成min tr(YiLiYiT)，其中Li为局部的排列矩阵，tr(g)表示矩阵的迹。
4.根据权利要求1所述的基于流形学习的人脸识别方法，其特征是，所述的排列技术，是指一种由局部优化叠加为全局优化的技术，用一个迭代函数来实现L(Ii，Ii)←L(Ii，Ii)+Li，i＝1，L，N，式中的Ii是一个索引函数，它指示了每一个数据点xi和它的同类点的标号，Li是局部优化的表达，N表示有N个数据点，这样就得到最终的全局排列矩阵L，它代表了全局意义上的优化。
5.根据权利要求1所述的基于流形学习的人脸识别方法，其特征是，所述的对XLXT进行特征分解，是指最终的优化问题转化为对一个特征值问题的求解XLXTf＝λf，上式中，f代表特征向量，λ代表特征值，将特征值由小到大排列，取前d个，投影矩阵A由其所对应的特征向量组成。
全文摘要
本发明涉及一种基于流形学习的人脸识别方法，从数据的局部结构出发，提出保存人脸数据的局部类别关系；然后利用排列技术，将每个点的局部最优转化为全局最优；通过对排列矩阵与原始训练样本及其转置的乘积进行特征分解，得到数据由高维到低维的投影矩阵；通过该投影矩阵，将待识别的人脸图像投影到低维空间；最后，在低维空间用最近邻法分类。本发明能够探测嵌入在高维人脸数据中的低维流形结构，由此而能够得到比较高的人脸识别率。实验证明，用本发明所提出的方法进行人脸识别，其识别率明显高于主分量分析方法得到的识别率。
文档编号G06K9/00GK101079105SQ20071004197
公开日2007年11月28日申请日期2007年6月14日优先权日2007年6月14日
发明者张田昊, 杨杰, 杜春华, 袁泉, 吴证申请人:上海交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张田昊;杨杰;杜春华;袁泉;吴证
技术所有人：上海交通大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。