基于广义非线性判别分析的人脸识别方法

文档序号：6615473阅读：203来源：国知局

专利名称：：基于广义非线性判别分析的人脸识别方法
技术领域：
：本发明涉及模式识别
技术领域：
，具体地说是一种基于广义非线性判别分析的人脸识别方法，可用于人脸识别、图像识别、目标识别等。技术背景人脸识别在商业应用和研究领域受到了广泛的关注。现有的人脸识别方法分为基于局部特征和基于全局特征的两类方法。基于局部特征的方法通常是从人脸图像中抽取出一组特征，比如说鼻子、眼睛等的位置，并以这些特征组成样本数据来进行识别。这类方法的优点是对光照、对比度等的变化鲁棒性较强。但是没有可靠的方法来抽取最优的特征，在抽取过程中很有可能抛弃了最有用的特征。相比较而言，基于全局特征的方法利用了整个图像的信息，所以不会丢失有用信息。通常来说，这类方法把一个分辨率为mxw'像素的人脸图像矩阵以行或列堆叠的方式，组成一个mxm'长的矢量，然后将其作为一个整体进行识别。由于此矢量维数较大，直接利用高维数据的话，会造成维数灾难问题。因此，如何有效地对高维的数据进行降维或者特征提取，成为基于全局特征方法的研究重点。经对现有技术的文献检索发现，美国的R.Duda等人在2003年《PattemRecognitkm》的第二版中阐述了Fisher判别方法，即线性判别分析方法。英国学者Fisher是在1936年提出的该方法。线性判别分析方法是想要找到一个投影子空间，而在此投影子空间中能够很好地分类给定的训练样本点。该方法被广泛地应用在人脸识别中。但是线性判别分析只能提供线性的判别信息。德国学者S.Mika等人在1999年提出了核Fisher判别分析方法。该方法能够提取数据的非线性的判别信息，是从线性判别到非线性的一种推广。但是核Fisher判别分析中用到的核函数必须满足正定条件，这就限制了所用非线性函数的类型，不具备普遍性，不能广泛的推广应用。
发明内容本发明的目的在于:为了克服已有技术的不足，提出了一种广义非线性判别分析的人脸识别方法，采用该方法既能够提取非线性的判别信息，又能够采用任意的连续非线性映射函数，还不局限于正定条件，就可以获得较高的人脸识别率。本发明的技术方案是将样本数据进行两次降维处理后，再用最近邻分类器进行识别。其具体实现步骤如下(1)、对人脸图像的学习过程①、首先对人脸训练图像进行处理，以获取原空间中的原始训练样本矩阵X;这里的处理是将每幅用于训练的人脸图像经行堆叠为一个w维向量x,ei"，即构成一个原始训练样本。则所有训练用的人脸图像可构成一个原始训练样本矩阵义4、…,x,]eiT'，/为样本的个数，X中的每一列代表了一个原始训练样本。②、然后采用经验映射函数甲对原始训练样本矩阵X进行映射，以获取经验映射空间中的映射训练样本矩阵G;这里的映射是指用经验映射函数甲把一个原始训练样本x,映射为W维空间中一个映射训练样本，即g,-甲(x,)eiw。映射训练样本矩阵表示为G^&,…g,]，G中的每一列代表了一个映射训练样本。该经验映射函数T是指任意的非线性连续函数，不局限于核技术中的正定核函数，也就是说可以不满足正定条件。③、对经验映射空间中的映射训练样本矩阵G进行线性判别分析，求得投影矩阵『。④、利用得到的投影矩阵r对经验映射空间中的映射训练样本矩阵G进行投影，以获取投影子空间中的投影训练样本矩阵Z，z=『W，其中上标r表示矩阵或向量的转置，Z中的每一列代表了一个投影训练样本。(2)、对人脸图像的识别过程①、对人脸测试图像进行处理，以获取原空间中的原始测试样本x。其过程是将每个人脸测试图像经行堆叠为一个w维向量，形成人脸图像的原始测试样本xo、把每个原始测试样本x用经验映射函数T映射到经验映射空间，获得映射测试样本g，g-甲(x)e,。③、利用在学习过程中得到的投影矩阵『，对映射测试样本g进行投影，获得投影子空间中的投影测试样本"z=『『g。④、在投影子空间中运用最近邻分类器对z进行分类。最近邻分类器是在投影子空间中所采用的分类器，它把某个测试样本归类到离它最近的训练样本所属的类别中。上述的基于广义非线性判别分析的人脸识别方法，所述的线性判别分析，是指在经验映射空间中运用的特征提取方法。如果样本个数大于类别数的话，能够再次降维。其判别过程如下假定训练集合中包含了C类样本点，都被经验映射函数映射到经验映射空间，第/类样本有/,个样本点，总的样本个数为/=S:/,.，线性判别分析就是求解下式的最优化问题<formula>formulaseeoriginaldocumentpage6</formula>其中<formula>formulaseeoriginaldocumentpage6</formula>分别表示类间和类内散度矩阵，m4^^表示全体样本的均值，m,+Z"^.&为第/类样本的均值，『为所求投影矩阵。上述的最优化问题，可以转化为对矩阵《&进行特征分解的问题。若&奇异，给其加上一个扰动，即&=&+///，//为一个小的常数，/为单位阵。投影矩阵『取前C-1个最大的特征值对应的列特征向量所组成的矩阵。虽然在经验映射空间中是线性的判别方法，但是对应于原空间就是非线性的判别分析方法。通过以上步骤就完成对人脸图像的识别。本发明与现有技术相比具有如下优点1、线性判别分析只能提取线性信息，而非线性特征能够更好地描述数据的本质结构。本发明除了能提取线性的特征信息外，也能够提取非线性的特征信息。2、核Fisher判别分析方法，只能采用正定核函数作为映射函数。本发明除了能够采用正定核作为经验映射函数以外，还可以采用其它的连续非线性函数。当采用正定核函数时，本发明退化为核Fisher判别分析，即两者得到的投影矩阵相同，所提取的特征也是相同的。在此意义下，本发明是一种广义非线性方法，包含了核Fisher判别分析。实验表明，本发明以每类5个训练样本为例，在ORL人脸数据库上的识别率为97.25%，在下采样后的数据上的识别率为94.65%，高于线性判别分析方法。图1是本发明实现步骤的流程原理框图具体实施方式参考图1，它是本发明实现步骤的流程原理框图，结合该图对本发明的实施过程作详细地说明本发明的实施例是在以本发明技术方案为前提下进行实施的，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。实施例采用了一个公用的人脸数据库，即ORL数据库。ORL数据库中包含40个人的人脸，每个人的人脸图像有10张，每张图像在姿态、表情等方面都有所变化。原始图像大小为112x92。(1)、对人脸图像的学习过程①、首先对人脸训练图像进行处理，以获取原空间中的原始训练样本矩阵X;把人脸训练图像经行堆叠为10304维的向量，并将其值归一化为0到1之间。对每个人，随机选择5个训练样本进行训练，其余5个作为测试样本，生成一组训练-测试样本集。所有的训练样本组成一个10304X200的训练样本矩阵X，即训练样本个数200，维数为10304;②、然后采用经验映射函数甲对原始训练样本矩阵Z进行映射，以获取经验映射空间中的映射训练样本矩阵G;该经验映射函数是指任意的非线性连续函数，不局限于核技术中的正定核函数，即经验映射函数可以不满足正定条件。在实验中，我们采用高斯核函数<、\;)=呻(-+,-x」l"作为经验硤射函数，其中y为可调节核参数。在实验中y在一定范围内，如{2-2°,2-",…，2-,中取值，<table>tableseeoriginaldocumentpage7</column></row><table>采用DDR2标准的具有数据处理能力的DRAM存储器装置接口协议命令真值表如表2所示。存储器装置接口负责接收并解析如表2所示的各种命令，由状态机(StateMachine)根据当前的命令是针对内部DRAM存储器、处理单元还是DMA控制器，控制存储器接口进入内部存储器操作模式、处理单元操作模式或DMA控制器操作模式，当前操作模式一直保持至接收到下一改变当前操作模式的命令。存储器装置接口的Data、Ctrl、地址信号与内部DRAM存储器接口直接相连，在内部存储器操作模式状态下，由当前命令确定CS0CS3的值，以选择一个或多个内部存储器进行操作。由于处理单元接口和DMA控制器接口采用SRAM接口，所以在处理单元才喿作模式和DMA控制器操作模式下，通过时序转换(TimingTransfer)模块实现DRAM到SRAM的时序转换。表2DDR2标准协议命令真值表<table>tableseeoriginaldocumentpage7</column></row><table>③、禾拥在学习过程中得到的投影矩阵L对映射测试样本g进行投影，获得投影子空间中的投影测试样本z，z=『rg;、在投影子空间中运用最近邻分类器对z进行分类。最近邻分类器是在投影子空间中所采用的分类器。在投影子空间中，在训练样本集Z中寻找测试样本z的最近邻，并把z归类为其最近邻的类别。对随机生成的30组训练-测试样本集重复进行以上学习和识别过程，并以30次运行的平均识别率作为实验结果。我们用本发明和核Fisher判别分析方法，对每类5个训练样本的情况，在7=2-2°时识别率均为97.25%。由于线性判别分析无法对原始数据直接操作，我们对每幅图像下4采样，大小变28x23。把人脸图像经行堆叠为644维的长向量，并将其值归一化为0到1之间。形成原空间中的样本400个，每个维数为644，在此基础上重复上述的学习和识别过程30次，给出平均识别结果。本发明对于ORL数据库每类5个训练样本的情况，在^=2-17时识别率达到96.75%，核Fisher判别分析的结果与之相同，均都高于线性判别分析的识别率94.65%。权利要求1、一种基于广义非线性判别分析的人脸识别方法，具体实现步骤如下(1)、对人脸图像的学习过程①、首先对人脸训练图像进行处理，以获取原空间中的原始训练样本矩阵X；这里的处理是将每幅用于训练的人脸图像经行堆叠为一个n维向量xi∈Rn，即构成一个原始训练样本；则所有训练用的人脸图像可构成一个原始训练样本矩阵X＝[x1，…，xl]∈Rn×l，l为样本的个数，X中的每一列代表了一个原始训练样本；②、然后采用经验映射函数ψ对原始训练样本矩阵X进行映射，以获取经验映射空间中的映射训练样本矩阵G；这里的映射是指用经验映射函数ψ把一个原始训练样本xi映射为N维空间中一个映射训练样本，即gi＝ψ(xi)∈RN；映射训练样本矩阵表示为G＝[g1，…gl]，G中的每一列代表了一个映射训练样本；该经验映射函数ψ是指任意的非线性连续函数，不局限于核技术中的正定核函数，也就是说可以不满足正定条件；③、对经验映射空间中的映射训练样本矩阵G进行线性判别分析，求得投影矩阵W；④、利用得到的投影矩阵W对经验映射空间中的映射训练样本矩阵G进行投影，以获取投影子空间中的投影训练样本矩阵Z，Z＝WTG，其中上标T表示矩阵或向量的转置，Z中的每一列代表了一个投影训练样本；(2)、对人脸图像的识别过程①、对人脸测试图像进行处理，以获取原空间中的原始测试样本x；其过程是将每个人脸测试图像经行堆叠为一个n维向量，形成人脸图像的原始测试样本x；②、把每个原始测试样本x用经验映射函数ψ映射到经验映射空间，获得映射测试样本g，g＝ψ(x)∈RN；③、利用在学习过程中得到的投影矩阵W，对映射测试样本g进行投影，获得投影子空间中的投影测试样本z，z＝WTg；④、在投影子空间中运用最近邻分类器对z进行分类；最近邻分类器是在投影子空间中所采用的分类器，它把某个测试样本归类到离它最近的训练样本所属的类别中。2、根据权利要求1所述的基于广义非线性判别分析的人脸识别方法，在学习过程中步骤③所述的线性判别分析，是指在经验映射空间中运用的特征提取方法；如果样本个数大于类别数的话，能够再次降维；其判别过程如下假定训练集合中包含了C类样本点，都被经验映射函数映射到经验映射空间，第/类样本有/,个样本点，总的样本个数为"i;;y,，线性判别分析就是求解下式的最优化问题<formula>formulaseeoriginaldocumentpage3</formula>其中S,I^/(m,-m)(m,-mf和^^Z:Z^(grin,)"-m了分别表示类间和类内散度矩阵，m4^^表示全体样本的均值，in,.—":^为第/类样本的均值，『为所求投影矩阵；上述的最优化问题，可以转化为对矩阵^^进行特征分解的问题；若&奇异，给其加上一个扰动，即&=&+///，//为一个小的常数，/为单位阵；投影矩阵『取前C-1个最大的特征值对应的列特征向量所组成的矩阵；虽然在经验映射空间中是线性的判别方法，但是对应于原空间就是非线性的判别分析方法。全文摘要本发明公开了一种基于广义非线性判别分析的人脸识别方法，它涉及模式识别
技术领域：
，其目的在于采用该方法既能提取非线性的判别信息，又能采用任意的连续非线性映射函数，还不局限于正定条件。该方法的实现步骤为1)学习过程采用经验映射函数把原空间的训练样本映射到经验映射空间，在该空间中采用线性判别方法，以求得可分信息最大的投影矩阵；2)识别过程对每个测试样本用经验映射函数映射到经验映射空间，然后再用训练得到的投影矩阵对映射后的样本进行投影，最后在低维的投影子空间中运用最近邻分类器进行识别。在采用正定核函数作为经验映射函数时，核Fisher判别方法等价于本发明的方法。本发明可用于人脸识别、图像识别、目标识别等。文档编号G06K9/00GK101216878SQ200710300730公开日2008年7月9日申请日期2007年12月28日优先权日2007年12月28日发明者周伟达,华张,莉张,焦李成申请人:西安电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张莉;周伟达;焦李成;张华
技术所有人：西安电子科技大学
我是此专利的发明人

上一篇：基于Fisher支持向量机的人脸识别方法
上一篇：文档处理装置及文档处理程序的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。