基于Fisher支持向量机的人脸识别方法

文档序号：6615474阅读：263来源：国知局

专利名称：基于Fisher支持向量机的人脸识别方法
技术领域：
本发明涉及模式识别技术领域，具体地说是一种基于Fisher支持向量机的人脸识别方法。本发明可用于机器学习和模式识别范畴内，除了人脸图像识别以外，还可用于语音识别及数据挖掘等领域。

背景技术：
信息时代数据最大的特点是维数高。高维数据在学习中经常会遇到维数灾难的问题。在基于人脸全局特征的识别方法中，把一个分辨率为m×m′像素的人脸图像矩阵以行或列堆叠的方式，组成一个m×m′长的矢量，然后将其作为一个整体进行识别。在此意义下，人脸图像也形成一种高维矢量数据，不可避免地成为一种小样本的学习问题，也会出现维数灾难问题。
经对现有技术的文献检索发现，美国的R.Duda等人在2003年《PatternRecognition》的第二版中阐述了Fisher判别方法，即线性判别分析方法。英国学者Fisher是在1936年提出的该方法。由于线性Fisher判别分析方法能够很好地找到可分性好的投影方向，该方法被广泛地应用在人脸识别中。但是线性Fisher判别分析只能提供线性的判别信息。而且如果人脸图像的维数过高的话，在应用Fisher线性判别分析前必须对图像下采样。而下采样或多或少的都有可能损失一些有用的信息。德国的S.Mika等人在1999年提出了核Fisher判别分析方法。该方法能够提取数据的非线性的判别信息，是从线性判别到非线性的一种推广。Fisher判别准则是基于距离测度定义的，因而导致其对于非高斯类、具有高阶矩的分布数据不能很好地进行推广应用，而且在小样本情况下，均值和散度矩阵的估计误差也会影响算法的性能。在1995年，俄罗斯学者Vapnik等人在统计学习理论的基础上提出了支持向量机算法。该方法给机器学习领域带来了新的活力。支持向量机方法，在小样本的数据集上能够得到很好的性能，而且避免了维数灾难问题的发生。根据统计学习理论和支持向量机的性能上界，学习机要获得好的性能，就必须在最大化分类间隔的同时最小化样本的分布半径。但是支持向量机在给定核函数及其参数情况下，不再优化样本的分布半径。因此支持向量机并没有实现真正的最优性能。

发明内容
本发明的目的在于为了克服已有技术的不足，提出了一种基于Fisher支持向量机的人脸识别方法，把Fisher正则引入到支持向量机中用于人脸的识别问题上，以获得对小样本的高维数据有较好的识别率，进而对人脸有较好的识别。
本发明的技术方案是采用Fisher支持向量机方法对人脸图像进行识别，其具体实现步骤如下 (1)、对人脸图像的学习过程 ①、首先对人脸训练图像进行处理，以获取两类有标识训练样本集{(xi，yi)| xi∈Rn，yi∈{-1，+1}，i＝1，…，l}，其中xi表示某幅图像的特征，也就是n维实数空间中的一个训练样本，yi是其标识，表示其类别不是+1类就是-1类，l为样本的个数；该处理过程是将人脸图像直接经行堆叠为一个n维特征，或者采用某种特征提取的方法提取n个特征。
②、选择正则因子λ1和λ2，选取正定核函数及其参数，并计算核矩阵Kij＝k(xi，xj)。该正则因子λ1控制了假设空间的复杂度，λ2控制了Fisher正则的影响。而正定核函数是指满足正定条件的核函数，该核函数可以表示为k(x，x′)＝(Φ(x))TΦ(x′)，其中x，x′表示两个样本，Φ表示一种隐含的不知其表达式的非线性映射函数，上标T表示矩阵或向量的转置。这种非线性映射能够确定了一个再生核Hilbert空间。令映射后训练样本矩阵为ψ＝[Φ(x1)，…，Φ(xl)]，并令核矩阵Kij＝k(xi，xj)，则ψTψ＝K。再生核Hilbert空间是一个高维的特征空间。在该空间中，有表示定理表明假设函数可以表达为其中α和b为假设函数的待求系数。权值向量可以表达为 ③、求解Fisher支持向量机的对偶二次规划问题，求得其最优解β； ④、根据得到的最优解β来计算假设函数的待求系数α和b，其计算公式如下 α＝(2λ1Il+2λ2IlMK)-1Yβ 其中Il是大小为l×l的单位阵，M＝Il-N，

Y＝diag(y1，…，yl)为一对角阵，对角上的元素为样本的标识。
(2)、对人脸图像的识别过程 ①、对人脸测试图像进行处理，获取无标识测试样本x；其处理步骤与学习过程中的步骤①完全相同； ②、利用学习过程中得到的假设函数对测试样本x进行判决。其判决方式是对假设函数取符号函数，即如果则判决为+1类，否则为-1类。
上述的基于Fisher支持向量机的人脸识别方法，所述的Fisher支持向量机是本发明提出的一种新的模式识别技术。其具体实现过程如下已知训练样本集{(xi，yi)|xi∈Rn，yi∈{-1，+1}，i＝1，…，l}和核函数k(x，x′)＝(Φ(x))TΦ(x′)。Fisher支持向量机的学习过程归结为求解下面的原二次规划问题 subject to yi(wTΦ(xi)+b)≥1-ξi ξi≥0，i＝1，…，l 其中类内散度矩阵为是wi类的中心，li为wi类的样本个数，ξi是松弛变量。
如果令λ2＝0，则原二次规划问题等价于支持向量机的优化问题。也就是说Fisher支持向量机能够把支持向量机纳入其框架下。利用Lagrange乘子技术，将原二次规划问题转化为其对偶二次规划问题，得到 subject to yTβ＝0 其中β为Lagrange乘子，Q＝Y(2λ1Il+2λ2IlMK)-TKY，e为全1向量。
通过以上步骤就完成对人脸图像的识别。
本发明与现有技术相比具有如下优点 1、Fisher判别分析是同时最大化类间距离和最小化类内距离，是基于距离测度定义的。本发明通过真正的分类软间隔替代了Fisher判别准则中的类间散度最大，使得Fisher判别准则不是与类间距离相关，而是与真正的分类间隔有关，分类间隔表示了样本类间真正的可分信息。
2、支持向量机在核函数及其参数取定的情况下不再最小化样本半径，只对分类间隔进行最大化。本发明即使在核函数及其参数取定的情况下，不仅最大化分类间隔，而且还要最小化样本的半径，即使得类内距离最小。当本发明中的Fisher正则因子取为0时，等价于支持向量机方法。因此本发明的方法是一种更为广义的方法，它包含了支持向量机方法。
实验表明，本发明以每类9个训练样本为例，在UMIST人脸数据库上的识别率达到98.44％，高于支持向量机方法。

图1是本发明实现步骤的流程原理框图
具体实施例方式 参考图1，它是本发明实现步骤的流程原理框图，结合该图对本发明的实施过程作详细的说明。本发明的实施例是在以本发明技术方案为前提下进行实施的，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。
实施例采用了一个公用的人脸数据库，即UMIST数据库。UMIST数据库中包含20个人的人脸图像。每个人的人脸图像数不等，最少为19幅。每张图像的姿态不同，从侧面到正面变化。原始图像大小为112×92。
(1)、对人脸图像的学习过程 ①、首先对人脸训练图像进行处理，以获取两类有标识训练样本集{(xi，yi)|xi∈Rn，yi∈{-1，+1}，i＝1，…，l}，其中xi表示n维实数空间中的一个训练样本，yi是其标识，表示其类别不是+1类就是-1类，l为样本的个数；直接把人脸图像经行堆叠为10304维的长向量xi，并将其值归一化为0到1之间，则得到的一个n维向量的n＝10304。对于每个人，随机选择9个训练样本进行训练，并随机选择9个作为测试样本，得到一组训练-测试样本集。训练样本个数l＝180。
②、选择正则因子λ1和λ2，选取正定核函数及其参数，并计算核矩阵Kij＝k(xi，xj)。该正则因子λ1控制了假设空间的复杂度，λ2控制了Fisher正则的影响。而正定核函数是指满足正定条件的核函数，该核函数可以表示为k(x，x′)＝(Φ(x))TΦ(x′)，其中x，x′表示两个样本，Φ表示一种隐含的不知其表达式的非线性映射函数，上标T表示矩阵或向量的转置。这种非线性映射能够确定了一个再生核Hilbert空间。令映射后训练样本矩阵为ψ＝[Φ(x1)，…，Φ(xl)]，并令核矩阵Kij＝k(xi，xj)，则ψTψ＝K。再生核Hilbert空间是一个高维的特征空间。在该空间中，有表示定理表明假设函数可以表达为其中α和b为假设函数的待求系数。权值向量可以表达为常用的正定核函数有 ●多项式核函数k(x，x′)＝(a(x·x′)+b)d，a，b，d均表示多项式核函数的参数； ●高斯核函数k(xi，xj)＝exp(-γ‖xi-xj‖2)，γ表示高斯核函数的参数；在实验中，采用了高斯核函数，Fisher支持向量机中的正则因子λ1、λ2和核参数γ在一定范围内，如{2-20，2-14，…，210}区间中取值，得到最好性能的参数值。
③、求解Fisher支持向量机的对偶优化问题，求得其最优解β；Fisher支持向量机的学习过程归结为求解如下的原二次规划问题 subject to yi(wTΦ(xi)+b)≥1-ξi ξi≥0，i＝1，…，l 其中类内散度矩阵为是wi类的中心，li为wi类的样本个数，ξi是松弛变量。如果令λ2＝0，则原二次规划问题等价于支持向量机的优化问题。也就是说Fisher支持向量机能够把支持向量机纳入其框架下。利用Lagrange乘子技术，将原二次规划问题转化为其对偶二次规划，得到 subject to yTβ＝0 其中β为Lagrange乘子，Q＝Y(2λ1Il+2λ2IlMK)-TKY，Il是大小为l×l的单位阵，e为全1向量，其中M＝Il-N，

Y＝diag(y1，…，yl)为一对角阵，对角上的元素为样本的标识。对偶二次规划问题的求解可以调用已有的工具包来实现，比如调用Matlab中的二次规划函数，即可求得对偶二次规划问题的最优解β的值。
④、根据得到的最优解β来计算假设函数的待求系数α和b，其计算公式如下 α＝(2λ1Il+2λ2IlMK)-1Yβ (2)、对人脸图像的识别过程 ①、对人脸测试图像进行处理，获取无标识测试样本x，其处理步骤与学习过程中的步骤①完全相同； ②、利用学习过程中得到的假设函数对测试样本x进行判决。其判决方式是对假设函数取符号函数，即如果则x判决为+1类，否则为-1类。
以上是两类识别问题的学习和识别过程。本试验中涉及到多类问题，采用one-against-all的输出编码方式来分解多类问题。对c类问题，分解为c个两类问题，其中的一个两类问题是把某一类和其它类分开的问题，可以认为某一类样本标识为+1，而其他所有类的样本标识为-1，因此产生c个假设函数f1(x)，…，fc(x)。此时对x的判决过程如下如果而且则x属于第i类，否则拒识。
按照上述获取训练-测试样本集的方式，生成30组随机的训练-测试样本集，重复上述学习和识别过程30次，并计算平均识别率。本发明对于UMIST数据库每类9个训练样本的情况，在λ1＝2-12，λ2＝20和γ＝2-12时，识别率达到98.44％，高于在C＝27和γ＝20时，支持向量机的识别率96.54％。
权利要求
1.一种基于Fisher支持向量机的人脸识别方法，具体实现步骤如下
(1)、对人脸图像的学习过程
①、首先对人脸训练图像进行处理，以获取两类有标识训练样本集{(xi，yi)|xi∈Rn，yi∈{-1，+1}，i＝1，…，l}，其中xi表示某幅图像的特征，也就是n维实数空间中的一个训练样本，yi是其标识，表示其类别不是+1类就是-1类，l为样本的个数；该处理过程是将人脸图像直接经行堆叠为一个n维特征，或者采用某种特征提取的方法提取n个特征；
②、选择正则因子λ1和λ2，选取正定核函数及其参数，并计算核矩阵Kij＝k(xi，xj)；该正则因子λ1控制了假设空间的复杂度，λ2控制了Fisher正则的影响；而正定核函数是指满足正定条件的核函数，该核函数可以表示为k(x，x′)＝(Φ(x))TΦ(x′)，其中x，x′表示两个样本，Φ表示一种隐含的不知其表达式的非线性映射函数，上标T表示矩阵或向量的转置；这种非线性映射能够确定了一个再生核Hilbert空间；令映射后训练样本矩阵为ψ＝[Φ(x1)，…，Φ(xl)]，并令核矩阵Kij＝k(xi，xj)，则ψTψ＝K；再生核Hilbert空间是一个高维的特征空间；在该空间中，有表示定理表明假设函数可以表达为
其中α和b为假设函数的待求系数；权值向量可以表达为
④、求解Fisher支持向量机的对偶二次规划问题，求得其最优解β；
④、根据得到的最优解β来计算假设函数的待求系数α和b，其计算公式如下
α＝(2λ1Il+2λ2IlMK)-1Yβ
其中Il是大小为l×l的单位阵，M＝Il-N，
Y＝diag(y1，…，yl)为一对角阵，对角上的元素为样本的标识；
(2)、对人脸图像的识别过程
①、对人脸测试图像进行处理，获取无标识测试样本x；其处理步骤与学习过程中的步骤①完全相同；
②、利用学习过程中得到的假设函数对测试样本x进行判决；其判决方式是对假设函数取符号函数，即
如果则判决为+1类，否则为-1类。
2.根据权利要求1所述的基于Fisher支持向量机的人脸识别方法，其中学习过程③所述的Fisher支持向量机是本发明提出的一种新的模式识别技术；其具体实现过程如下已知训练样本集{(xi，yi)|xi∈Rn，yi∈{-1，+1}，i＝1，…，l}和核函数k(x，x′)＝(Φ(x))TΦ(x′)；Fisher支持向量机的学习过程归结为求解下面的原二次规划问题
subject to yi(wTΦ(xi)+b)≥1-ξi
ξi≥0，i＝1，…，l
其中类内散度矩阵为是wi类的中心，li为wi类的样本个数，ξi是松弛变量；
如果令λ2＝0，则原二次规划问题等价于支持向量机的优化问题；也就是说Fisher支持向量机能够把支持向量机纳入其框架下；利用Lagrange乘子技术，将原二次规划问题转化为其对偶二次规划问题，得到
subject to yTβ＝0
其中β为Lagrange乘子，Q＝Y(2λ1Il+2λ2IlMK)-TKY，e为全1向量。
全文摘要
本发明公开了一种基于Fisher支持向量机的人脸识别方法，它涉及模式识别技术领域。其目的在于采用该方法是把Fisher正则引入到支持向量机方法并用于人脸的识别问题上，以获得对小样本的高维数据有较好的识别率，进而对人脸有较好的识别效果。该方法的实现步骤为1)对人脸图像的学习过程首先对训练图像进行处理，然后选择正则因子、核函数及其参数，采用Fisher支持向量机方法来完成对训练样本的学习，以求得假设函数中的待求系数。2)对人脸图像的识别过程先对每个测试图像做与训练图像相同的处理，最后利用学到的假设函数模型对测试样本进行判决。本发明可用于机器学习和模式识别范畴内，除了图像识别以外，还可用于语音识别及数据挖掘等领域。
文档编号G06K9/00GK101216879SQ20071030073
公开日2008年7月9日申请日期2007年12月28日优先权日2007年12月28日
发明者周伟达, 莉张, 焦李成, 邹海双, 志胡, 强叶申请人:西安电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周伟达;张莉;焦李成;邹海双;胡志;叶强
技术所有人：西安电子科技大学
我是此专利的发明人

上一篇：用户误按钮操作时提供帮助的方法和装置的制作方法
上一篇：基于广义非线性判别分析的人脸识别方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。