基于迭代特征选择的快速人脸识别方法

文档序号:6524980阅读:267来源:国知局
专利名称:基于迭代特征选择的快速人脸识别方法
技术领域
本发明涉及的是一种信息处理技术领域的方法,具体是一种基于迭代特征选择的快速人脸识别方法。
背景技术
计算机自动人脸识别的基本过程是对人脸图像进行特征提取,用特征提取后的特征向量训练分类器,然后进行识别。一种有效的特征提取方法是对人脸图像的关键点定位后,然后作Gabor小波变换。最后用得到的人脸图像的特征训练模式分类器。在快速人脸识别问题中,子空间方法是人脸识别的经典方法,其中特征脸是最早地被应用到人脸识别的经典方法,在文献M.Turk,A.Pentland.Eigenfaces for Recognition.Journal of Cognitive Neuroscience,1991,3(1)71-86中对这种方法进行了详细的分析,其核心是采用主分量分析(PCA)来产生针对人脸识别的有效子空间,从而达到特征选择的目的,但是识别准确率还有待提高,且对于非线性分布的人脸模式不是很有效,如多角度的人脸识别。
经对现有技术的文献检索发现,近几年,针对非线性问题核子空间方法被提出来。J.Lu等在IEEE Trans.Neural Networks(IEEE神经网络期刊,2003年14期117页)上发表的“Face Recognition Using Kernel Direct DiscriminantAnalysis Algorithms”(使用基于核方法的直接判别分析算法的人脸识别技术),该文中提出的Kernel Direct Discriminant Analysis(KDDA),该方法是将核方法和子空间方法结合起来从而对人脸进行识别,其不足之处在于核方法中存在着大量计算任务,核方法的分类速度特别慢。在进一步的检索中,尚未发现任何关于多类分类的方法使用迭代特征选择的原理,以及用迭代特征选择进行人脸快速识别的报道。

发明内容
本发明的目的在于针对现有技术中存在的不足,提供一种基于迭代特征选择的快速人脸识别方法,使其对人脸图像进行特征提取,然后利用统计学习理论对训练样本进行训练,最后进行识别。从而大幅度提高现有的人脸识别系统的速度和准确性。
本发明是通过以下技术方案实现的,步骤如下(1)对不同人脸图像进行特征提取,称为人脸图像特征向量,形成样本集合。
(2)利用训练样本来训练支持向量机。
(3)根据训练好的支持向量机来计算特征排序指标。
(4)按照特征排序指标的值从大到小的次序对特征进行排序,选择排在前面的特征并消除掉排在最后面的M个特征。
其中M是需要用户定义的常数,在不等于零的情况下应该定义得尽量小,以保证比较高的特征挑选的精度。实际使用中其大小可在精度和训练时间之间取个折中方案。
(5)按根据经过选择的特征来更新训练样本,将训练数据限制在经过选择的特征上面。
(6)使用更新好的训练数据来重新训练支持向量机。
(7)重复迭代(3)-(6)步骤到预先设定的次数。
(8)得到最终的分类器模型和经过挑选的特征。
所述的计算特征排序指标,其方法具体如下计算特征排序指标P(Si)要首先计算第j类为真的先验概率P(ωj),定义一个随机事件Si为“第i个特征被挑选出来作为对分类有用的特征”,P(Si|ωj)表示在ωj发生的条件下Si的条件概率,当事件ωj发生的时刻,第j个二类分类子模型fj(x)正好对决定最终分类结果是有效的,根据第j个二类分类子模型fj(x),通过特征排序指标rij计算得到P(Si|ωj)P(Si|ωi)=rijΣi=1nrij]]>
根据全概率定理,P(Si)通过P(Si|ωj)和P(ωj)来计算得到P(Si)=Σj=1kP(Si|ωj)P(ωj).]]>本发明中其他的技术都可以通过现有技术措施实现。
本发明首先采集多角度人脸图像,然后通过特征提取将这些人脸图像转换成10304维的向量。将人脸特征向量进行迭代特征挑选,挑选出对分类有用的特征,抛弃掉无用并且起干扰作用的噪声,用统计学习理论来对训练样本进行训练。然后对同样条件下的采集到的人脸图像的图像进行自动识别。通过这样的改进,本发明系统比原来的系统(即直接把训练样本用SVM训练后,再进行识别的方法)有了很大的提高,可以大弧度地提高人脸识别的速度和精度,其中对于UMIST的测试集合,系统地识别速度可以提供二十倍以上而准确率不会下降。


图1为在不同维数下人脸识别测试时间的变化。
图2为在不同维数下人脸识别准确率的变化图3为图2所示的局部放大图具体实施方式
本发明采用“一对其它”多类支持向量机。“一对其它”多类支持向量机是构造k个二类支持向量机,k是类别的数目。第j个支持向量机fj(x)的训练过程是把第j类的样本看作为正类,把所有其它的样本看作是负类。相对于整个多类分类问题fj(x)是一个二类分类的子模型,它是用来判别第j类和所有其它类的。rij表示根据二类分类子模型fj(x)计算得到的第i个特征的排序指标。E表示概率意义上的必然事件,表示概率意义上的不可能事件。本发明用ωj来表示第j类为真的事件。根据概率理论,事件ω1,ω2,K,ωk是样本空间的一个划分E=ω1∪ω2∪K∪ωk,并且=ωi∩ωj,i≠j,P(ωj)是第j类为真的先验概率。定义一个随机事件Si为“第i个特征被挑选出来作为对分类有用的特征”。P(Si|ωj)表示在ωj发生的条件下Si的条件概率。当事件ωj发生的时刻,第j个二类分类子模型fj(x)正好对决定最终分类结果是有效的。根据第j个二类分类子模型fj(x),通过特征排序指标rij可以计算得到P(Si|ωj)P(Si|ωj)=rijΣi=1nrij]]>根据全概率定理,P(Si)可以通过P(Si|ωj)和P(ωj)来计算得到P(Si)=Σj=1kP(Si|ωj)P(ωj)]]>于是P(Si)可以用来作为针对整个多类分类问题的特征排序指标。本迭代特征挑选算法就是根据P(Si)来挑选特征的。
本发明为了测试经过特征挑选以后不同的维数对人脸分类速度的影响情况,做了一系列的实验。让维数在区间(1,N)上面变化,人脸识别的速度随着维数的变化而在改变。这里说的维数等价于特征的数目,就是经过特征挑选以后在分类中使用的特征的个数。图1给出了在参数M=100的情况下,在不同的维数下面分类速度的变化情况。图1中的分类测试时间(Test time)表示的是整个测试集中所有测试样本的测试时间的总和,特征维数(Feature Number)表示的是整个测试集中所选择的特征维数。从图1可以看出,经过特征挑选的降维过程,人脸识别的速度可以大大的加快。
图2显示了参数M分别取1和0的情况下人脸识别的准确率随维数变化而改变的情况。图2,图3中测试识别率(Recognition rate)表示的是在不同维数下人脸识别准确率。其中SVM-DFSI-1表示参数M取值为1,SVM-DFSI-2表示参数M取值为0。图3是图2的局部放大图。从图2和图3可以看出,参数M的不同取值对分类准确率的影响。需要特别说明的是当M取值为0的时候SVM-DFSI算法实际上是没有进行迭代而是直接挑选特征的。从这些实验结果中可以看出,在低维的情况下迭代的特征挑选要比不迭代的特征挑选的分类准确率要高很多。表1给出了在参数M分别取不同值的情况下人脸识别的测试准确率随维数改变而变化的情况。从表1可以看出在低维的情况下,参数M=1的时候分类准确率最高,随后参数M的值从5到1000逐渐变大的时候分类的准确率在降低,最后M=0时的分类准确率最低。这些实验结果表明本迭代特征挑选算法的迭代次数应该尽量的多,这样在低维情况下的分类准确率就会高。当然迭代次数太多会使训练时间变得非常长,在实际使用时可以在精度和训练时间之间取个折中方案。
表1在不同维数下人脸识别的测试准确率(参数M分别取不同的值)


从上可以看出,改进后的识别准确率并没有下降,但是识别速度可以提高二十倍以上。
权利要求
1.一种基于迭代特征选择的快速人脸识别方法,其特征在于,步骤如下(1)对人脸图像进行特征提取,形成样本集合;(2)利用训练样本来训练支持向量机;(3)根据训练好的支持向量机来计算特征排序指标;(4)按照特征排序指标的值从大到小的次序对特征进行排序,选择排在前面的特征并消除掉排在最后面的M个特征;(5)按经过选择的特征来更新训练样本,将训练数据限制在经过选择的特征上面;(6)使用更新好的训练数据来重新训练支持向量机;(7)重复迭代(3)-(6)步骤到预先设定的次数(8)得到最终的分类器模型和经过挑选的特征。
2.根据权利要求1所述的基于迭代特征选择的快速人脸识别方法,其特征是,所述的计算特征排序指标,其方法具体如下计算特征排序指标P(Si)要首先计算第j类为真的先验概率P(ωj),定义一个随机事件Si为“第i个特征被挑选出来作为对分类有用的特征”,P(Si|ωj)表示在ωj发生的条件下Si的条件概率,当事件ωj发生的时刻,第j个二类分类子模型fj(x)正好对决定最终分类结果是有效的,根据第j个二类分类子模型fj(x),通过特征排序指标rij计算得到P(Si|ωj)P(Si|ωj)=rijΣi=1nrij]]>根据全概率定理,P(Si)通过P(Si|ωj)和P(ωj)来计算得到P(Si)=Σj=1kP(Si|ωj)P(ωj).]]>
全文摘要
一种基于迭代特征选择的快速人脸识别方法,用于智能信息处理技术领域。本发明步骤如下(1)对不同人脸图像进行特征提取,称为人脸图像特征向量,形成样本集合;(2)利用训练样本来训练支持向量机;(3)根据训练好的支持向量机来计算特征排序指标;(4)按照特征排序指标的值从大到小的次序对特征进行排序,选择排在前面的特征并消除掉排在最后面的M个特征;(5)按经过选择的特征来更新训练样本,将训练数据限制在经过选择的特征上面;(6)使用更新好的训练数据来重新训练支持向量机;(7)重复迭代(3)-(6)步骤到预先设定的次数;(8)得到最终的分类器模型和经过挑选的特征。本发明可以大幅度地提高人脸识别的速度。
文档编号G06K9/00GK1746900SQ200510029980
公开日2006年3月15日 申请日期2005年9月23日 优先权日2005年9月23日
发明者范志刚, 吕宝粮 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1