人脸识别方法及系统的制作方法

文档序号:6352898阅读:263来源:国知局
专利名称:人脸识别方法及系统的制作方法
技术领域
本发明涉及一种人脸识别方法及系统,特别是涉及一种计算量较小、识别效果更好的人脸识别方法及系统。
背景技术
随着科学技术的进步,计算机和网络的飞速发展,信息的安全性、隐蔽性等越来越受到重视,如何快速方便有效地进行身份验证和识别日益成为人们关注的问题。目前众多的人类身份识别技术得到了广泛的研究和应用,如DNA (脱氧核糖核酸)识别技术、指纹识别技术、虹膜识别技术、语音识别技术、人脸识别技术等。在这些技术中,人脸识别技术相比其它识别技术更加直接。计算机人脸识别技术是一种生物特征识别技术,也是一门应用技术,它是指计算机根据一定的算法,把获得的图像和计算机中存储的人脸图像库进行匹配比较后,做出确认测试图像中的人像身份判断的识别过程。除了具有重要的科学价值外,人脸识别在信息安全、访问控制、视频监控等领域有着广泛的应用前景。特别是在美国遭遇“911”恐怖袭击事件之后,安全问题更成为人们关注的热点问题。人脸识别是当前模式识别和计算机视觉领域的一个研究热点,逐渐成为模式识别和图像处理等学科的一个研究热点,广泛应用于门禁、刑侦破案、安全监控和医学等方面。人脸识别是一个涉及很多领域和学科的重要研究课题。由于人脸识别问题的本质,不仅计算机科学家对它感兴趣,神经学家和心理学家也同样对人脸识别有浓厚的兴趣。与传统的身份鉴别方法如标识号码、IC(集成电路)卡等不同,人脸识别具有更好的安全性、可靠性和有效性,越来越受到人们的重视。由于人脸图像的特殊性,人脸识别问题也是模式识别领域的一个相当困难的问题,要使这一技术成为完全成熟的技术还有许多工作需要去做。在人脸识别中,如何寻找有效的特征是解决人脸识别的关键所在。由于人脸图像的复杂性,要显式的描述人脸图像特征比较困难。目前的人脸识别方法及系统的主要问题一方面是计算量大、复杂度也很高,另外一方面,目前的人脸识别方法及系统受环境(例如光照等因素)的影响也较大,导致识别结果不准确。因此需要找到一种计算量适中且从一定程度上识别结果不受环境影响的人脸识别方法及系统。

发明内容
本发明要解决的技术问题是为了克服现有技术中人脸识别过程中计算量大、复杂度也很高、受环境影响导致识别结果不准确的缺陷,提供一种计算量适中且从一定程度上识别结果不受环境影响的人脸识别方法及系统。本发明是通过下述技术方案来解决上述技术问题的:一种人脸识别方法,其特征在于,其包括以下步骤:步骤S1、利用小波变换分别对训练样本和测试样本进行图像预处理;步骤S2、采用PCA方法分别对预处理后的训练样本和预处理后的测试样本进行特征提取以获得训练样本特征和测试样本特征,并从该训练样本特征中选择代表训练样本特征,其中,该代表训练样本特征为训练样本特征中最能代表训练样本的特征;步骤S3、采用SVM对该代表训练样本特征和该测试样本特征进行分类识别,以得到识别结果。小波分析是当今应用数学和工程学科中一个迅速发展的新领域,小波变换对许多古老的自然科学和新兴的高新技术应用学科都产生了强烈冲击经。小波变换用于信号与图像压缩是小波变换应用的一个重要方面。小波变换在图像处理方面,主要利用了小波的分解和重构算法对图像进行处理,达到提取局部信息、降低维数等作用。它的特点是压缩比高,压缩速度快,压缩后能保持信号与图像的特征不变,且在传递中可以抗干扰。基于小波分析的压缩方法很多,比较成功的有小波包最好基方法,小波域纹理模型方法,小波变换零树压缩,小波变换向量压缩等。小波变换的应用领域包括:数学领域的许多学科;信号分析、图象处理;量子力学、理论物理;军事电子对抗与武器的智能化;计算机分类与识别;音乐与语言的人工合成;医学成像与诊断;地震勘探数据处理;大型机械的故障诊断等方面;例如,在数学方面,它已用于数值分析、构造快速数值方法、曲线曲面构造、微分方程求解、控制论等。在信号分析方面的滤波、去噪声、压缩、传递等。在图象处理方面的图象压缩、分类、识别与诊断,去污等。一副人脸图像对应的矩阵大小在几千维甚至上万维左右,所以在如此庞大的矩阵上直接提取特征向量计算量非常大。通常想到的方法是通过缩小图片的尺寸来减少计算量。可是很多方法在缩小图片尺寸的同时也丢失了很多原图像的重要信息。那么如何实现图像的压缩的同时又不丢失原图像总体的信息熵?可以使用二维离散小波分解进行图像的压缩。我们的实验证明,在进行二层小波分解后,各个子图的能量之和基本上接近总能量,而且原图像的大小被压缩为原来的四分之一,这样可以大大降低原来图像的维数。在图像预处理之后,在本发明中采用的基于主成分分析(Principal ComponentAnalysis,PCA)的人脸特征提取方法属于人脸的代数特征提取方法。所谓的代数特征是指把图像视为以像素值为元素的矩阵,从而可以对其进行各种代数变换,或者矩阵分解。通常来说人脸图像的维度数都是非常高的,导致计算的复杂度也非常大。另外人脸图像在高维空间的分布很不紧凑,不利于分类。为了获得人脸图像较紧凑的分布,Turk和Kirby首次把主成分分析的思想引入人脸识别中,并且获得了成功。在数学上,特征提取指的是从测量空间Rn到特征空间RmOn << η)的映射。主成分分析是统计学中分析数据的一种有效的方法,它的基本思想是提取出高维数据空间中的主要特征,使数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的信息,从而解决数据空间维数过高的瓶颈问题。主成分分析广泛应用于图像分析、数据压缩、数据挖掘和模式识别等领域。PCA人脸识别方法是从人脸图像整体特征出发,对图像的总体信息进行分类识别的,是基于人脸全局表达的一种相当有效识别方法。对于一幅人脸图像可以看作一个像素值组成的矩阵,也可以扩展开,看成一个矢量,如一幅NXN象素的图像可以视为长度为N2的矢量,这样就认为这幅图像是位于N2维空间中的一个点,这种图像的矢量表示就是原始的图像空间,但是这个空间仅是可以表示或者检测图像的许多个空间中的一个。不管子空间的具体形式如何,这种方法用于图像识别的基本思想都是一样的,首先选择一个合适的子空间,图像将被投影到这个子空间上,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是各种距离度量。具体来说,PCA用于人脸识别的方法的基础就是Karhunen-Loeve transform(简称K-L变换)。K-L变换是一种常用的正交变换,是一种非常有效的降维和压缩方法。K-L变换是建立在统计特性基础上的一种变换,又被称为霍特林(Hotelling)变换,因为他在1933年最先给出将离散信号变成一串不相关系数的方法。该变换多用于数据压缩和旋转,是图像压缩中的一种最优正交变换,其生成的矩阵一般为训练样本的总体散步矩阵或类间散布矩阵。K-L变换的突出优点是相关性好,是均方误差意义下的最佳变换,它在数据压缩技术中占有重要的地位,是特征提取方法中应用较为广泛的一种。K-L变换的目的是通过线性变换找到一组最优的单位正交基(也成为主成分),利用这组向量的线性组合来平均化原样本,并使得重建后的样本和原样本的误差最小。K-L展开式的系数可以用下列步骤求出:1.求随机向量X的自相关矩阵R = E [XXt]2.求R的特征值λ i和对应的特征向量Oi, i = 1,2,...,η得到矩阵Φ = (Φ^Φ 2,...,Φ η)3.展开式系数为:d = ΦΤΧ由于K-L变换前后的向量信号的个数是相同的,但是变换后的各个分量与变化前的分量值是不同的,因为变换后出现了若干个很小值。这使得我们能在保留主要分类信息的基础上降低特征的维数。如果用于数据压缩,就要删除一些能量较小的分量,在最小均误差的意义上,这种变换时最优的。K-L变换的核心是计算矩阵的特征值和特征向量,直接来求高位矩阵的特征值和特征向量是很难的,所以引入了奇异值分解(Singular Value Decomposition, SVD)定理。奇异值有下述性质:(1)稳定性对于描述图像的特征来说,当灰度有小的变化时,此特征的变化也不明显,则称为稳定。由于奇异值具有良好的稳定性,所以它对图像噪声具有不敏感的特性。(2)位移不变性对图像的平移变换相当于对图像矩阵作行(或)列的置换,即对图像矩阵作交换两行(或两列)的初等变换。原始图像和平移后的图像具有相同的奇异值向量。因此,奇异值向量具有位移不变性。(3)奇异值向量与对应图像亮度成比例变化当整幅图像的亮度成比例变化时,其奇异值向量也成比例变化,而且这种成比例变化并不改变它所包含的识别信息。因而采用奇异值向量进行识别时,只需采用简单的归一化即可消除比例系数的影响。(4)转置不变性根据奇异值分解定理,可得AAtU = λ 2UΑΑtν = λ 2V
由此可见,A和At有相同的奇异值,即对应同一奇异值向量。支持向量机(Supportvector machine, SVM)是 Vapnik 于 1995 年提出的一种新的机器学习技术,它是基于统计学习理论(Statistical Learning Theory, SLT)的学习方法,它通过构造最优超平面,使得对未知样本的分类误差最小。SVM是一种泛化能力很强的分类器,它在解决小样本问题方面表现出了许多特有的优势,已成为国际上模式识别领域新的研究热点。支持向量机借助于最优化方法来解决机器学习问题,它是建立在统计学习理论基础之上的,所以在介绍支持向量机之前,我们先简单介绍下统计学习理论。统计学习理论是一种专门研究小样本统计估计和预测的理论。该理论针对小样本统计问题建立了一套新的理论体系,在这种体系下的统计推理规则不仅考虑了对渐近性能的要求,而且追求在现有有线信息的条件下得到最优结果。传统的模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论是研究有限样本情况下的机器学习问题。V.VAPNIK等从二十世纪六七十年代开始致力于此方面的研究,到了九十年代中期,随着其理论的不断发展和成熟,也由于神经网络等学习方法在理论上缺乏实质性进展,统计学习理论受到越来越多的重视。支持向量机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求最优超平面。支持向量机用于分类,构造的复杂程度取决于支持向量的数目,而不是特征空间的维数,这就有效地解决了机器学习中非线性与维数灾难问题。SVM分类函数在形式上类似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应于一个支持向量。支持向量机方法的几个主要优点有:1、它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;2、算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问题;3、算法将实际问题通过非线性变换转换到高维的特征空间(Feature Space),在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关。优选地,步骤S1中采用二维离散小波分解对该训练样本和该测试样本进行处理以降低图像数据维度。优选地,步骤S1中采用如下公式实现二维离散小波分解:给定平方可和二维离散图像 iXm,Jm,nezm,n e Z,令 Ct^n = Xnun, m,n e Z,
权利要求
1.一种人脸识别方法,其特征在于,其包括以下步骤: 步骤S1、利用小波变换分别对训练样本和测试样本进行图像预处理; 步骤S2、采用PCA方法分别对预处理后的训练样本和预处理后的测试样本进行特征提取以获得训练样本特征和测试样本特征,并从该训练样本特征中选择代表训练样本特征;步骤S3、采用SVM对该代表训练样本特征和该测试样本特征进行分类识别,以得到识别结果。
2.如权利要求1所述的人脸识别方法,其特征在于,步骤S1中采用二维离散小波分解对该训练样本和该测试样本进行处理以降低图像数据维度。
3.如权利要求2所述的人脸识别方法,其特征在于,步骤S1中采用如下公式实现二维离散小波分解:给定平方可和二维离散图像{Xm,n}m,nezm,n G Z,令(;,m,n = Xm,n,m,n e Z,
4.如权利要求1所述的人脸识别方法,其特征在于,在该人脸识别方法中,用于训练的人脸图像样本总数为Q,共有P个人,每个人均L幅图像,每幅图像大小为MXN维,步骤S2包括以下步骤: 步骤S21、按照式I计算全体训练样本的均值向量,其中式I为:
5.一种人脸识别系统,其特征在于,其包括: 一图像预处理模块,用于利用小波变换分别对训练样本和测试样本进行图像预处理;一特征提取模块,用于采用PCA方法分别对预处理后的训练样本和预处理后的测试样本进行特征提取以获得训练样本特征和测试样本特征,并从该训练样本特征中选择代表训练样本特征; 一识别模块,用于采用SVM对该代表训练样本特征和该测试样本特征进行分类识别,以得到识别结果。
6.如权利要求5所述的人脸识别系统,其特征在于,该图像预处理模块还用于采用二维离散小波分解对该训练样本和该测试样本进行处理以降低图像数据维度。
7.如权利要求6所述的人脸识别系统,其特征在于,该图像预处理模块还用于采用如下公式实现二维离散小波分解:给定平方可和二维离散图像{Xm,n}m,nezm,n e Z,令(;,m,n =Xm,η πι, η ε Ζ,
8.如权利要求5所述的人脸识别系统,其特征在于,在该人脸识别系统中,用于训练的人脸图像样本总数为Q,共有P个人,每个人均L幅图像,每幅图像大小为MXN维,该特征提取模块还包括: 一第一计算单元,用于按照式I计算全体训练样本的均值向量,其中式I为:
全文摘要
本发明公开了一种人脸识别方法包括以下步骤利用小波变换分别对训练样本和测试样本进行图像预处理;采用PCA方法分别对预处理后的训练样本和预处理后的测试样本进行特征提取以获得训练样本特征和测试样本特征,并从该训练样本特征中选择代表训练样本特征;采用SVM对该代表训练样本特征和该测试样本特征进行分类识别,以得到识别结果。本发明还公开了一种人脸识别系统。本发明将小波变换、PCA(主成分分析)与SVM(支持向量机)三种方式结合使用,减少了识别的计算量,减少了由于表情、角度和光照等因素的影响,提高了识别的成功率。
文档编号G06K9/66GK103164689SQ20111042425
公开日2013年6月19日 申请日期2011年12月16日 优先权日2011年12月16日
发明者吴斌 申请人:上海移远通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1