基于最优维数标度切判据的人脸识别方法

文档序号:6428687阅读:164来源:国知局
专利名称:基于最优维数标度切判据的人脸识别方法
技术领域
本发明属于图像处理技术领域,涉及目标识别方法,可应用于人脸识别。
背景技术
人脸识别技术是一种重要的生物特征识别认证技术,在公共安全、信息安全、金融等领域具有广泛的应用前景,它利用计算机分析人脸图像,从中提取有效的识别信息,并与人脸信息数据库中的已知人脸信息比较,从而达到识别身份的目的。该过程一般包括预处理、特征提取和分类识别三个步骤。预处理一般包括噪声滤除、目标与背景分割等,其目的在于降低对目标方位变化等的敏感度以提高人脸识别系统的识别精度。特征提取是指将原始数据从高维空间映射到低维空间的一种线性或非线性的变换,用更少的信息有效地表示原始数据,能够降低计算复杂度,提高识别效率。特征提取的好坏在很大程度上会影响分类性能。目前国内外有许多研究机构都开展了针对人脸识别技术的研究,常用的数据库包括剑桥大学AT&T实验室提供的ORL以及耶鲁大学计算视觉与控制中心提供的^le等,由于人脸图像对光照、角度和遮挡等引起的变化比较敏感,人脸图像完备特征的提取难度较大,因此人脸图像的特征提取在近年来得到了很大的重视,已经取得了许多重要的研究成果,代表方法有主成分分析PCA,核主成分分析KPCA,线性判别分析LDA,核判别分析KDA, Fisherface 等。主分量分析PCA是一种有效的从高维数据中提取低维特征的方法,通过求解特征值问题或者用递归算法估计主分量来得到原始高维数据的低维表示。PCA能较好地克服由于图像尺寸、方向、部分场景内容变化以及噪声干扰等影响,被广泛应用于各个领域。线性判别分析LDA是一种有监督的特征降维方法,主要目标就是寻找在最小均方意义下,最能够分开各类数据的投影方向,实现上是通过寻找一组线性变换以达到类内散度最小且类间散度最大的目的。目前,LDA是最基本也是应用最广的维数约减方法。在维数约减中,约简之后的特征维数的选择是一个重要但却经常被人忽略的问题,如何选择约简之后的特征维数,目前没有公认的方法。在PCA中较为常见的是用累计方差贡献率来确定维数,这样处理的不足在于不好控制维数,有时候得到的维数并没有比原始维数低多少,起不到降维的作用;在LDA中一般都是降到比数据类别数少1的维数,由于不同数据的本征维数是不一样的,利用比类别数少1维的特征并不一定能带来最优的性能,由于这种处理通常得不到最优的特征维数,进而导致识别率低。

发明内容
本发明的目的在于克服现有技术的不足,提出一种基于最优维数标度切判据的人脸识别方法,以自动确定最优特征维数,避免特征维数选择不当而导致的识别率低,以及人工选择特征维数所需要的额外计算成本和时间,从而提高人脸识别的效率。实现本发明目的的技术方案是,假定不进行特征维数约简时,识别性能最差。在这个假定下,利用加权差分的形式表示识别性能,不进行维数约简的时候识别性能为零,当执行了维数约简后,加权差分得到一个正值,使用不同维数的特征,所得到的值将不一样,取最大值所对应的特征组合,即为最优特征,对提取特征后的数据进行分类,进而实现人脸图像的识别。具体步骤包括(1)分别对已知类别标签的训练图像和待测试图像进行预处理,得到预处理后的训练样本集X = (X1)^1 e Rd,以及测试样本集X’= {x'J^ e Rfl,训练样本集对应的类别标签集
用L = {/£表示,其中,Xi和Χ' j分别表示训练样本集的第i个训练样本和测试样本集的第j个测试样本,每个样本用一个行向量表示,Ii是第i个训练样本所属的类别标号,N和 M分别是训练样本总个数和测试样本总个数,D表示所有样本的原始特征维数,R表示实数域;(2)构造训练样本集X的局部类间不相似性矩阵£和局部类内不相似性矩阵X C = ±iiK(xh-xXxh-xJ
p=l h=\ /=1A = izi:^(xA-x,XxA-xJ
p=l h=\ /=1其中,c表示训练样本的类别数,即原始图像的类别数,np表示训练样本集中第P 类的训练样本个数,N表示训练样本总个数,xh表示第ρ类的第h个训练样本,Xi表示训练样本集中的第i个训练样本,T表示矩阵的转置, 为调节类间近邻数的系数,=
Nl
hi为调节类内近邻数的系数,7V =N.
hi
V当IG Nh(Xh)
/npqb‘ iV h\
0其它 ^
]/当 XeW(Xi)
/n q· hJ
/ ρ j (3)对训练样本集的局部类间不相似性矩阵£和局部类内不相似性矩阵X进行求和,得到训练样本集的总的局部不相似性矩阵 =(4)根据训练样本集的局部类间不相似性矩阵£和总的局部不相似性矩阵 ,得到
基于最优维数标度切的加权差分矩阵8 = £-^£ ,其中,tr表示对矩阵求迹,^£表示加权
trTtrT
系数;(5)对基于最优维数标度切的加权差分矩阵S进行特征分解得到特征值以及对应的特征向量,取前d个最大特征值所对应的特征向量Vl,V2, Λ Vd,构成最优投影矩阵V = [V1, V2, AvJ eRDXd,其中,d的值等于矩阵S的正的特征值数,即最优特征维数,D表示样本的原始特征维数,R表示实数域;(6)分别将训练样本集X = {xjf^ e Rfl和测试样本集X’= {x'J^ e Rfl投影到由最优投影矩阵V所张成的低维空间,得到投影后的新的训练样本集Y = {y,}^ e Rd和新的测试样本集Y'=Iy171 e Rd,其中,Yi = <Xi · V>为第i个训练样本的新的特征向量,Xi为原训
练样本集的第i个训练样本,y' j = <x'广V>为第j个测试样本的新的特征向量,χ' j 为原测试样本集的第j个测试样本,N和M分别表示训练样本和测试样本的总个数,d表示新的样本集的特征维数,R表示实数域;(7)将新的训练样本集Y = {y,IeRlP训练样本集的类别标签集L = I/,]^,以及新的测试样本集Y'= Iyj: £ Rii输入到κ近邻分类器进行分类,得到测试图像的识别结果
{/'J1,其中,Γ j表示第j个测试图像所属的类别标号。本发明与现有的技术相比具有以下优点1、本发明由于采用加权差分的形式对特征维数进行选择,能够自动确定识别效果最优时所需的特征维数,比现有PCA和KPCA利用累计方程贡献率来确定维数的方法更精确,也比现有LDA和KDA统一将数据降到比类别数少1的维数更合理。2、本发明由于对人脸图像采用特征降维处理,保证了后续识别的精度;对比实验表明,本发明有效地降低了计算的复杂度,提高了人脸识别的准确率。


图1是本发明的流程示意图;图2是本发明仿真采用的ORL人脸库中的部分图像。
具体实施例方式参照图1,本发明的具体实施步骤包括步骤1,从剑桥大学AT&T实验室提供的ORL人脸库的每一类图像中选出一部分图像,作为已知类别标签的训练图像,将ORL中的剩余图像作为待测试图像。步骤2,对已知类别标签的训练图像和待测试图像进行预处理,得到预处理后的训练样本集和测试样本集。2a)对大小为112X92的已知类别标签的训练图像和待测试图像进行下采样,分别得到大小为^x 23的训练小图像和测试小图像;2b)将每一幅训练小图像和测试小图像的所有像素值按列取出,排成一个行向量, 作为该小图像的原始特征向量,原始特征向量的维数D为644 ;2c)用所有训练小图像的原始特征向量组成所有训练样本的原始特征矩阵,作为训练样本集X = {χ,}, e Rfl,训练样本集对应的类别标签集用L = !/,I1表示,其中,Xi表示训练样本集的第i个训练样本,每个训练样本用一个行向量表示,Ii是第i个训练样本所属的类别标号,N是训练样本总个数,D表示所有样本的原始特征维数,R表示实数域;2d)用所有测试小图像的原始特征向量组成所有测试样本的原始特征矩阵,作为
测试样本集X'= {x'J^ e Rfl,其中,X' J表示测试样本集的第j个测试样本,每个测试样本用一个行向量表示,M是测试样本总个数。
步骤3,构造训练样本集X的局部类间不相似性矩阵£和局部类内不相似性矩阵X。3a)计算训练样本集中两两样本之间的欧氏距离dig = I Xi-XgI |,其中,Xi和Xg 分别为训练样本集中第i个和第g个训练样本,dig表示第i个和第g个训练样本之间的欧式距离;3b)根据训练样本之间的欧氏距离大小,对训练样本集中每一个属于第ρ类的训练样本xh,从第P类以外的训练样本中选出与4距离最近的qb个训练样本,qb表示类间近邻数,从第P类训练样本中选出与4距离最近的qw个近邻样本,Qw表示类内近邻数,将Nb (Xh) 定义为训练样本4的类间%近邻域,将Nw(Xh)定义为训练样本&的类内qw近邻域,ρ的取值范围是1到c,c表示训练样本的类别数,即原始图像的类别数,4表示第P类的第h个训练样本,np表示训练样本集中第ρ类的训练样本个数;3c)根据步骤北)中确定的参数,分别计算调节类间近邻数的系数和调节类内近邻数的系数
权利要求
1. 一种基于最优维数局部标度切判据的人脸识别方法,包括如下步骤(1)分别对已知类别标签的训练图像和待测试图像进行预处理,得到预处理后的训练样本集
2.根据权利要求1所述的人脸识别方法,其中步骤(1)所述的对已知类别标签的训练图像和待测试图像进行预处理,按如下步骤进行la)对大小为112X92的已知类别标签的训练图像和待测试图像进行下采样,分别得到大小为^X 23的训练小图像和测试小图像;lb)将每一幅训练小图像和测试小图像的所有像素值按列取出,排成一个行向量,作为该小图像的原始特征向量;Ic)用所有训练小图像的原始特征向量组成所有训练样本的原始特征矩阵,作为训练样本集X;Id)用所有测试小图像的原始特征向量组成所有测试样本的原始特征矩阵,作为测试样本集X'。
3.根据权利要求1所述的人脸识别方法,其中步骤( 所述构造训练样本集的局部类间不相似矩阵和局部类内不相似矩阵,按如下步骤进行2a)计算训练样本集中两两样本之间的欧氏距离dig= I |Xi_Xg| |,其中分别为训练样本集中第i个和第g个训练样本,dig表示第i个和第g个训练样本之间的欧式距 1 ;2b)根据训练样本之间的欧氏距离大小,对每一个属于第ρ类的训练样本xh,从第ρ类以外的训练样本中选出与4距离最近的%个训练样本,Qb表示类间近邻数,从第P类训练样本中选出与4距离最近的qw个近邻样本,Qw表示类内近邻数,将Nb (Xh)定义为训练样本 Xh的类间%近邻域,将Nw(Xh)定义为训练样本4的类内qw近邻域,ρ的取值范围是1到C, c表示训练样本的类别数,即原始图像的类别数,np表示训练样本集中第ρ类的训练样本个数;2c)根据步骤2b)中确定的参数,分别计算调节类间近邻数的系数和调节类内近邻数的系数2d)根据步骤2b)和步骤2c)中确定的参数,分别计算每一类训练样本的局部类间不相似性矩阵£。及局部类内不相似性矩阵Xp
全文摘要
本发明公开了一种基于最优维数标度切判据的人脸识别方法,主要解决现有方法在对特征进行降维时无法自动确定最优维数而导致的识别率低及计算量大的问题。其步骤包括对已知类别的图像和待测试图像进行预处理,得到训练样本集和测试样本集;分别构造训练集的局部类间和局部类内不相似性矩阵,及总的局部不相似性矩阵;构造基于最优维数局部标度切的加权差分矩阵,对该矩阵进行特征分解得到最优维数以及最优投影矩阵;分别将训练集和测试集投影到低维空间,得到新的训练集和测试集;将新的训练集和测试集输入K近邻分类器进行分类,得到测试图像的类别。本发明具有自动选择最优维数的优点,并能得到较高的识别率,可用于公共安全、信息安全领域。
文档编号G06K9/62GK102208020SQ20111019950
公开日2011年10月5日 申请日期2011年7月16日 优先权日2011年7月16日
发明者侯彪, 周斯斯, 周楠, 张向荣, 李阳阳, 焦李成, 贺予迪, 马文萍 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1