基于Adaboost算法的人脸识别优化方法

文档序号:8498833阅读:342来源:国知局
基于Adaboost算法的人脸识别优化方法
【技术领域】
[0001] 本发明属于机器学习和模式识别技术领域,是利用训练数据集成构建一个具有较 强泛化能力的预测方法,以期对新的未知对象给出精确估计。
【背景技术】
[0002] 人脸识别技术是图像处理方面的重要技术,然而识别率不高是一直妨碍人脸识别 技术广泛应用的重要原因。研宄发现可以通过集成学习的方法来提高准确率。集成学习使 用多个学习机来解决同一问题,它通过调用一些简单的分类算法,以获得多个不同的基学 习机,然后采用某种方式将这些学习机组合成一个集成学习机。一般地,一个集成学习机 的构建分为两步:基学习机的生成和基学习机的合并,现有的许多集成学习算法主要是在 这两方面存在差异。在构建集成学习机时,有效地产生泛化能力强、差异大的基学习机是关 键,即基学习机的准确性和它们之间的多样性是两个重要因素。
[0003]目前,常见的用于生成基学习机的方法可以粗略地分为两大类:一类是将不同类 型的学习算法应用于同一数据集上,这种方法得到的基学习机通常被称为是异质类型的; 另一类是将同一学习算法应用于不同的训练集,这种方法得到的机学习机被称为是同质类 型的。
[0004] 根据基分类器提供的信息水平将现有的合并准则分成了三大类:抽象水平、秩水 平和置信值水平。抽象水平是指基分类器的输出是类标签,秩水平假定基分类器的输出是 根据分类器的预测效果好坏而对它们赋予的秩序列,而置信值水平则假定每个基分类器的 输出是一个概率分布。在置信水平类的合并准则中,根据是否需要估计额外的参数,它们又 可以分为固定的合并准则和可训练的合并准则。固定的合并准则是基于基分类器的输出对 基分类器直接进行合并,常用的有最大值、最小值、中位数、乘机、均值和多数投票准则;而 可训练的合并准则是将多个基分类器的输出作为新的特征再构建一个更高水平的分类器, 常见的方法有神经网络、决策树、支持向量机、Bayes准则、行为知识空间、Dempster-Shafer 理论等。
[0005] 集成学习中的Boosting算法已被成功应用于二分类问题。Adaboost.Ml算法将 Boosting算法扩展到多分类问题,但它要求每个弱分类器的正确率要大于1/2。但在多分 类问题中寻找正确率大于1/2的弱分类器较为困难。近几年,有学者针对该问题提出了适 于多分类问题的SAMME算法,并从理论上证明了新方法符合贝叶斯最佳分类规则。该方法 把对弱分类器正确率的要求从大于1/2降低到大于l/k(k为类别数),从而降低了寻找弱分 类器的难度。

【发明内容】

[0006] 本发明的目的在于针对已有人脸识别技术存在的识别率低的问题,提出一种改进 的SAMME算法SAMME.R应用于人脸识别中。
[0007] 为实现上述目的,本发明采用的技术方案是基于Adaboost算法的人脸识别优化 方法,具体而言,
[0008] 首先对人脸图像进行特征提取和降维,即利用(2D)2PCA算法对图像进行特征提取 和降维,同时在行与列上对图像矩阵进行降维,进一步降低特征向量的维数,有效降低问题 的时间复杂度。
[0009] 用降维后的矩阵数据,使用SAMME.R算法进行识别分类。该方法是把对弱分类器 (最近邻算法)正确率的要求降低到大于forj= 1,...,K1/k,保证提供足够多的弱分类 器参与集成。在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类 中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大。如果满足该条件则继 续进行权值调整和下一次迭代。如果不满足,由于训练出的弱分类器不够好,达不到要求, 所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所 述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的 质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率。
[0010] 流程图见图1,其具体步骤如下:
[0011] 步骤一:数据初始化
[0012] 1. 1)对人脸库中的所有图像进行归一化处理,归一化的操作是指先把图像统一大 小为32X32灰度值矩阵,得到大小为1024X1的灰度值矩阵,用(2D) 2PCA算法降维得到大 小为256X1的矩阵。初始化权僅=1,. . .,m。其中m是图像个数。
[0013] 步骤二:循环处理过程
【主权项】
1.基于Adaboost算法的人脸识别优化方法,其特征在于: 首先对人脸图像进行特征提取和降维,即利用(2D)2PCA算法对图像进行特征提取和降 维,同时在行与列上对图像矩阵进行降维,进一步降低特征向量的维数,有效降低问题的时 间复杂度; 用降维后的矩阵数据,使用SAMME. R算法进行识别分类;该方法是把对弱分类器正确 率的要求降低到大于for j = 1,...,K 1/k,保证提供足够多的弱分类器参与集成;在训练 弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的 权值和,是否比分到其他任意一类的权值和大;如果满足该条件则继续进行权值调整和下 一次迭代;如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情 况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足 进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优 强分类器;得到最终的强分类器有效提高了人脸识别的准确率; 其具体步骤如下: 步骤一:数据初始化 I. 1)对人脸库中的所有图像进行归一化处理,归一化的操作是指先把图像统一大小为 32X32灰度值矩阵,得到大小为1024X1的灰度值矩阵,用(2D)2PCA算法降维得到大小为
步骤二:循环处理过程 2.1)for 1,...,T,执行以下 7步: ① 按照权值选择图像样本; ② 对样本进行分类识别,ht:X - Y ;即将每个样本用最近邻弱分类器 进行分类识别,其中X是样本,Y是样本分类结果; ③ for k = 1,. . .,K,执行以下2步;进行权值调整; (1) 循环计算各类中,分到各类样本的权值和 for j = 1,…,K (2) 判断各类中分类正确的样本权值和是否大于分到
其他各类样本的权值和 [H'') = /] >= ) (/] 若满足,则进行下一次循环; 若不满足,则返回步骤二重新开始计算; 其中K是采样个数; ④ 计算ht的伪错误率:& = 气V,];用于判断算法的的识别效果;
⑥ 计算新的权重向量= ?〖/#,.)# .Vj),用于后续图像的选择; ⑦ 归一化权值w丨+1,使之在0-1范围内; 其中T为迭代次数; 步骤三:最终强分类器 3. 1)
其中hf(x)为最终生成的强分类器,用于人脸识别分类,输出分类结果;X为输入的人 脸头像数据,T为迭代次数,ht(Xt)为弱分类器,yi为类别标号。
【专利摘要】基于Adaboost算法的人脸识别优化方法,首先对人脸图像进行特征提取和降维,用降维后的矩阵数据,使用SAMME.R算法进行识别分类;在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大;如果满足该条件则继续进行权值调整和下一次迭代;如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率。
【IPC分类】G06K9-00, G06K9-62
【公开号】CN104820825
【申请号】CN201510203079
【发明人】杨新武, 袁顺, 马壮
【申请人】北京工业大学
【公开日】2015年8月5日
【申请日】2015年4月27日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1