一种深度卷积神经网络的人脸识别方法

文档序号:8544006阅读:799来源:国知局
一种深度卷积神经网络的人脸识别方法
【技术领域】
[0001] 本发明属于图像处理及模式识别的技术领域,具体地设及一种深度卷积神经网络 的人脸识别方法。
【背景技术】
[0002] 特征提取一直是模式识别领域中的难点之一,传统的基于特征的识别方法都预先 定义一种特征,再依据定义的特征进行分类识别。深度学习作为传统机器学习的发展,因其 能逐层自动学习到更为合适的表示特征,而在众多领域得到广泛应用。一般的深度学习算 法,在进行图像识别时,会丢失原始图像的结构信息,因而影响识别效果。卷积神经网络作 为深度学习的方法之一,在继承深度学习自动学习提取特征的前提下,借助局部感受野的 概念进行卷积运算,保证了原始信号的空间结构关系,同时通过共享权值减少了需要训练 的参数,因而在模式识别等许多领域达到了更好的效果。目前卷积神经网络已经被应用到 视频中的人体动作识别,信号重构,人脸检测,文档分析,语音检测,车牌识别等各个应 用领域。
[0003] Y.Le化n首先将卷积神经网络应用于手写字符识别领域中并取得了很好的效果。 借助卷积运算,可W使原信号特征增强,并且降低噪音。卷积运算后的下采样操作,利用 了图像局部相关性原理,对图像进行子抽样,减少数据处理量同时保留有用信息。调整权 值时,使用的传统的BP炬ackpropagation,反向传播)算法,按极小化误差的方法,进行反 向传播调整权矩阵。文中使用丽1ST手写数字库,共计6万个训练样本和1万个测试样 本。当运用所有训练样本进行训练时,随着迭代次数的增加,识别率从88. 59(1次)上升到 97. 27 (10次)。然而通过实验发现,当降低训练样本时,算法对测试样本的识别率会急速下 降;尤其当训练所使用的样本不足2万时,识别率仅为59. 21 %。
[0004] 有人提出,在对0化数据库进行人脸识别时,首先通过自组织映射等方法进行 降维的预处理,使得网络参数变少,计算复杂度降低;然后利用CNN(Convolution Neural Network,卷积神经网络)网络进行训练,共有输入层、2个卷积层和2个下采样层。第一个 卷积层选择20个3 X 3大小的卷积核,第二个卷积层选择25个3 X 3大小的卷积核,利用了 传统的基于误差为目标函数的BP算法进行权值更新;最后通过多种分类器的加权求值和 进行识别。实验表明了该方法对人脸识别的准确率有所提升。实验在对卷积神经网络进行 权值更新时,一共进行了 2万次的更新,然而,该方法时间性能较差,收敛速度较慢,对权值 进行了高达2万次的迭代更新。当减少权值的更新迭代次数时,识别效果会显著下降。
[0005]因为目前的卷积神经网络,在定义求解权值的目标函数时候,一般是定义重构误 差最小或者实际输出值和标签误差最小。该种深度神经网络学习模型需要大量的标签样本 进行训练,而且时间复杂度极高,经常需要上万次的迭代更新才能获得较好的识别性能。然 后在实际应用中,样本标注的成本是非常高的,时间复杂度的要求也是非常苛刻的(例如 有时需要进行实时识别)。针对上述问题,为了降低时间复杂度并使得在减少训练样本的情 况下网络中权值依然有较强的分类能力,本发明提出了基于Fisher准则的深度卷积识别 算法FCNN(Fisher-basedconvolutionneuralnetworkmethod,基于Fisher准则的卷积 神经网络算法)。FO^N利用深度卷积网络对权值进行训练时,引入了Fisher判别准则,使 得每次迭代训练更新权值时,每层参数的调整不仅保证实际输出值和标签误差尽量小,而 且使同类样本距离更近、非同类样本距离更远。沿着该个目标不断更新迭代,使训练出的网 络权值更有利于分类和识别。实验表明,当带标签样本减少或训练迭代次数较少时,也可W 达到比较理想的效果。

【发明内容】

[0006] 本发明的技术解决问题是;克服现有技术的不足,提供一种深度卷积神经网络的 人脸识别方法,其降低了时间复杂度,并使得在减少训练样本的情况下网络中权值依然有 较强的分类能力。
[0007] 本发明的技术解决方案是;该种深度卷积神经网络的人脸识别方法,其包括训练 阶段和分类阶段,所述训练阶段包括W下步骤:
[000引 (1)随机生成输入单元与隐单元之间的权值Wj.和隐单元的偏置bj.,j= 1,…,Lj为权值和偏置的个数,共L个;
[0009] 似输入训练图像Y及其标签,利用前向传导公式Vb(x) =f(WTx),其中,h",b(x) 为输出值,X为输入,计算每层输出值h",b(xW);
[0010] (3)通过公式(4)根据标签值和步骤(2)的最后一层输出值计算出最后一层偏差
【主权项】
1. 一种深度卷积神经网络的人脸识别方法,其特征在于:其包括训练阶段和分类阶 段,所述训练阶段包括以下步骤: (1)随机生成输入单元与隐单元之间的权值Wj和隐单元的偏置bj,j = 1,…,L,j为权 值和偏置的个数,共L个; ⑵输入训练图像Y及其标签,利用前向传导公式hw,b(x) = f(WTx),其中,hw,b(x)为输 出值,X为输入,计算每层输出值hw,b(x(i)); (3) 通过公式(4)根据标签值和步骤(2)的最后一层输出值计算出最后一层偏差
(4) 根据最后一层偏差计算各层偏差,从而求得梯度方向(BP算法的主要思想就是:要 想求得总体网络的梯度方向,就要求出每层的偏差,反向传播算法就是首先求得最后一层 的残差值,再追层求得所有层的残差,进而求得网络梯度方向); (5) 根据公式(2)、(3)更新权值
所述分类阶段包括以下步骤: (a) 保持网络中所有的参数不变,记录每个测试样本由网络输出的类别向量; (b) 计算残差 δ = I |hw,I2; (C)根据残差最小,为测试图像分类。
2. 根据权利要求1所述的深度卷积神经网络的人脸识别方法,其特征在于:所述训练 阶段还包括步骤(6):
其中1为类内相似度度量函数,定义为所有样本与其类别均值的距离之和,J2为类间 相似度度量函数,定义为所有样本类别均值的距离之和,M(i)为第i类样本的均值;当使用 J1作为代价函数进行梯度算法计算时,每一步迭代,使得样本预测值到样本所属类别的平 均预测值更小;当使用J 2作为代价函数进行梯度算法计算时,每一步迭代,使得不同类别间 的距离更大。
【专利摘要】公开一种深度卷积神经网络的人脸识别方法,其降低时间复杂度,使得在减少训练样本的情况下网络中权值依然有较强的分类能力。其包括训练阶段和分类阶段,训练阶段包括步骤:(1)随机生成输入单元与隐单元之间的权值wj和隐单元的偏置bj,j=1,…,L,j为权值和偏置的个数,共L个;(2)输入训练图像Y及其标签,利用前向传导公式hW,b(x)=f(WTx),hW,b(x)为输出值,x为输入,计算每层输出值hW,b(x(i));(3)根据标签值和最后一层输出值计算出最后一层偏差;(4)根据最后一层偏差计算各层偏差,求得梯度方向;(5)更新权值;分类阶段包括步骤:(a)保持网络中所有的参数不变,记录每个测试样本由网络输出的类别向量;(b)计算残差δ=||hW,b(x(i))-y(i)||2;(c)根据残差最小,为测试图像分类。
【IPC分类】G06K9-00, G06K9-66
【公开号】CN104866810
【申请号】CN201510170852
【发明人】孙艳丰, 齐光磊, 胡永利
【申请人】北京工业大学
【公开日】2015年8月26日
【申请日】2015年4月10日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1