一种深度卷积神经网络的人脸识别方法

文档序号：8544006阅读：799来源：国知局

一种深度卷积神经网络的人脸识别方法
【技术领域】
[0001] 本发明属于图像处理及模式识别的技术领域，具体地设及一种深度卷积神经网络的人脸识别方法。
【背景技术】
[0002] 特征提取一直是模式识别领域中的难点之一，传统的基于特征的识别方法都预先定义一种特征，再依据定义的特征进行分类识别。深度学习作为传统机器学习的发展，因其能逐层自动学习到更为合适的表示特征，而在众多领域得到广泛应用。一般的深度学习算法，在进行图像识别时，会丢失原始图像的结构信息，因而影响识别效果。卷积神经网络作为深度学习的方法之一，在继承深度学习自动学习提取特征的前提下，借助局部感受野的概念进行卷积运算，保证了原始信号的空间结构关系，同时通过共享权值减少了需要训练的参数，因而在模式识别等许多领域达到了更好的效果。目前卷积神经网络已经被应用到视频中的人体动作识别，信号重构，人脸检测，文档分析，语音检测，车牌识别等各个应用领域。
[0003] Y.Le化n首先将卷积神经网络应用于手写字符识别领域中并取得了很好的效果。借助卷积运算，可W使原信号特征增强，并且降低噪音。卷积运算后的下采样操作，利用了图像局部相关性原理，对图像进行子抽样，减少数据处理量同时保留有用信息。调整权值时，使用的传统的BP炬ackpropagation，反向传播）算法，按极小化误差的方法，进行反向传播调整权矩阵。文中使用丽1ST手写数字库，共计6万个训练样本和1万个测试样本。当运用所有训练样本进行训练时，随着迭代次数的增加，识别率从88. 59(1次）上升到 97. 27 (10次）。然而通过实验发现，当降低训练样本时，算法对测试样本的识别率会急速下降；尤其当训练所使用的样本不足2万时，识别率仅为59. 21 %。
[0004] 有人提出，在对0化数据库进行人脸识别时，首先通过自组织映射等方法进行降维的预处理，使得网络参数变少，计算复杂度降低；然后利用CNN(Convolution Neural Network,卷积神经网络）网络进行训练，共有输入层、2个卷积层和2个下采样层。第一个卷积层选择20个3 X 3大小的卷积核，第二个卷积层选择25个3 X 3大小的卷积核，利用了传统的基于误差为目标函数的BP算法进行权值更新；最后通过多种分类器的加权求值和进行识别。实验表明了该方法对人脸识别的准确率有所提升。实验在对卷积神经网络进行权值更新时，一共进行了 2万次的更新，然而，该方法时间性能较差，收敛速度较慢，对权值进行了高达2万次的迭代更新。当减少权值的更新迭代次数时，识别效果会显著下降。
[0005]因为目前的卷积神经网络，在定义求解权值的目标函数时候，一般是定义重构误差最小或者实际输出值和标签误差最小。该种深度神经网络学习模型需要大量的标签样本进行训练，而且时间复杂度极高，经常需要上万次的迭代更新才能获得较好的识别性能。然后在实际应用中，样本标注的成本是非常高的，时间复杂度的要求也是非常苛刻的（例如有时需要进行实时识别）。针对上述问题，为了降低时间复杂度并使得在减少训练样本的情况下网络中权值依然有较强的分类能力，本发明提出了基于Fisher准则的深度卷积识别算法FCNN(Fisher-basedconvolutionneuralnetworkmethod,基于Fisher准则的卷积神经网络算法）。FO^N利用深度卷积网络对权值进行训练时，引入了Fisher判别准则，使得每次迭代训练更新权值时，每层参数的调整不仅保证实际输出值和标签误差尽量小，而且使同类样本距离更近、非同类样本距离更远。沿着该个目标不断更新迭代，使训练出的网络权值更有利于分类和识别。实验表明，当带标签样本减少或训练迭代次数较少时，也可W 达到比较理想的效果。

【发明内容】

[0006] 本发明的技术解决问题是；克服现有技术的不足，提供一种深度卷积神经网络的人脸识别方法，其降低了时间复杂度，并使得在减少训练样本的情况下网络中权值依然有较强的分类能力。
[0007] 本发明的技术解决方案是；该种深度卷积神经网络的人脸识别方法，其包括训练阶段和分类阶段，所述训练阶段包括W下步骤：
[000引（1)随机生成输入单元与隐单元之间的权值Wj.和隐单元的偏置bj.，j= 1，…，Lj为权值和偏置的个数，共L个；
[0009] 似输入训练图像Y及其标签，利用前向传导公式Vb(x) =f(WTx)，其中，h",b(x) 为输出值，X为输入，计算每层输出值h",b(xW);
[0010] (3)通过公式（4)根据标签值和步骤（2)的最后一层输出值计算出最后一层偏差
【主权项】
1. 一种深度卷积神经网络的人脸识别方法，其特征在于：其包括训练阶段和分类阶段，所述训练阶段包括以下步骤： (1)随机生成输入单元与隐单元之间的权值Wj和隐单元的偏置bj，j = 1，…，L，j为权值和偏置的个数，共L个； ⑵输入训练图像Y及其标签，利用前向传导公式hw，b(x) = f(WTx)，其中，hw，b(x)为输出值，X为输入，计算每层输出值hw，b(x(i)); (3) 通过公式（4)根据标签值和步骤（2)的最后一层输出值计算出最后一层偏差
(4) 根据最后一层偏差计算各层偏差，从而求得梯度方向（BP算法的主要思想就是：要想求得总体网络的梯度方向，就要求出每层的偏差，反向传播算法就是首先求得最后一层的残差值，再追层求得所有层的残差，进而求得网络梯度方向）； (5) 根据公式（2)、（3)更新权值
所述分类阶段包括以下步骤： (a) 保持网络中所有的参数不变，记录每个测试样本由网络输出的类别向量； (b) 计算残差 δ = I |hw,I2; (C)根据残差最小，为测试图像分类。
2. 根据权利要求1所述的深度卷积神经网络的人脸识别方法，其特征在于：所述训练阶段还包括步骤（6):
其中1为类内相似度度量函数，定义为所有样本与其类别均值的距离之和，J2为类间相似度度量函数，定义为所有样本类别均值的距离之和，M(i)为第i类样本的均值；当使用 J1作为代价函数进行梯度算法计算时，每一步迭代，使得样本预测值到样本所属类别的平均预测值更小；当使用J 2作为代价函数进行梯度算法计算时，每一步迭代，使得不同类别间的距离更大。
【专利摘要】公开一种深度卷积神经网络的人脸识别方法，其降低时间复杂度，使得在减少训练样本的情况下网络中权值依然有较强的分类能力。其包括训练阶段和分类阶段，训练阶段包括步骤：(1)随机生成输入单元与隐单元之间的权值wj和隐单元的偏置bj，j＝1,…,L，j为权值和偏置的个数，共L个；(2)输入训练图像Y及其标签，利用前向传导公式hW,b(x)＝f(WTx)，hW,b(x)为输出值，x为输入，计算每层输出值hW,b(x(i))；(3)根据标签值和最后一层输出值计算出最后一层偏差；(4)根据最后一层偏差计算各层偏差，求得梯度方向；(5)更新权值；分类阶段包括步骤：(a)保持网络中所有的参数不变，记录每个测试样本由网络输出的类别向量；(b)计算残差δ＝||hW,b(x(i))-y(i)||2；(c)根据残差最小，为测试图像分类。
【IPC分类】G06K9-00, G06K9-66
【公开号】CN104866810
【申请号】CN201510170852
【发明人】孙艳丰, 齐光磊, 胡永利
【申请人】北京工业大学
【公开日】2015年8月26日
【申请日】2015年4月10日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙艳丰;齐光磊;胡永利;
技术所有人：北京工业大学;
我是此专利的发明人

上一篇：一种车辆视频中机动车辆的车身颜色自动识别方法
上一篇：画面播放方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。