基于卷积神经网络的人脸识别方法

文档序号：6633366阅读：359来源：国知局

基于卷积神经网络的人脸识别方法
【专利摘要】本发明提供了一种基于卷积神经网络的人脸识别方法，包括：对人脸图像进行必要的前期预处理，得到理想的人脸图像；选取理想的人脸图像作为卷积神经网络的输入进入U0，U0的输出进入UG，UG的输出作为US1的输入；US1的S神经元通过有监督训练，提取输入图像中不同方向的边缘成分作为第一次的特征提取并输出至特UC1的输入；UC1的输出作为US2的输入，US2完成第二次的特征提取并作为UC2的输入；UC2的输出作为US3的输入，US3完成第三次的特征提取并作为UC3的输入；UC3的输出作为US4的输入，US4通过监督竞争学习的方式得到各层的权值、阈值及神经元细胞平面数并作为UC4的输入；UC4作为网络的输出层，输出由US4的输出最大结果所决定的网络最终的模式识别结果。本发明能够提高复杂场景下人脸的识别率。
【专利说明】基于卷积神经网络的人脸识别方法

【技术领域】
[0001] 本发明涉及一种基于卷积神经网络的人脸识别方法。

【背景技术】
[0002] 人脸识别技术是利用计算机分析人脸图像，提取有效的特征信息，识别个人身份的技术。它首先判断图像中是否存在人脸？如果存在则进一步确定每张人脸的位置、大小信息。并依据这些信息进一步提取每张人脸中潜在的模式特征，将其与已知人脸库中的人脸进行对比，从而识别每张人脸的类别信息。其中，判断一幅图像中是否存在人脸的过程就是人脸检测，将提取特征后的图像与已知人脸库对比的过程就是人脸识别。
[0003] 近几年研究者在人脸检测与人脸识别方面取得了大量成果，在检测性能和识别性能上都有很大提高。近几年，大量的人脸检测算法被提出，这些算法大致可以分为3 类：（1)基于肤色特征的方法，（2)基于知识模型的方法，（3)基于统计理论的方法。其中，人工神经网络（ANN)方法通过训练一个网络结构，把模式的统计特性隐含在网络结构和参数之中，对于人脸这类复杂的、难以显式描述的模式，基于ANN的方法具有独特的优势， Rowiey使用了两层ANN检测多姿态的人脸，第一层用来估计输入图像窗口的人脸姿态，第二层为三个人脸检测器，分别用来检测正面人脸、半侧面人脸、侧面人脸。一幅输入图像首先经过人脸姿态检测器估计其人脸姿态，对图像进行相应的预处理后，将其作为第二层的三个人脸检测器，最终确定人脸的位置以及姿态。
[0004] 人脸识别大致可分为以下几类方法：（1)基于几何特征的方法；（2)基于弹性模型匹配方法；（3)神经网络方法；(4)基于线性和非线性子空间的方法。目前，存在的很多算法对场景简单的人脸图像具有很好的识别效果，然而在视频监控领域，视频图像受光照，方位，噪声和不同的人脸及表情等影响，即使目前高性能的人脸识别算法在这样的条件下仍不能达到非常理想的识别结果。
[0005] 人脸识别的困难具体体现在如下几个方面：
[0006] (1)相机的成像角度，即姿态对大部分人脸识别算法都有很大的影响，特别是基于简单几何特征的算法。两张属于同一个人的人脸图像由于姿态的影响可能会造成这两张图像的相似度还不如两张属于不同人的图像。
[0007] (2)光照的变化会改变人脸图像灰度信息，对于一些基于灰度特征的识别算法影响很大。
[0008] (3)表情的变化也会造成识别性能的下降。
[0009] (4)人脸图像还可能受到年龄，遮挡以及人脸图像尺度等因素的影响，会在不同程度上影响人脸识别算法的性能。
[0010] 卷积神经网络是近年发展起来，并引起广泛重视的一种高效识别方法。20世纪60年代，Hubei和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络 (Convolutional Neural Networks-简称CNN)。现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。K. Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后，更多的科研工作者对该网络进行了改进。其中，具有代表性的研究成果是Alexander和Taylor提出的"改进认知机"，该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。
[0011] 一般地，CNN的基本结构包括二层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，它与其他特征间的位置关系也随之确定下来；其二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。
[0012] CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习，所以在使用CNN时，避免了显示的特征抽取，而隐式地从训练数据中进行学习；再者由于同一特征映射面上的神经元权值相同，所以网络可以并行学习，这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性，其布局更接近于实际的生物神经网络，权值共享降低了网络的复杂性，特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
[0013] 下面是卷积神经网络进行人脸是识别的原理描述：
[0014] 如图1所示，一个完整的复杂场景下人脸自动识别系统主要包括场景图像采集与预处理、人脸检测与定位、人脸特征提取与人脸识别几个模块。
[0015] 图1中，场景图像采集与预处理模块对动态采集到的图像进行处理，以克服噪声干扰，改善识别效果，主要包括图像增强以滤除噪声，校正不均匀光照，增强对比度使复杂场景图像具有一定的可辨性；人脸检测与定位模块是在动态采集的图像中，自动找到所要识别人脸的位置，常用方法包括基于肤色模型的人脸定位算法，基于统计模型的人脸定位算法，基于特征模型的人脸定位算法；人脸特征提取是在人脸定位之后需要做的一项工作，常用的方法包括基于欧式距离的特征提取，基于KL变换的特征提取；基于SVD的特征提取，基于ICA的特征提取等；最后一个模块是人脸识别模块，完成对每个人脸图像的识别，常用方法主要包括两大类；一类是静态图像识别，另一类是动态图像识别。在这两大类方法中，人工神经网络（ANN)方法通过训练一个网络结构，把模式的统计特性隐含在网络结构和参数之中，对于人脸这类复杂的、难以显式描述的模式，基于ANN的方法具有独特的优势。本发明采用的就是神经网络识别法。
[0016] 根据是否进行特征提取，神经网络人脸识别系统可分为两大类：有特征提取部分的识别系统和无特征提取部分的识别系统。前者实际上是传统方法与神经网络方法技术的结合，这种方法可以充分利用人的经验来获取模式特征以及神经网络分类能力来识别人脸，特征提取必须能反应整个人脸的特征，才能达到较高的识别率；后者则省去特征抽取，将整个人脸图像直接作为神经网络的输入。这种方式虽然在一定程度上增加了神经网络结构的复杂度，但是网络的抗干扰性能和识别率较前者都有很大的提高。本发明中将要采用的CNN就属于第二类神经网络。

【发明内容】

[0017] 本发明的目的在于提供一种基于卷积神经网络的人脸识别方法，能够提高人脸识别率和抗干扰性。
[0018] 为解决上述问题，本发明提供一种基于卷积神经网络的人脸识别方法，包括：
[0019] 步骤一，对人脸图像进行必要的前期预处理，得到理想的人脸图像；
[0020] 步骤二，选取理想的人脸图像作为卷积神经网络的输入进入输入层U。，输入层UQ 的输出进入差异提取层％层的输出作为特征提取层S的第一层US1的输入；
[0021] 步骤三，第一层US1的S神经元通过有监督训练，提取输入图像中不同方向的边缘成分作为第一次的特征提取并输出至特征映射层C的第一层u a的输入，其中，所述特征映射层C为由复杂神经元组成的神经层，特征映射层C的输入连接是固定的，不可修改，每个特征映射为一个平面，平面上所有神经元的权值相等；
[0022] 步骤四，第一层Ua的输出作为特征提取层S的第二层US2的输入，第二层U S2完成第二次的特征提取并作为特征映射层C的第二层Ue2的输入；
[0023] 步骤五，特征映射层C的第二层UC2的输出作为特征提取层S的第三层US3的输入，第三层U S3完成第三次的特征提取并作为特征映射层C的第三层Ue3的输入；
[0024] 步骤六，特征映射层C的第三层Ue3的输出作为特征提取层S的第四层US4的输入，第四层U S4通过监督竞争学习的方式得到各层的权值、阈值及神经元细胞平面数并作为特征映射层C的第四层％4的输入；
[0025] 步骤七，第四层Ue4作为网络的输出层，输出由第四层US4的输出最大结果所决定的网络最终的模式识别结果。
[0026] 进一步的，在上述方法中，所述前期预处理包括定位和分割的预处理。
[0027] 进一步的，在上述方法中，步骤二中差异提取层Ue的输出如下式所示：

【权利要求】
1. 一种基于卷积神经网络的人脸识别方法，其特征在于，包括：步骤一，对人脸图像进行必要的前期预处理，得到理想的人脸图像；步骤二，选取理想的人脸图像作为卷积神经网络的输入进入输入层％，输入层％的输出进入差异提取层％层的输出作为特征提取层S的第一层US1的输入；步骤三，第一层US1的S神经元通过有监督训练，提取输入图像中不同方向的边缘成分作为第一次的特征提取并输出至特征映射层C的第一层ua的输入，其中，所述特征映射层 C为由复杂神经元组成的神经层，特征映射层C的输入连接是固定的，不可修改，每个特征映射为一个平面，平面上所有神经元的权值相等；步骤四，第一层Ua的输出作为特征提取层S的第二层US2的输入，第二层US2完成第二次的特征提取并作为特征映射层C的第二层ue2的输入；步骤五，特征映射层C的第二层Ue2的输出作为特征提取层S的第三层US3的输入，第三层US3完成第三次的特征提取并作为特征映射层C的第三层ue3的输入；步骤六，特征映射层C的第三层Ura的输出作为特征提取层S的第四层US4的输入，第四层US4通过监督竞争学习的方式得到各层的权值、阈值及神经元细胞平面数并作为特征映射层C的第四层％4的输入；步骤七，第四层UC4作为网络的输出层，输出由第四层US4的输出最大结果所决定的网络最终的模式识别结果。
2. 如权利要求1所述的基于卷积神经网络的人脸识别方法，其特征在于，所述前期预处理包括定位和分割的预处理。
3. 如权利要求1所述的基于卷积神经网络的人脸识别方法，其特征在于，步骤二中差异提取层％的输出如下式所示：
式中，％代表前一层的输出，n代表输入的神经兀，V代表指定区域，对V求和代表包含了指定区域的神经元总和，％(〇是神经元连接的强度，差异提取层％有2个神经元平面，当k = 2时，为加强中心神经元，k = 1时，代表抑止中心神经元，A。是v的半径，％层每个
4. 如权利要求1所述的基于卷积神经网络的人脸识别方法，其特征在于，步骤三至六中，特征提取层S中每一层S神经元的响应函数如下式所示：
式中，asl(v，K，k)(彡0)是上一层特征映射层C神经元u^Oi+v，k)至该层S神经元的连接函数，同一神经元平面的所有神经元的输入连接是相同的，e i是第1层S神经元的阈值，AS1是V的半径，当1 = 1时，UckOi，K )即为Ue(n，k)，此时，Kch = 2。
5.如权利要求1所述的基于卷积神经网络的人脸识别方法，其特征在于，步骤三至六中，除Ue4层外，特征映射层C的其余三层Ua、Ue2和Ue3的C神经元响应函数如下式所示：
【文档编号】G06K9/66GK104346607SQ201410620574
【公开日】2015年2月11日申请日期:2014年11月6日优先权日:2014年11月6日
【发明者】胡静申请人:上海电机学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡静
技术所有人：上海电机学院
我是此专利的发明人

上一篇：缩略图制作方法和装置制造方法
上一篇：基于gps的高光谱遥感图像几何精校正方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。