一种基于深度卷积神经网络的人脸识别方法和考勤系统的制作方法_2

文档序号：9645963阅读：来源：国知局

积神经网络所提取的特征能更加准确的描述人脸特征，因而其抗干扰能力和识别率与传统分类算法相比，具有很大的提高。因此，相对于现有技术，本发明的识别方法和考勤系统对背景、光照以及姿态等变化具有较好的鲁棒性，具有较好市场应用前景与发展潜力。
【附图说明】
[0045]图1为本发明的基于一种深度卷积神经网络人脸识别考勤系统的硬件结构框图。
[0046] 图2为本发明的基于一种深度卷积神经网络人脸识别考勤方法的流程图。
[0047] 图3为本发明包含的深度卷积神经网络结构示意图。
[0048] 图4为本发明包含的卷积操作示意图。
[0049] 图5为本发明包含的数据管理示意图。
【具体实施方式】
[0050]图1为本发明提出的一种基于深度卷积神经网络人脸识别考勤系统的硬件结构框图。通过用户管理服务器录入用户信息发送至中心服务器；在中心服务器中构建基于深度卷积神经网络的人脸识别模型；员工在各个地点的考勤机上进行在线人脸识别，人脸识别结果将通过内部局域网返回给用户管理服务器和考勤机；管理人员可以在用户管理服务器上进行用户考勤记录查询、信息的修改等。本发明中使用的用户管理服务器操作平台为 Windows7操作系统，中心服务器端为WindowsServer2012。
[0051] 图2为本发明实施的基于深度卷积神经网络人脸识别方法流程图，主要包含用户信息的采集、人脸识别模型的构建、人脸的在线识别以及后台考勤数据的管理与分析四个步骤。其具体的实施方法如下所示：
[0052]S1:用户信息的采集
[0053] S11 :录入员工的个人信息（姓名、性别、部门、职务、考勤设备），并为其分配用户 ID号保存在用户管理服务器中。
[0054]S12:员工人脸样本的采集。在采集人脸样本时，在中心服务器中用visualC++编写的MFC界面上，利用OpenCV开源视觉开启摄像头，人脸保持与摄像头约30- 80cm距离，眼睛盯着屏幕的中央处，缓缓的前后左右移动脸部，并保持表情自然，取样期间可以佩戴眼镜、耳钉、留胡须等。
[0055]S13:应用Haar特征与Adaboost算法对人脸进行检测，每隔3S截取一张人脸区域的图像，每人截取120张人脸图。在图像采集过程中对所采集人脸样本进行尺度归一化，将图片大小设置为64X64像素，并对图像进行直方图均衡预处理。具体的人脸检测与直方图均衡预处理的实现方法如下所示：
[0056]S131 :Adaboost用于人脸识别中的定位人脸区域，它是利用一种类Haar特征，通过提取重要的特征构成弱分类器，然后由若干个弱分类器构成有效的强分类器，最后使用该强分类器来实现对人脸的搜索与检测。
[0057]S132:对尺度归一化的图像进行直方图均衡化处理，使输出图像在每一灰度级都有近似相同的像素点数。转换的公式为：
[0058]
[0059] 上式中，DA为换前的像素灰度值，DB为转换后的像素灰度值，DMAX为最大灰度值，为转换前的图像的概率密度函数。
[0060]S14:将所有处理后的人脸图像与该员工的ID号进行关联，保存在中心服务器中。
[0061]S15:返回至Stepl对下一个员工进行人脸样本采集。
[0062]S2:人脸识别模型的构建
[0063]本发明所使用的人脸识别方法为深度卷积神经网络（CNN)，该神经网络的具体参数设置为：
[0064]S21:在中心服务器中进行深度卷积神经网络的构建，图3为深度卷积神经网络结构示意图，整个深度卷积神经网络分为7层，输入层神经元数为4096个，对应于64X64图像窗口按行展开的各个像素。其余各层参数设置为：
[0065]S211:第1、3、5层为分别为卷积层Cl、C2、C3,分别由6个5X5、12个5X5、12 个5X5特征图构成，每个神经元与输入中5X5的邻域相连，滤波后的特征大小的分别为 60\60、26\26、9父9。（：1有156个可训练参数，共156\(60\60)= 561，600 个连接。通过卷积运算，可以使原信号特征增强，并且降低噪音；C2中的每个特征图是连接到S1中的所有6个或者几个特征图的组合，表示本层的特征图是上一层提取到的特征图的不同组合；由于第4层的特征图的维数比较大，会削弱深度卷积神经网络的特征提取能力，则再添加一层卷积层C3。
[0066] S212 :在卷积层C1中，人脸样本;Γ的特征图被6个不同的5X5卷积核进行滤波，加上一个偏置量basis，最后通过一个激活函数，就可以得到输出特征图，具体卷积操作过程如图4所示，卷积层C1的输出JTl表示如下：
[0067]
[0068] 上式中：Mj表不选择的输入maps的集合；1代表层数；b是一个偏置量；K代表卷积核；代表输入的人脸样本；尤〗代表卷积后输出的特征图。
[0069]S213:卷积核是卷积神经网络模型中最具有特性的部分，本发明设置卷积核的大小为5X5。卷积核的大小决定了感受野的范围，感受野过大，则提取的特征超出卷积核的表达范围；如果感受野过小，则无法提取有效的局部特征。
[0070]S214:为了提取到有效的特征，本发明使用6个不同的卷积核在同一个局部区域提取多种特征，分别放在不同特征图的神经元中，既能避免了神经网络特征提取不全面，又由于感受野和权值共享的特点，减少了神经网络需要训练的参数的个数。
[0071]S215:第2、4层为下采样层S1、S2。特征图中的每个单元的输入分别对应卷积层中第1、3层的相对应特征图的2X2邻域相连接，则下采样后的特征图的大小分别为30X30、 13X13。S1层共有12个参数，一共27, 000个连接，而S2层共有24个参数，一共10, 140个连接，利用图像局部相关性的原理，对图像进行子抽样，可以减少数据处理量同时保留有用信息。
[0072]S216 :在下采样中，卷积层的的每邻域四个像素求和为一个像素，通过标量加权，再增加偏置K，最后通过一个sigmoid激活函数，输出一个缩小四倍的特征映射图 X!。第2、4层下采样的表达式为：
[0073]
[0074] 上式中，down()表示一个下采样函数；β代表权重系数。这里是对输入图像的不同2X2的块的所有像素进行求和，输出图像在两个维度上都缩小了 2倍。
[0075]S217:第6层是一个隐含层，与C5层全连接，特征维数为972(12X9X9)，可以将其看作一个972维的线性向量，而全连接到输出层的映射相当于使用该向量进行分类。
[0076]S218:第7层为输出层，神经元的数量是由员工注册的人数所决定的，代表了共有多少个员工。
[0077]S22:深度卷积神经网络的训练算法，其具体的训练方法主要包含以下两个阶段：
[0078] 第1阶段：前向传播。将采集的人脸图片与相关联的ID号输入到已经设置好CNN 网络里面，通过逐级向前传播得到输出〇p:
[0079] 0p=fn(. .. ...m
[0080] 第2阶段：反向传播。计算输出0Ρ与相应的理想输出Υρ的差，按极小化误差的方法调整权值矩阵。Ν个样本、C个类的的误差值为：
[0081]
[0082] (?表示第η个样本对应的标签的第p维的计算输出，表示第η个样本对应的标签的第Ρ维的理想输出。
[0083] S23:CNN训练的本质是一种输入到输出的映射，无需任何输入与输出之间的精确的数学表达式，只要通过已知人脸特征和ID号对深度卷积网络加以训练，网络就具备有输入与输出之间的映射能力。
[0084] S3 :人脸的在线识别
[0085] S31 :在特定的时间段内，员工在各个考勤机上面通过登录界面输入ID号，中心服务器对该ID号进行验证，若输入的ID号是已经在中心服务器上面注册的有效用户，系统自动启动摄像头进行人脸图像采集。若不是，则重新输入ID号验证。
[0086] S32 :在采集人脸图像时，员工尽量保持表情姿态与采集样本时一致，听到系统提示音后，则10张人脸图像采集完毕。在线识别的图片预处理过程与S13相同，人脸识别算法的中心服务器将预处理的图片进行在线识别，得到员工的类别ID号。<

完整全部详细技术资料下载

当前第2页1 2 3