基于深度神经网络的实时人脸识别方法

文档序号：6536152阅读：372来源：国知局

基于深度神经网络的实时人脸识别方法
【专利摘要】本发明提出了一种基于深度神经网络和邻近元分析的实时人脸识别方法。本发明首先利用多样性较好的大规模人脸库训练出一种多层神经网络，其中除最后一层外的每层为非线性层，尾层为线性层；然后利用有监督的邻近元分析的方法在混合人脸库的基础上继续训练得到的网络，使得网络对于人脸图像的理解加深，达到缩短同一个体间人脸图像距离、增大不同个体间人脸图像距离的目的，最后在实际的人脸识别阶段，本发明提出了一种“搜索半径”的概念，在确保识别率的前提下，缩短了识别所需时间，实现了实时的人脸识别。本发明的识别正确率较高，同时，本发明的识别速度较快，适合应用于实时人脸识别任务中。
【专利说明】基于深度神经网络的实时人脸识别方法
【技术领域】
[0001]本发明属于模式识别领域，涉及一种人脸识别方法，特别涉及一种可实时进行人脸识别任务的人脸识别方法。
【背景技术】
[0002]作为生物认证技术的一种，人脸识别凭借着非接触性、良好的用户体验等特性，以及稳步上升的识别率，有着巨大的市场潜力与科学研究价值。人脸识别属于图像识别的一种，图像识别的重难点在于赋予机器理解图像所蕴含隐含信息的能力，而作为一种可提取数据深层信息的特征提取方法，深度神经网络对基于图像的人脸识别技术有着一定的启发。
[0003]目前，深度神经网络在模式识别领域已经有多项突破:微软采用深度神经网络技术进行语音识别，达到了现今最高的语音识别率；百度采用纽约大学Yann LeCun教授提出的深度卷积网络搭建了百度识图等应用，并组建了百度深度学习研究院；最新消息指出，谷歌搭建的深度学习系统在“学习”存储在服务器中大规模数据库的基础上已经可以做到独立思考的程度。
[0004]然而，鲜有研究者将深度神经网络应用于人脸识别领域，申请人:认为原因在于两点:一方面传统的深度神经网络+softmax的框架需要多张图像为每个个体建立一个模型，对于人脸识别这种类别数目不确定的任务适用性较差；另一方面，人脸识别所需要的图片尺寸较大，一般情况下，30X 30以上的图片才能达到满意效果，这样就加大了训练深度网络模型的难度。

【发明内容】

[0005]为探究深度神经网络对于人脸识别任务的识别效果，本发明提出了一种基于深度神经网络的实时人脸识别方法。首先利用多样性较好的大规模人脸库训练出一种多层神经网络，其中除最后一层外的每层为非线性层，尾层为线性层；然后利用有监督的邻近元分析的方法在混合人脸库的基础上继续训练得到的网络，使得网络对于人脸图像的理解加深，达到缩短同一个体间人脸图像距离、增大不同个体间人脸图像距离的目的，最后在实际的人脸识别阶段，本发明提出了一种“搜索半径”的概念，在确保识别率的前提下，缩短了识别所需时间，实现了实时的人脸识别。
[0006]为了实现以上目的，本发明方法主要包括以下步骤:
[0007]步骤(I).获取网络训练数据，具体是:选取多样性较好的人脸库作为大规模人脸库。另外，从多个人脸库中选取一部分图像组合成混合人脸库，其中对部分光照变化较强烈的图像进行光照归一化操作，减小光照的影响。采用Viola-Jones人脸检测器检测并剪切大规模人脸库与混合人脸库中图像内人脸部分。将大规模人脸库与混合人脸库中每张图像的像素值按行或列拉伸为一列，组合成行数为图像像素点数，列数为图像张数的矩阵，矩阵除以255，使得数据分布在0-1范围。[0008]步骤(2).使用深度神经网络在步骤(1)获取的大规模人脸库中人脸部分图像的基础上以无监督方式训练深度神经网络，具体算法如下。
[0009]本发明以Autoencoder深度神经网络为框架，通过恢复大规模人脸库中人脸图像，以达到训练深度神经网络的目的，首先用反向传导算法训练每层网络，最后同样用反向传导算法调整网络整体表现。算法具体步聚如下:
[0010]I)初始化每一层网络的权重惩罚因子、权重缩放比例、权重值、偏置值、
[0011]分组数据大小等参数。权重惩罚因子为控制不让训练得到的网络权重过
[0012]大，引起过拟合，假设初始化的权重比例为Ws，则有:
[0013]Ws = sqrt (6)/sqrt (v+h+1) (I)
[0014]式(I)中，V表示可见层节点数，h表示隐含层节点数。则可得到:
【权利要求】
1.基于深度神经网络的实时人脸识别方法，其特征在于该方法包括如下步骤: 步骤(1).获取网络训练数据，具体是:选取多样性较好的人脸库作为大规模人脸库；另外，从多个人脸库中选取一部分图像组合成混合人脸库，其中对部分光照变化较强烈的图像进行光照归一化操作，减小光照的影响；采用Viola-Jones人脸检测器检测并剪切大规模人脸库与混合人脸库中图像内人脸部分；将大规模人脸库与混合人脸库中每张图像的像素值按行或列拉伸为一列，组合成行数为图像像素点数，列数为图像张数的矩阵，矩阵除以255，使得数据分布在0-1范围；步骤(2).使用深度神经网络在步骤(1)获取的大规模人脸库中人脸部分图像的基础上以无监督方式训练深度神经网络，具体算法如下； 1)初始化每一层网络的权重惩罚因子、权重缩放比例、权重值、偏置值、分组数据大小；权重惩罚因子为控制不让训练得到的网络权重过大，引起过拟合，假设初始化的权重比例为1，则有: Ws = sqrt(6)/sqrt(v+h+l) (I)式(I)中，V表示可见层节点数，h表示隐含层节点数；则可得到:
W = 2*ws* (rand (h, v) -0.5) (2)
Ψ = 2*ws* (rand (v, h) -0.5) (3) 式(2) (3)中，W、W'分别为可见层、隐含层的初始化权重，rand(m，n)为可生成在(0，I)之间均匀分布随机数组成的mXn矩阵的函数； 2)确定网络的损失函数；Autoencoder的目标是是不断改进网络，增强网络对于原始数据的恢复能力，网络的损失函数为:
【文档编号】G06K9/00GK103778414SQ201410023333
【公开日】2014年5月7日申请日期:2014年1月17日优先权日:2014年1月17日
【发明者】罗志增, 邢健飞, 席旭刚, 高云园申请人:杭州电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗志增;邢健飞;席旭刚;高云园
技术所有人：杭州电子科技大学
我是此专利的发明人

上一篇：一种基于视频的行人快速检测方法
上一篇：一种基于智能无线终端设备的就医辅助系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。