一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法与流程

文档序号：12864153阅读：802来源：国知局

本发明涉及人脸识别技术领域，特别是涉及一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法。

背景技术：

生物特征识别技术作为一种重要的人机交互方式，通过计算机处理分析，利用人体的固有属性或行为特征来实现人机交互和识别，具有不易伪造，随身携带，使用方便等特性，提供了具有唯一性、高可靠性和稳定性的验证途径。在生物识别领域，目前被广泛研究和应用的技术有：指纹和掌纹识别、虹膜识别、人脸识别、行为动作识别及声音识别等。其中，指纹、掌纹和虹膜识别的识别精度高，但是这种识别方式是主动接触式的，要求被识别人员积极配合，用户体验度较低，在实际应用中遇到了各种阻力。相比于其他的生物识别技术，人脸识别有很多独到的优势包括非接触式设备使用方便、识别精度高、图像直观性突出及采集设备通用性强等特点，人机交互方便友好。

实际应用中人脸识别技术面临的挑战主要包括人脸图像光照变化、人脸表情、采集图像噪声干扰、遮挡及人脸姿态变化等。其中，图像噪声给人脸特征提取带来很大的影响，会严重降低人脸识别率。对于主动式人脸识别系统，可以通过人工干预的手段一定程度上消除遮挡、表情及人脸姿态的影响，但在人脸图像采集中光照变化的可控性低，是人脸识别系统中经常出现的问题。

技术实现要素：

为了解决上述技术问题，本发明提供一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法，以实现快速的人脸识别，光照鲁棒性强，识别准确率高。

为了实现上述目的，本发明采用如下技术方案：

一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法，用于将待识别人脸图像与预先存储在数据库中的人脸图像进行比较，找出相似度最高的人脸，包括以下步骤：

s1，获取待识别人脸图像并对其进行预处理；

s2，判断所述数据库中人脸图像的数量是否达到预定值，若未达到则执行步骤s3，否则执行步骤s4；

s3，利用拉普拉斯对数脸算法从预处理后的待识别人脸图像中提取人脸特征，而后计算提取的人脸特征与数据库中各人脸图像对应的人脸特征之间的卡方距离，并将卡方距离最小的人脸图像作为与待识别人脸图像相似度最高的人脸；

s4，利用预先训练的卷积神经网络从预处理后的待识别人脸图像中提取人脸特征；而后计算提取的人脸特征与数据库中各人脸图像对应的人脸特征之间的余弦距离，并将余弦距离最小的人脸图像作为与待识别人脸图像相似度最高的人脸。

优选地，所述步骤s1中的预处理包括人脸矫正及图像裁剪操作。

进一步地，所述步骤s3中的拉普拉斯对数脸算法包括以下步骤：

首先将预处理后的待识别人脸图像依次变换到对数域及拉普拉斯域；

然后采用lbp算法从拉普拉斯域的待识别人脸图像中提取人脸特征。

进一步地，所述步骤s4中的卷积神经网络通过如下步骤提取人脸特征：

首先从预处理后的待识别人脸图像中提取不同尺度的人脸特征的；

然后将所述不同尺度的人脸特征进行融合。

进一步地，所述卷积神经网络包括依次连接的卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、卷积层conv31、卷积层conv322、连接层conc1、连接层conc2、池化层pool51、连接层conc3和全连接层fc5，还包括分别连接在池化层pool2与连接层conc1之间的卷积层conv321和卷积层conv323、连接在池化层pool2与卷积层conv321之间的池化层pool3，分别连接在连接层conc1与连接层conc2之间的卷积层conv4和池化层pool4，连接在池化层pool2与连接层conc3之间的池化层pool52，连接在连接层conc1与连接层conc3之间的池化层pool53。

进一步地，卷积层conv1的尺寸/步长设置为5×5/1，池化层pool1的尺寸/步长设置为3×3/3、卷积层conv2的尺寸/步长设置为3×3/1、池化层pool2的尺寸/步长设置为2×2/2、卷积层conv31的尺寸/步长设置为3×3/1、池化层pool1的尺寸/步长设置为2×2/2、卷积层conv321的尺寸/步长设置为1×1/1、卷积层conv322的尺寸/步长设置为3×3/1、卷积层conv323的尺寸/步长设置为5×5/1、卷积层conv4的尺寸/步长设置为3×3/1、池化层pool4的尺寸/步长设置为2×2/1、池化层pool51的尺寸/步长设置为3×3/1、池化层pool52的尺寸/步长设置为5×5/5、池化层pool53的尺寸/步长设置为3×3/2。

优选地，所述步骤s1和所述步骤s3基于移动终端实现，所述步骤s4基于pc端实现。

由于采用了上述的技术方案，本发明与现有技术相比，具有以下的优点和积极效果：

本发明针对数据库中人脸图像较少的情况，采用光照鲁棒的拉普拉斯对数脸算法提取人脸特征，消除了光照影响；针对数据库中人脸图像较多的情况，采用卷积神经网络进行人脸特征的提取，可以进一步提高人脸识别的识别效果。由此，本发明可以实现快速的人脸识别，识别准确率高，对于监控、反恐等都有重要的意义。

附图说明

图1是本发明一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法的流程图；

图2是yaleb数据库样本及相应的llface人脸特征图；

图3是本发明卷积神经网络一个实施例的基本框架。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明描述的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

为了将待识别人脸图像与预先存储在数据库中的人脸图像进行比较，找出相似度最高的人脸，本发明提供一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法。在图1所示的实施例中，本发明的方法包括以下步骤：

首先，通过移动终端的人脸检测系统采集人脸图像，并进行人脸图像的分割提取以及人脸矫正、图像裁剪等预处理。而后，判断前述数据库是大数据库还是小数据库，即判断预先存储在数据库中的人脸图像的数量是否达到预定值(例如500个)，若未达到，则为小数据库，在移动终端直接对预处理后的人脸图像提取人脸特征并进行识别，若达到预定值，则为大数据库，考虑到移动终端计算资源的有限性，将预处理后的人脸图像传输到pc端进行人脸特征的提取和识别。

当数据库为小数据库时，移动终端利用拉普拉斯对数脸(ll-face)算法从预处理后的待识别人脸图像中提取人脸特征，而后计算提取的人脸特征与数据库中各人脸图像对应的人脸特征之间的卡方距离，并将卡方距离最小的人脸图像作为与待识别人脸图像相似度最高的人脸。其中，拉普拉斯对数脸算法具体包括以下步骤：首先将预处理后的待识别人脸图像变换到对数域，然后从对数域变换到拉普拉斯域；最后采用经典的lbp(局部二值模式)算法从拉普拉斯域的待识别人脸图像中提取人脸特征。经测试，ll-face算法与其它几种光照鲁棒人脸识别算法在由美国卡耐基梅隆大学创建的cmu-pie数据库上的识别精度对比结果如表1所示：

表1

在表1中，msr、sqi、lg-face、w-face、g-face分别表示多尺度同态滤波算法、自商图像算法、局部重量脸算法、韦伯光照脸算法、梯度脸算法。括号内的值表示识别精度的方差。由表1可知，本发明提出的ll-face算法优于其它典型的人脸光照鲁棒性识别算法。

图2给出了yaleb数据库样本及相应的llface人脸特征，yaleb数据库是一个用于衡量光照鲁棒性算法性能的标准库。本发明随机挑取了若干张图片并提取了图片的llface特征，从图2可见，llface人脸特征可以清晰提取光照鲁棒性特征同时能够刻画人脸细节信息。

当数据库为大数据库时，移动终端将预处理后的人脸图像传输到pc端，pc端利用预先训练的卷积神经网络(简称nr-network)从预处理后的待识别人脸图像中提取人脸特征；而后计算提取的人脸特征与数据库中各人脸图像对应的人脸特征之间的余弦距离，并将余弦距离最小的人脸图像作为与待识别人脸图像相似度最高的人脸。

本发明的卷积神经网是在经典的googlenet(google搭建的一个深度神经网络)及deepid(香港中文大学搭建的一个专门用来做人脸识别的深度神经网络)网络的基础上进行改进，提出了一种全连接层多输入结构(multi-inputsstructure)形式的卷积神经网络，从网络底层提取多层次的人脸特征，提高人脸识别系统的抗噪声性能。卷积神经网络一个实施例的基本结构如图3所示，主要有三层特征提取模块(在图中标注为①、②、③)，分别提取三个不同尺度的人脸特征并在网络最顶端的全连接屋进行融合，具体包括依次连接的卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、卷积层conv31、卷积层conv322、连接层conc1、连接层conc2、池化层pool51、连接层conc3和全连接层fc5，还包括分别连接在池化层pool2与连接层conc1之间的卷积层conv321和卷积层conv323、连接在池化层pool2与卷积层conv321之间的池化层pool3，分别连接在连接层conc1与连接层conc2之间的卷积层conv4和池化层pool4，连接在池化层pool2与连接层conc3之间的池化层pool52，连接在连接层conc1与连接层conc3之间的池化层pool53。其中，上述卷积层主要对人脸图像进行卷积并提取卷积后的人脸特征；池化层对特征图像进行池化，降低特征图像的尺寸，减少网络的参数；连接层起连发连接作用；全连接层用于将数据从特征空间映射到分类器空间，起到分类器的作用，也可看作是一个尺寸为1的卷积层。本发明卷积神经网络的各层参数配置如表2所示：

表2

本发明卷积神经网络的搭建采用caffe工具实现。caffe是一个清晰而高效的深度学习框架，支持命令行、python和matlab接口，网络的训练需要提供一个根据表2编写的网络配置文件train_val.txt及一个solver.prototxt文件，用caffe的训练工具执行训练。train_val.txt及solver.prototxt文件的编写参照caffe工具的标准框架即可，每层的具体结构如表一所示。

表3示出了本发明nr-network与其它噪声鲁棒性算法的对比结果：

表3

表中σ表示测试图片添加的高斯噪声的方差，flbp(模糊lbp算法)，nrlbp(噪声鲁棒的lbp算法)，nrlbp+及nrlbp++均为经典的光照鲁棒性人脸特征提取算法，bn1和bn2是为了验证nr-network的多输入结构而训练的两个参照网络，主体结构与nr-network相同，区别在输入的数量上，bn1有两个输入，bn2只有一个输入。从表3可知，本发明提供的nr-network的人脸识别性能明显优于其他的几种算法，即使噪声污染很严重的情况下仍然能得到较好的人脸识别精度。除此之外，与bn1和bn2的对比结果显示，多输入的结构也有利于更加细致化的特征提取。

综上，本发明在pc端和手持终端均可以实现人脸特征的提取，并且有效的克服了人脸识别中的两个挑战，即图像采集中光照不均匀变化和图像传输过程中产生的噪声对人脸识别算法性能带来的影响。此外，本发明根据匹配数据库的大小分别采用不同的人脸识别方式，在识别速度方面及准确率方面都有了很大程度的提升。特别是对于一些数据量比较大的数据库，在识别速度方面的优势将会更加的明显。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。本发明中未尽详述的内容为本领域公知的内容。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁园园;王艳;刘华巍;常玉超;李宝清;袁晓兵
技术所有人：中国科学院上海微系统与信息技术研究所
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。