一种复杂环境下基于t分布的人脸快速识别方法与流程

文档序号:11620939阅读:260来源:国知局

本发明涉及人工智能领域,尤其是涉及一种复杂环境下基于t分布的人脸快速识别方法。



背景技术:

人脸识别作为智能识别领域中的应用,根据人脸特有的生物特征信息,结合图形图像处理技术和模式识别技术来对人的身份进行识别鉴定,安全性及可靠性较高因此拥有强烈的市场需求,近几年来在门禁与考勤、网络安全、海关边检、物业管理、智能身份识别、驾照证检验、计算机系统登录等方面已有相应发展。

为了实现识别算法的最优性能,近年来的研究已经清楚地认识到,人脸识别领域仍存在着一些重要挑战,相比较已经取得可靠结果的人脸检测、特征点定位等,人脸识别属于较复杂的人脸分析实验,不应该仍在过于简单的数据集上进行实验。应该考虑复杂情况并保证多样性干扰,各复杂因素所占比例均等的情况,同时要能解决简单数据集中也可能存在的问题。鉴于目前的挑战,以及深度学习过程中对数据的大量需求,主要困难就是缺乏在未约束环境下的数据集。因此在人脸识别方法的长远发展中,应该考虑影响因素混杂的复杂环境下,尤其是同时在数据集有限的条件下,如何提高识别性能才是当前发展的难点。

纵观深度学习的发展,基于卷积神经网络优化而来的算法,目前主要流行的发展方向是基于四个方面:增加网络的深度、宽度;增大数据量;隐藏层联立;添加其他信号,要利用神经网络发挥其作用,应该针对适用背景选择具体方面进行改进和优化。在网络结构趋向复杂的同时,必然对计算复杂度和时间复杂度产生影响,因此还存在着效率和性能难以两全的难题。



技术实现要素:

本发明的目的是针对上述问题提供一种复杂环境下基于t分布的人脸快速识别方法。

本发明的目的可以通过以下技术方案来实现:

一种复杂环境下基于t分布的人脸快速识别方法,所述方法包括样本训练步骤和人脸识别步骤,所述样本训练步骤具体为:

a1)通过卷积神经网络,对训练样本进行特征提取,得到特征样本(x1,x2,…,xn);

a2)通过t分布非线性投影,将特征样本投影至低维空间,得到低维空间的训练样本(y1,y2,…,yn)和降维路径参数;

所述人脸识别步骤具体为:

b1)通过卷积神经网络,对待识别图片进行特征提取,得到待识别图片的特征样本r;

b2)根据步骤a2)的降维路径参数,将步骤b1)提取的待识别图片的特征样本r投影至低维空间,得到低维空间的测试样本s;

b3)通过分类器将步骤a2)得到的低维空间的训练样本(y1,y2,…,yn)和步骤b2)得到的测试样本s进行分类识别,得到识别结果。

所述步骤a1)具体为:

a11)对训练样本进行预处理,得到预设大小的输入图像;

a12)将步骤a11)得到的输入图像通过卷积层,得到具备局部信息表达的特征样本;

a13)对步骤a12)得到的具备局部信息表达的特征样本通过联立层,得到特征样本(x1,x2,…,xn)。

所述步骤a13)具体为:

a131)对步骤a12)得到的具备局部信息表达的特征样本进行联立卷积,得到基于全局的特征样本;

a132)对步骤a131)得到的基于全局的特征样本通过relu进行线性修正,得到修正后的特征样本;

a133)对步骤a132)得到的修正后的特征样本通过dropout进行输出的稀疏化处理,得到特征样本(x1,x2,…,xn)。

所述步骤a1)还包括:对得到的特征样本进行pca降维,得到初始维度下的特征样本。

所述步骤a2)具体为:

a21)记录初始循环次数为0,随机初始化低维空间中的对应点集(y1,y2,…,yn),根据高斯分布计算特征样本中的点xi间的相似度矩阵p;

a22)根据步骤a21)得到的相似度矩阵p,结合t分布计算得到权重gains(iter)和相似度总值nums,并计算增量incs,根据增量更新低维空间中对应点yi的值,并对循环次数加1;

a23)判断循环次数是否达到预设次数,若是则结束循环,得到低维空间的训练样本(y1,y2,…,yn)、权重gains(iter)和相似度总值nums,若否则返回步骤a22)。

所述步骤a22)具体为:根据t分布计算低维空间中的对应点yi间的相似度矩阵q,根据定义的代价函数在相似度矩阵p、q间的kl距离建立惩罚机制,求yi求偏导得到对应的梯度,根据梯度的最优解在点yn更新权重gains(iter),根据相似度矩阵q中所有相似度之和更新相似度总值nums,计算增量incs,根据增量incs更新低维空间中对应点yi的值,并对循环次数加1。

所述定义的代价函数具体为:

其中,pij为点xi和点xj之间的相似度,qij为点yi和点yj之间的相似度,p为高维空间原点间的相似度矩阵,q为低维空间映射点间的相似度矩阵。

所述根据增量incs更新低维空间中的对应点yi的值具体为:

yi=yi+incs。

所述步骤b2)具体为:

b21)记录初始循环次数为0,随机初始化低维空间中的对应点s,根据高斯分布计算待测特征样本r与训练样本原点xi间的相似度矩阵r;

b22)根据t分布计算待测特征样本s与训练样本映射点yi间的相似度矩阵s,根据步骤a22)中记录的权重gains(iter)和相似度总值nums,更新增量incs',根据增量incs'更新低维空间中的对应点si的值,并对循环次数加1;

b23)判断循环次数是否达到预设次数,若是则结束循环,得到低维空间的测试样本(s1,s2,…,sn),若否则返回步骤b22)。

所述t分布计算的自由度为9。

与现有技术相比,本发明具有以下有益效果:

(1)通过将非线性降维方法融入到卷积神经网络中,对高维深度特征进行降维,从而实现降维后的特征样本的简化,降低计算量的同时也可以加速后续分类识别的效率。

(2)t分布具有聚类特性,可以与卷积神经网络的联立层连接,学习深度特征子空间中仍存在的线性不可分结构,并将局部线性不可分结构通过流行学习的方法映射至线性可分的低维子空间中,实现更优于高维空间的聚类效果,在卷积神经网络的基础上优化了人脸识别的性能,提高识别精度,从而提供更具可识别特性的人脸特征信息。

(3)人脸识别步骤中按照样本训练步骤中得到的路径进行降维,与训练样本的降维过程一致,实现了仅针对待测样本的局部映射迭代,降低了时间复杂度,从而提高了整个待测图片的识别过程中的灵活性和快速性。

(4)在利用t分布对训练样本和待识别图片进行降维之前,首先通过pca降维至训练特征样本数,在对数据规范化的基础上降低了后续降维的计算复杂程度,保证了后续迭代过程的速度。

(5)利用t分布非线性投影将高维空间的特征映射至低维空间上,同时不断进行迭代更新映射结果,增强了映射的准确程度,从而增强了识别精度。

(6)根据实验表明,采取自由度为9的t分布计算实现降维,实现的降维效果最优,继而对应的识别效果也为最优。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

复杂环境下基于t分布的人脸快速识别方法的流程图如图1所示。该方法包括样本训练步骤和人脸识别步骤,样本训练步骤具体为:

a1)通过卷积神经网络,对训练样本进行特征提取,得到特征样本(x1,x2,…,xn):

a11)对训练样本进行预处理,得到预设大小的输入图像;

a12)将步骤a11)得到的输入图像通过卷积层,得到具备局部信息表达的特征样本;

a13)对步骤a12)得到的具备局部信息表达的特征样本通过联立层,得到特征样本(x1,x2,…,xn):

a131)对步骤a12)得到的具备局部信息表达的特征样本进行联立卷积,得到基于全局的特征样本;

a132)对步骤a131)得到的基于全局的特征样本通过relu进行线性修正,得到修正后的特征样本;

a133)对步骤a132)得到的修正后的特征样本通过dropout进行输出的稀疏化处理,得到特征样本(x1,x2,…,xn);

上述步骤完成后,还可以对得到的特征样本进行pca降维,得到初始维度下的特征样本;

a2)通过t分布非线性投影,将特征样本投影至低维空间,得到低维空间的训练样本(y1,y2,…,yn)和降维路径:

a21)记录初始循环次数为0,随机初始化低维空间中的对应点集yi,根据高斯分布计算原点xi间的相似度矩阵p;

a22)根据自由度为9的t分布计算低维空间中映射点yi间的相似度q,根据定义的代价函数更新权重gains(iter)和样本总值nums,计算增量incs,根据增量incs更新低维空间中的对应点yi的值,并对循环次数加1;

a23)判断循环次数是否达到预设次数,若是则结束循环,得到低维空间的训练样本(x1,x2,…,xn)、权重gains(iter)和样本总值nums,若否则返回步骤a22);

其中,定义的代价函数具体为:

其中,pij为点xi和点xj之间的相似度,qij为点yi和点yj之间的相似度,p高维空间原点间的相似度矩阵,q为低维空间映射点间的相似度矩阵;

根据增量incs更新低维空间中的对应点yi的值具体为:

yi=yi+incs

人脸识别步骤具体为:

b1)通过卷积神经网络,对待识别图片进行特征提取,得到待识别图片的特征样本r;步骤b1)还包括:对提取的待识别图片的特征进行pca降维,得到初始维度下的待识别图片的特征;

b2)根据步骤a2)的降维路径,将步骤b1)提取的待识别图片的特征样本r投影至低维空间,得到低维空间的测试样本s:

b21)记录初始循环次数为0,随机初始化低维空间的映射点s,根据高斯分布计算待测特征样本r与训练样本原点xi间的相似度矩阵r;

b22)根据自由度为9的t分布计算待测特征样本s与训练样本映射点yi间的相似度矩阵s,根据步骤a22)中记录的权重gains(iter)和样本总值nums,更新增量incs',根据增量incs'更新低维空间中的对应点s的值,并对循环次数加1;

b23)判断循环次数是否达到预设次数,若是则结束循环,得到低维空间的测试样本s,若否则返回步骤b22);

b3)通过分类器将步骤a2)得到的训练样本和步骤b2)得到的测试样本通过softmax进行分类识别,得到识别结果。

上述步骤中,一般仅需要经历一次样本训练步骤,之后即可根据训练的结果来进行多次的人脸识别步骤。

根据上述步骤进行具体的人脸识别,过程如下:

s1)输入n张人脸图像,已处理为256×256的彩色图像规格,若为训练集则按类别属性整理至不同子文件内,若为测试集则无需整理,然后执行步骤s2)。

s2)人脸图像经过5个卷积层的处理,包括了前两个(s1,relu,s2,relu,c)顺序的卷积层,以及后三个(s1,relu,s2,relu,s3,relu,c)顺序的卷积层。其中在卷积s层:f(x)=fl((…f2(f1(i;w1);w2)…);wl)过程中,通过滤波器fi将输入ii与权重向量wi结合,得到在隐藏层中学习到的图像特征信息ii+1并作为下一层的输入。同时利用relu激励函数max(0,x),随机将部分隐藏层置于非激活状态,减少权值参数间相互作用缓解过拟合情况的发生。而池化c层则选择最大池化方式max{f(x'):i≤i'<i+p,j≤j'<j+p},以步长为p将池化区域内的最大值作为输出,提高特征信息的泛化能力。

s3)将所提取的特征进行联立卷积,得到基于全局的特征信息,结合relu激励函数处理后,利用dropout技术的稀疏特性进行再处理,得到高维空间的特征样本

s4),将高维空间的特征样本用pca降维至初始维度e=30:

s5)针对不同数据集选择模式,若选择路径记录模式,执行步骤s6);若选择路径跟踪模式,执行步骤s7);

在步骤s6)中,选择路径记录模式,根据欧式距离及复杂度为e的高斯分布构建pi间相似矩阵p,初始化xi的映射点yi并进入iter=1000的迭代过程,根据自由度为9的t分布构建相似矩阵q,利用相似矩阵p、q之间的kl距离定义代价函数:为取得最小距离利用求梯度根据最小距离的梯度解更新权重gains(iter)并计算增量incs,同步映射点yi=yi+incs,同时记录降维过程中的权值gains和映射点总值nums,当iter=1000完成迭代后得到低维空间的训练集特征样本(y1,y2,…,yn)∈rf

s7)选择路径跟踪模式,将测试样本r与训练样本(x1,x2,…,xn)联立,并根据欧式距离及复杂度为e的高斯分布构建相似向量r,初始化r的映射点s并进入iter=1000的局部迭代过程,根据自由度v=9的t分布构建s与的相似向量s,根据映射点总值nums求最小kl距离的解及对应梯度值,再结合所记录的权重gains(iter)更新增量incs,同步映射点s=s+incs,同时记录降维过程中的权值gains和映射点总值nums。将所记录的参数矩阵gains和nums作为输入,最终iter=1000完成迭代得到

s8)将训练样本和测试样本放入softmax分类器中分类识别。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1