用于人脸识别的网络构建方法、识别方法及系统的制作方法_5

文档序号:9376214阅读:来源:国知局
向量输入人工神经网络,通过多层神经 元结构对输入向量进行重建,得到一个L f维的特征向量作为提取的低层特征向量。
[0155] 上述判决模块进一步包含:
[0156] 联合表决层模块,用于融合提取到的高层特征和低层特征,输出一种多特征结构; 到输出层进行最终的性别或年龄的判决。
[0157] 输出层模块,用于采用若干输出神经元进行性别判决或年龄判决,所述的各个神 经元基于所述判决公式进行判决。
[0158] 总之,本发明提供了一种基于多特征深度学习的人脸分析方法及系统。该系统首 先对图片进行人脸检测和预处理得到人脸图片,然后对人脸图片进行分析。人脸分析具体 包括人脸性别识别和人脸年龄估计。系统设计并训练好了两个深层的网络分别用于人脸性 别识别和人脸年龄估计,将人脸图片作为网络的输入,经过高层特征的提取,低层特征的提 取以及融合特征后的联合判决,两个深层网络最后分别输出人脸图片的性别预测值和年龄 估计值。本系统有效的提高了性别分类的准确率和降低了年龄估计的平均绝对误差,同时 系统具有较强的泛化能力,能在低质量的网络图片和摄像头实际采集的图片上表现出良好 的性能。
[0159] 上述技术方案中的黑体的变量表示矩阵。
[0160] 最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参 照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方 案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明 的权利要求范围当中。
【主权项】
1. 一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含: 步骤101)将所有的训练图片划分为若干组; 步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向 量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而 得到低层特征向量组成的第二矩阵; 基于提取的第一矩阵、第二矩阵和如下判决公式得到一组性别识别或者年龄估计的结 果: 〇 =sigm(w1*hfo+^Xw2*lfo+b) 其中,hfo表示第一矩阵;lfo表示第二矩阵;针对第一组训练图片上述公式中的第一 权值矩阵^、第二权值矩阵《2、偏置矩阵b和调节权重0的初值采用随机初始化方式获得; 针对输入的其余各组的训练图片上述公式中的Wl、W2、b和0的值的获取方法为:利用误差 反向传播算法计算判决结果0与各组训练图片的实际标签矩阵Y的误差函数J(W,b邛), 再通过计算w^w^b和@对误差函数J(W,b;P)的梯度进而更新参数w^w^b和@的值; 步骤103)再输入一组训练图片,并对再次输入的训练图片重复执行上述步骤102),直 至所有的分组均被进行了步骤102)的处理,完成一次训练迭代; 步骤104)将所有的训练图片重新划分为若干组,并对重新划分的各组重复执行上述 步骤102)和步骤103),完成再次迭代; 经过若干重新分组和迭代处理,直至最终输出的判决〇满足设定的条件时,得到最终 的参数Wi、W2、b和3的值,完成网络构建。2. 根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征 在于,进行低层特征提取时进一步包含: 步骤102-11)将输入的一组训练图片的每一张训练图片由二维的图结构形式转化为 向量的形式,再对向量进行归一化,得到每一张训练图片的原始特征向量; 步骤102-12)将得到的每一张训练图片的原始向量输入人工神经网络,进而得到一组 重建特征向量,即得到所述的第二矩阵;其中,所述人工神经网络包含L层,且层与层之间 采用全连接方式,每一层的各神经元采用sigmoid函数激活。3. 根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征 在于,针对一张输入训练图片的性别或年龄识别过程具体包含: 步骤102-21)当提取的一张训练图片的高层特征向量为Hf维的高层特征向量,且低层 特征向量为Lf维的特征向量时,构造一个包含"Hf+Lf"个神经元的联合表决层; 步骤102-22)当用于性别识别时,将构造的联合表决层的各个神经元分别与输出层的 两个输出神经元相连,且每个输出神经元基于所述判决公式进行性别判别,输出训练图片 为男性或女性的概率;当用于年龄估计时,联合表决层的各个神经元与输出层的S个输出 神经元相连,其中每个输出神经元对应一岁。4. 根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征 在于,采用如下公式的误差反向传播算法更新第一权值矩阵Wl的值:其中,(Wl)_表示在每一次的误差反向传播时更新后的第一权值矩阵Wl的值, 对应更新前的第一权值矩阵Wi的值,Od表示输出层灵敏度矩阵;a表示网络的学习率; 通过如下公式更新第二权值矩阵w2的值:其中,(w2)_表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w丄^寸 应更新前的第二权值矩阵的值。5. 根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征 在于,所述0的值在每一次训练迭代中更新方法为:其中,0_表示在每一次的误差反向传播时更新后的调节权重0的值,0^对应更新 前的调节权重0的值; 上述公式中求偏导的部分可由如下公式得到:其中,f' (〇)表示对判决结果〇求导,"mean(B(:))"表示对矩阵B中所有元素取平均 值运算;矩阵B表示由在每一次的误差反向传播时更新后的调节权重0的值构成的矩阵, 且该矩阵B的行列数与判决结果〇的行列数相同。6. -种用于人脸的年龄或性别的识别方法,该方法基于权利要求1-5中任意一条权利 要求记载的构建网络最终确定的第一权值矩阵Wl、第二权值矩阵《2、0和b的值,所述方法 包含: 用于基于卷积神经网络提取待识别人脸图片的高层特征; 用于基于人工神经网络提取待识别人脸图片的低层和全局特征; 用于将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输 出判决结果: 〇= sigm(w1*hfo+^ Xw2*lfo+b) 其中,上述公式中的第一权值矩阵%、第二权值矩阵w2、0和b为深层网络构建方法确 定的值,hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特 征向量,〇表示性别或年龄的判决结果。7. 根据权利要求6所述的用于人脸的年龄或性别的识别方法,其特征在于,采用如下 步骤提取低层特征: 用于将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向 量; 用于将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建, 得到一个Lf维的特征向量作为提取的低层特征向量。8. -种用于人脸的年龄或性别的识别系统,其特征在于,所述系统包含: 高层特征提取模块,用于基于卷积神经网络提取待识别人脸图片的高层特征; 低层特征提取模块,用于基于人工神经网络提取待识别人脸图片的低层和全局特征; 基于神经网络的判决模块,用于将提取的低层特征和高层特征输入如下的判决公式, 进行性别或者年龄判决,输出判决结果: 〇= sigm(w1*hfo+^ Xw2*lfo+b) 其中,上述公式中的第一权值矩阵Wl、第二权值矩阵w2、0和b为完成针对训练图片的 若干次迭代后获取,hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人 脸的低层特征向量,0表示性别或年龄的判决结果。9. 根据权利要求8所述的人脸的年龄或性别的识别系统,其特征在于,所述低层特征 提取t吴块进一步包含: 扁平化处理模块,用于将输入的待识别的人脸图片进行扁平化处理并归一化后,得到 人脸的原始特征向量; 重建特征向量获取模块,用于将原始特征向量输入人工神经网络,通过多层神经元结 构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。10. 根据权利要求8所述的人脸的年龄或性别的识别系统,其特征在于,所述判决模块 进一步包含: 联合表决层模块,用于融合提取到的高层特征和低层特征,输出一种多特征结构; 输出层模块,用于采用若干输出神经元进行性别判决或年龄判决,所述的各个神经元 基于所述判决公式进行判决。
【专利摘要】本发明提出了一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:步骤101)将所有的训练图片划分为若干组;步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;基于提取的第一矩阵、第二矩阵和定义的判决公式得到一组性别识别或者年龄估计的结果;其中定义的判决公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的值利用误差反向传播算法更新,获得这些参数的最终取值,完成网络构建。基于网络构建完成时确定的参数的值确定的判决公式进行待识别人脸的年龄和性别的判决。
【IPC分类】G06N3/02, G06K9/00, G06K9/66
【公开号】CN105095833
【申请号】CN201410193260
【发明人】李松斌, 蒋雨欣, 刘鹏, 戴琼兴, 邓浩江
【申请人】中国科学院声学研究所
【公开日】2015年11月25日
【申请日】2014年5月8日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1