用于人脸识别的网络构建方法、识别方法及系统的制作方法_4

文档序号:9376214阅读:来源:国知局
,根据实际需要,最后连接至H n层,得到一个hn维 的特征向量。层与层之间的连接的具体计算可由公式(1)得到。
[0121] 这个hn维的特征向量即是重建网络的输出,也即重建特征向量。重建特征向量剔 除了人脸原始特征向量中对年龄估计无效的冗余信息,减少了部分噪声干扰,能够较好的 刻画人脸的低层、全局特征。
[0122] 步骤2-2-3)、联合表决层和输出:联合提取的高层特征和低层特征进行最终的年 龄估计,输出年龄预测值(多少岁)。
[0123] 将提取得到的高层特征图连接至一个含有M个神经元的全连接层,得到一个M维 的高层特征向量。然后高层特征向量与重建特征向量连接在一起构成联合表决层。假设重 建特征向量为匕维,那么两者联合在一起即构成一个含有(M+h n)个神经元的联合表决层。 联合表决层的输出即是我们整个网络提取到的多特征结构的(M+hn)维特征向量。
[0124] 联合表决层再全连接到最终的输出神经元。输出神经元有S个(每一个对应一 岁)。输出层仍然采用sigmoid函数激活,那么每一类的概率可表示为公式(2)。因为整个 网络的每次输入多张图片(参数训练部分会有相应说明),故本发明定义的网络的输出矩 阵形式可表示为公式(3)。
[0125] 考虑到两种特征对最后结果的影响,在表示低层特征的重建特征向量中加入一个 调节权重β,〇< β < 1,进行调节,低层特征对最终结果的判定的影响得到一定程度的抑 制。则最终网络输出可由公式(4)得到。
[0126] 步骤2-2-4)、采用训练方法获取参数Wl、w2、b和β的最终取值:人工神经网络, 深度学习的基本理论分为网络的设计和网络中参数的训练两部分。当设计好网络的结构后 (即获得上述高层特征、低层特征、及判决公式),需要训练确定网络中每一个参数的值(即 确定%、w 2、b和β的值,以及卷积层和下采样层中的参数的值,人工神经网络中L层中的 各神经元的参数的值),然后才能使用该网络对待识别的人脸图片进行实际的分类和回归 等应用。
[0127] 所述训练方法采取误差反向传播算法,同时考虑到深度学习需要大量训练样本支 持,为减少计算负荷,结合随机梯度下降策略进行训练。将所有T张训练图片随机划分为若 干组,且每B张一组(Β要能够整除Τ),共"Τ/Β"组。按顺序将所有"Τ/Β"组输入上述设计 好的网络中,进而提取高层特征低层特征并进行性别判决后,完成一次训练迭代;然后重新 将所有T张训练图片随机划分为若干组,仍然是每B张一组,共"Τ/Β"组。每次都是随机划 分,确保每次划分后每一组的图片与上一次都不相同,仍然按顺序将所有"Τ/Β"组输入上述 设计好的网络中,进而提取高层特征低层特征并进行性别判决后,完成新的一次训练迭代。 总共进行E次训练迭代才能最终获得参数 Wl、w2、b和β的取值。更新参数Wl、w2、b的具体 过程如下:
[0128] 首先,随机初始化参数Wl、w2、b和β的取值,再输入第一组训练图片得到最后的判 决结果〇,〇中每一列表示一个样本的判决输出结果。然后使用公式(5)计算出输出层的误 差。需要注意的是,在年龄估计中,公式(5)中的样本标签矩阵Y为S维向量形式,如果输 入人脸图片对应的年龄是1岁,那么Y则为[I 0 ... 0]τ;如果年龄是2岁,Y为[0 1 ... 0]τ;如果是S岁,则为[0 0 ... 1]τ。
[0129] 然后,利用公式(5)得到的误差可以计算出公式(4)中的参数Wl,w2,b以及β对 于最终的误差函数J(W,b;i3)的梯度,利用梯度下降原理更新上述参数 Wl,w2, b以及β的 值。其中误差函数J(W,b;i3)的矩阵形式即为MSE。为此,需计算输出层的灵敏度,可有公 式(6)得到。根据灵敏度,采用公式(7),公式(8)和公式(9)可进一步求出参数Wl,W2以 及偏置b的值,即对 Wl,W2以及偏置b进行更新。
[0130] 由于β是一个实数,采取梯度下降法更新β时,可利用公式(10)求出更新后的 β的值。误差函数对β求偏导的式子可由链式规则进一步通过公式(11)转化。最后,β 与矩阵(w2*lfo)相乘可看作一个与矩阵相同行列数的矩阵A与矩阵(w2*lfo)点乘,其中A 中元素值全都为β。这样,公式(11)最终可化为公式(12),从而计算出β的更新值。
[0131] 总之利用误差反向传播算法,可完成公式(4)中的网络参数Wl,w2, b以及β的 更新。整个网络中还包括卷积层中的参数,下采样层中的参数以及L层人工神经网络中的 参数需要通过训练确定它们的值,所使用方法仍然是误差反向传播算法。继续将误差MSE 向前传播,此时联合表决层一部分与高层特征提取部分相连,一部分与重建网络相连,那么 MSE分为两部分误差,分别在这两个模块中继续向前传播。在高层特征提取部分的误差反向 传播过程中,直接采用现有深度学习技术中的卷积层和下采样层误差反向传播更新参数的 方法,更新卷积层和下采样层中的参数ICS} ({CS}表示卷积层和下采样层中所有参数的矩 阵集合)的值。在低层特征提取部分的误差反向传播过程中,直接采用现有人工神经网络 技术中的误差反向传播更新参数的方法,更新L层人工神经网络中的参数{LN} ({LN}表示L 层人工神经网络中所有参数的矩阵集合)的值。这样就完成了一组图片的参数训练过程, 接着输入第二组图片训练时,以第一组图片确定的网络参数WpW 2, b和β的值,以及{CS} 和{LN}的值计算判决结果〇,然后重复误差反向传播过程,更新网络中Wl,w 2,b和β值,以 及{CS}和{LN}的值。以此类推,每一组图片的训练以上一组图片训练后确定的参数的值计 算判决结果,然后从输出开始计算误差并反向传播至输入,更新整个网络所有的参数的值。 直到"Τ/Β"组训练样本全部输入网络完成训练后,才完成一次训练迭代。
[0132] 当完成所有E次训练迭代后,此时的网络即可用于实际的年龄估计,输入人脸图 片,网络就会输出年龄的估计值。
[0133] 上述公式(3)、(4)、(7)、(8)、(10)、(12)是本发明提出的新的公式。
[0134] 三,基于上述构建网络进行人脸年龄估计和性别识别:
[0135] 当采用上述方法构建得到性别识别网络和年龄估计网络后,将待识别的图片输入 已经构建的网络中进行性别识别或年龄估计,具体的识别过程为:
[0136] 基于卷积神经网络提取待识别人脸图片的高层特征;
[0137] 基于人工神经网络提取待识别人脸图片的低层和全局特征;
[0138] 将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输 出判决结果:
[0139] 〇 = sigm(W1^hfo+β Xw2*lfo+b)
[0140] 其中,上述公式中的第一权值矩阵W1、第二权值矩阵w2、β和b为完成针对训练图 片的若干次迭代后获取(即上述网络构建完成时得到的各参数的最终取值),hfo表示提取 的待识别人脸的高层特征向量,IfO表示提取的待识别人脸的低层特征向量,O表示性别或 年龄的判决结果。
[0141] 低层特征提取进一步包含:
[0142] 将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向 量;
[0143] 将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建, 得到一个L f维的特征向量作为提取的低层特征向量。
[0144] 具体的判决过程为:
[0145] 融合提取到的高层特征和低层特征,输出一种多特征结构;采用若干输出神经元 进行性别判决或年龄判决,所述的各个神经元基于所述判决公式进行判决。
[0146] 本发明还给出了一种基于多特征深度学习的人脸分析方法具体实施的系统实例, 如图3所示。其中图3中的"人脸检测和图片预处理"直接采用现有技术手段实现,人脸检 测基于标注点检测评分结合人脸局部区域验证的方法实现;图片预处理包括彩色图片的灰 度化处理,图片大小调整以及图片直方图均衡化处理。经过预处理后系统对人脸图片采用 如下策略进行识别:
[0147] 高层特征提取模块,用于基于卷积神经网络提取待识别人脸图片的高层特征;
[0148] 低层特征提取模块,用于基于人工神经网络提取待识别人脸图片的低层和全局特 征;
[0149] 判决模块,用于将提取的低层特征和高层特征输入如下的判决公式,进行性别或 者年龄判决,输出判决结果:
[0150] 〇 = sigm(W1^hfo+β Xw2*lfo+b)
[0151] 其中,上述公式中的第一权值矩阵W1、第二权值矩阵《2、β和b为完成针对训练图 片的若干次迭代后获取(即上述网络构建完成时得到的各参数的最终取值),hfo表示提取 的待识别人脸的高层特征向量,Ifo表示提取的待识别人脸的低层特征向量,〇表示性别或 年龄的判决结果。
[0152] 上述低层特征提取模块进一步包含:
[0153] 扁平化处理模块,用于将输入的待识别的人脸图片进行扁平化处理并归一化后, 得到人脸的原始特征向量;
[0154] 重建特征向量获取模块,用于将原始特征
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1