基于非平衡标签信息融合的人脸识别算法架构的制作方法

文档序号：9922281阅读：377来源：国知局

基于非平衡标签信息融合的人脸识别算法架构的制作方法
【技术领域】
[0001] 本发明涉及计算机生物特征识别领域，具体涉及一种基于非平衡标签信息融合的人脸识别算法架构。
【背景技术】
[0002] 随着深度学习理论的逐步成熟和有标签人脸数据的大量增加，越来越多的人脸识别算法选择使用深度学习，从而使得近几年人脸识别算法的性能大幅提升。然而这类方法面临两个问题：（1)多数基于深度学习的人脸识别算法需要大规模有标签数据，同时也要求数据具备多样性，例如包含多个种族、不同姿态、多种来源和不同光照等。如何获得带有标签信息的人脸数据成为提升人脸识别性能的瓶颈。随着传感器的大量使用，每天都会产生海量数据，完成这些数据的标定工作将耗费大量人力物力，代价巨大，从而导致大量无标签数据无法在实际应用中充分发挥作用。（2)在现有数据规模和计算资源的条件下，由于用于训练的数据规模和多样性都达不到要求，所以经常会出现过学习现象，导致得到的模型泛化能力不佳，只能在一些场景下取得不错的性能，一旦切换场景，性能会出现明显下降。
[0003] 基于无监督学习的算法能够一定程度上解决上述问题。（1)无监督学习算法不需要有标签信息的数据，所以没有数据标定任务。（2)由于没有标签信息的约束，无监督学习方法出现过学习的几率较小，对于多种场景的适应性也较强。然而，正是因为没有标签信息约束，无监督学习方法普遍存在针对性不强的问题，导致在实际应用时性能不佳，所以这类方法目前主要还处于研究阶段。

【发明内容】

[0004] 监督学习人脸识别算法(使用标签信息）和无监督学习人脸识别算法(不使用标签信息)有着各自的优势和缺点，任意一种都无法保证所开发的算法兼具优秀的泛化性能和辨识能力，本发明旨在提出一种基于非平衡标签信息融合的人脸识别算法架构，结合监督学习人脸识别算法和无监督学习算法各自的优势，充分发挥海量无标签数据的作用，从而使算法既能够在特定场景下具备优秀的识别能力，又可以适应不同场景。
[0005] 为了实现上述目的，本发明采用如下技术方案：
[0006] 基于非平衡标签信息融合的人脸识别算法架构，包括如下两层架构：
[0007] L1先进行监督步骤:将有标签的人脸数据和对应的标签信息作为输入，利用监督学习算法得到初始化人脸识别模型一;然后以所述初始化人脸识别模型一为输入，采用无监督方法训练一定量的无标签人脸数据得到最终的人脸识别模型一:先预测所述无标签人脸数据的标签信息，然后以所述无标签人脸数据和预测出的标签信息更新模型参数，按此进行多次迭代；
[0008] L2先随机初始化模型参数得到初始化人脸识别模型二，然后对所述初始化人脸识别模型二按照L1的无监督方法进行训练得到优化后的人脸识别模型二;然后对于优化后的人脸识别模型二输入有标签的人脸数据和对应的标签信息，利用监督学习算法继续训练，得到最终的人脸识别模型二；
[0009] 融合L1中最终得到的人脸识别模型一和L2中最终得到的人脸识别模型二即可得到最终的人脸识别模型。
[0010] 需要说明的是，L1中，以所述初始化人脸识别模型一为输入，采用无监督方法训练一定量的无标签人脸数据得到最终的人脸识别模型一:先预测所述无标签人脸数据的标签信息，然后以所述无标签人脸数据和预测出的标签信息更新模型参数，按此进行多次迭代的具体方法为：
[0011] 将所述初始化人脸识别模型一作为输入，固定模型参数，利用聚类算法预测无标签人脸数据的标签信息，然后将所述无标签人脸数据和预测出的标签信息作为输入，更新所述初始化人脸识别模型一的模型参数；
[0012] 此后每次迭代中，均将前一次迭代后的模型作为输入，在固定模型参数的条件下利用聚类算法预测无标签人脸数据的标签信息，然后将所述无标签人脸数据和预测出的标签信息作为输入，更新本次迭代中作为输入的模型的模型参数；
[0013] 如此经过多次迭代后，得到最终的人脸识别模型一。
[0014] 需要说明的是，L1中，采用卷积神经网络作为监督学习算法。
[0015] 进一步需要说明的是，所述卷积神经网络的输入为切分后的人脸图像，使用不同区域和尺度的人脸图像块来进行训练得到初始化人脸识别模型一;所述卷积神经网络最后一层Softmax除了使用Logistic Regression作为识别信号外，还在目标函数上添加了验证信号，通过加权的方式进行组合。
[0016] 更进一步需要说明的是，步骤1.1)中所述识别信号如下式：
[0017] !d(/', i, 0kl) = - ΣΓ=1 -Pi logp： = - log/3,；
[0018] f是由所述卷积神经网络计算得到的向量，t是目标类别，η是类别数，0ld是Softmax 层的参数，Pl是类别i的概率分布，当类别是目标类别tg卩i = t时，pt=l，对于其他任意i，Pl =〇，爲,是类别i的预测的概率分布，则是目标类别t的预测的概率分布；
[0019] 所述验证信号如下式：
[0021 ] f i和f j是两张人脸图像经过所述卷积神经网络计算得到的向量，yij = 1和yij = _1 分别表示两个向量fi和fj来自同一个目标和来自不同目标;上式要求两个向量fi和fj的距离大于m，0ver={ m}是需要从验证信号的约束中学习得到的。
[0022] 需要说明的是，在L1和L2的无监督训练中，当经过迭代计算累计的损失达到收敛条件后，迭代结束；
[0023] 所述经过迭代计算后累计的损失通过下式得到：
[0024] L(y,S|〇 = Σ?^χ^^?Ο；
[0025] 其中，I代表无标签人脸图像，炉是在第t轮计算时的模型参数是第t轮计算时的目标标签信息，T为累计迭代次数，P代表第t次迭代的损失，0和7分别代表经过T次迭代后的得到的模型参数和无标签人脸数据预测得到的标签信息；
[0026] 其中：
[0027] 经过T次迭代后，预测无标签人脸数据的标签信息累计的损失按照下式计算：
[0028] 1{γ\?,θ) =
[0029] 经过Τ次迭代后，利用预测得到的无标签人脸数据的标签信息进行优化模型参数所累计的损失按照下式计算：
[0030] L(0|/,y) =
[0031] 进一步需要说明的是，第t轮迭代计算时的损失计算如下式：
[0033] ￡?表示第t轮迭代计算时图像所属类别为&，/^是第t轮计算时图像所属类别匕的KC个近邻，以降序方式标号，代表类别匕的以个近邻中的最近邻，A( ·)是相似度计算函数;在第t轮迭代时，上式第一项表示的是匕与其最近邻之间的距离，第二项则考虑到了多个近邻的局部结构信息，要求最近邻与匕尽量地相似，同时排名靠后的近邻与G的相似度要尽量小，γ表示权重。
[0034]本发明的有益效果在于：
[0035] 1、L1最终生成的人脸识别模型一由于后续训练中加入了无标签人脸数据，并且采用了交替优化的策略，使得之前用有标签数据训练得到模型的参数发生变化，在降低了模型对有标签数据的针对性的同时提升了泛化能力，从而让模型具备更

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡杨;仝星;宛根训;李建勇;田强;陈曦;田青;王旭;李萌;
技术所有人：公安部第一研究所;北京中盾安全技术开发公司;
我是此专利的发明人

上一篇：一种融合多光谱遥感数据和夜间灯光遥感数据的城市边界提取方法
上一篇：一种倒塌建筑物提取方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。