基于非平衡标签信息融合的人脸识别算法架构的制作方法

文档序号:9922281阅读:377来源:国知局
基于非平衡标签信息融合的人脸识别算法架构的制作方法
【技术领域】
[0001] 本发明涉及计算机生物特征识别领域,具体涉及一种基于非平衡标签信息融合的 人脸识别算法架构。
【背景技术】
[0002] 随着深度学习理论的逐步成熟和有标签人脸数据的大量增加,越来越多的人脸识 别算法选择使用深度学习,从而使得近几年人脸识别算法的性能大幅提升。然而这类方法 面临两个问题:(1)多数基于深度学习的人脸识别算法需要大规模有标签数据,同时也要求 数据具备多样性,例如包含多个种族、不同姿态、多种来源和不同光照等。如何获得带有标 签信息的人脸数据成为提升人脸识别性能的瓶颈。随着传感器的大量使用,每天都会产生 海量数据,完成这些数据的标定工作将耗费大量人力物力,代价巨大,从而导致大量无标签 数据无法在实际应用中充分发挥作用。(2)在现有数据规模和计算资源的条件下,由于用于 训练的数据规模和多样性都达不到要求,所以经常会出现过学习现象,导致得到的模型泛 化能力不佳,只能在一些场景下取得不错的性能,一旦切换场景,性能会出现明显下降。
[0003] 基于无监督学习的算法能够一定程度上解决上述问题。(1)无监督学习算法不需 要有标签信息的数据,所以没有数据标定任务。(2)由于没有标签信息的约束,无监督学习 方法出现过学习的几率较小,对于多种场景的适应性也较强。然而,正是因为没有标签信息 约束,无监督学习方法普遍存在针对性不强的问题,导致在实际应用时性能不佳,所以这类 方法目前主要还处于研究阶段。

【发明内容】

[0004] 监督学习人脸识别算法(使用标签信息)和无监督学习人脸识别算法(不使用标签 信息)有着各自的优势和缺点,任意一种都无法保证所开发的算法兼具优秀的泛化性能和 辨识能力,本发明旨在提出一种基于非平衡标签信息融合的人脸识别算法架构,结合监督 学习人脸识别算法和无监督学习算法各自的优势,充分发挥海量无标签数据的作用,从而 使算法既能够在特定场景下具备优秀的识别能力,又可以适应不同场景。
[0005] 为了实现上述目的,本发明采用如下技术方案:
[0006] 基于非平衡标签信息融合的人脸识别算法架构,包括如下两层架构:
[0007] L1先进行监督步骤:将有标签的人脸数据和对应的标签信息作为输入,利用监督 学习算法得到初始化人脸识别模型一;然后以所述初始化人脸识别模型一为输入,采用无 监督方法训练一定量的无标签人脸数据得到最终的人脸识别模型一:先预测所述无标签人 脸数据的标签信息,然后以所述无标签人脸数据和预测出的标签信息更新模型参数,按此 进行多次迭代;
[0008] L2先随机初始化模型参数得到初始化人脸识别模型二,然后对所述初始化人脸识 别模型二按照L1的无监督方法进行训练得到优化后的人脸识别模型二;然后对于优化后的 人脸识别模型二输入有标签的人脸数据和对应的标签信息,利用监督学习算法继续训练, 得到最终的人脸识别模型二;
[0009] 融合L1中最终得到的人脸识别模型一和L2中最终得到的人脸识别模型二即可得 到最终的人脸识别模型。
[0010] 需要说明的是,L1中,以所述初始化人脸识别模型一为输入,采用无监督方法训练 一定量的无标签人脸数据得到最终的人脸识别模型一:先预测所述无标签人脸数据的标签 信息,然后以所述无标签人脸数据和预测出的标签信息更新模型参数,按此进行多次迭代 的具体方法为:
[0011] 将所述初始化人脸识别模型一作为输入,固定模型参数,利用聚类算法预测无标 签人脸数据的标签信息,然后将所述无标签人脸数据和预测出的标签信息作为输入,更新 所述初始化人脸识别模型一的模型参数;
[0012] 此后每次迭代中,均将前一次迭代后的模型作为输入,在固定模型参数的条件下 利用聚类算法预测无标签人脸数据的标签信息,然后将所述无标签人脸数据和预测出的标 签信息作为输入,更新本次迭代中作为输入的模型的模型参数;
[0013] 如此经过多次迭代后,得到最终的人脸识别模型一。
[0014] 需要说明的是,L1中,采用卷积神经网络作为监督学习算法。
[0015] 进一步需要说明的是,所述卷积神经网络的输入为切分后的人脸图像,使用不同 区域和尺度的人脸图像块来进行训练得到初始化人脸识别模型一;所述卷积神经网络最后 一层Softmax除了使用Logistic Regression作为识别信号外,还在目标函数上添加了验证 信号,通过加权的方式进行组合。
[0016] 更进一步需要说明的是,步骤1.1)中所述识别信号如下式:
[0017] !d(/', i, 0kl) = - ΣΓ=1 -Pi logp: = - log/3,;
[0018] f是由所述卷积神经网络计算得到的向量,t是目标类别,η是类别数,0ld是Softmax 层的参数,Pl是类别i的概率分布,当类别是目标类别tg卩i = t时,pt=l,对于其他任意i,Pl =〇,爲,是类别i的预测的概率分布,则是目标类别t的预测的概率分布;
[0019] 所述验证信号如下式:
[0021 ] f i和f j是两张人脸图像经过所述卷积神经网络计算得到的向量,yij = 1和yij = _1 分别表示两个向量fi和fj来自同一个目标和来自不同目标;上式要求两个向量fi和fj的距 离大于m,0ver={ m}是需要从验证信号的约束中学习得到的。
[0022] 需要说明的是,在L1和L2的无监督训练中,当经过迭代计算累计的损失达到收敛 条件后,迭代结束;
[0023] 所述经过迭代计算后累计的损失通过下式得到:
[0024] L(y,S|〇 = Σ?^χ^^?Ο;
[0025] 其中,I代表无标签人脸图像,炉是在第t轮计算时的模型参数是第t轮计算时 的目标标签信息,T为累计迭代次数,P代表第t次迭代的损失,0和7分别代表经过T次迭代 后的得到的模型参数和无标签人脸数据预测得到的标签信息;
[0026] 其中:
[0027] 经过T次迭代后,预测无标签人脸数据的标签信息累计的损失按照下式计算:
[0028] 1{γ\?,θ) =
[0029] 经过Τ次迭代后,利用预测得到的无标签人脸数据的标签信息进行优化模型参数 所累计的损失按照下式计算:
[0030] L(0|/,y) =
[0031] 进一步需要说明的是,第t轮迭代计算时的损失计算如下式:
[0033] £?表示第t轮迭代计算时图像所属类别为&,/^是第t轮计算时图像所属类别匕 的KC个近邻,以降序方式标号,代表类别匕的以个近邻中的最近邻,A( ·)是相似度 计算函数;在第t轮迭代时,上式第一项表示的是匕与其最近邻之间的距离,第二项则考虑 到了多个近邻的局部结构信息,要求最近邻与匕尽量地相似,同时排名靠后的近邻与G的相 似度要尽量小,γ表示权重。
[0034]本发明的有益效果在于:
[0035] 1、L1最终生成的人脸识别模型一由于后续训练中加入了无标签人脸数据,并且采 用了交替优化的策略,使得之前用有标签数据训练得到模型的参数发生变化,在降低了模 型对有标签数据的针对性的同时提升了泛化能力,从而让模型具备更
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1