基于三元组诱导的同时选择特征及聚类的人脸识别方法与流程

文档序号:12671025阅读:881来源:国知局
基于三元组诱导的同时选择特征及聚类的人脸识别方法与流程

本发明涉及一种人脸识别技术,尤其是一种可提高识别精确率的基于三元组诱导的同时选择特征及聚类的人脸识别方法。



背景技术:

目前,人脸识别技术已在视频监控、证件验证、刑侦破案等社会生活的诸多方面发挥着巨大作用。常规的人脸识别技术有特征提取、模型训练及聚类三步骤,其中的模型训练过程是同时选择特征及聚类建立模型的训练。

特征选择根据标签是否给出一般分为两个主要类别:监督型和非监督型。监督特征选择的目的在于选择判决特征(因为已经提供了数据的类别标签,这些标签都包含必要的判决信息),然而要想获得标签信息却费时费力,这就使得许多基于特征选择的任务更具有挑战性。非监督特征选择方法得益于在数据中预先定义好的或潜在的几何结构,然而对于很多非监督特征选择方法,不能保持在每个数据点的邻域中含有的拓扑信息(排序局部性,也就是近邻的相对远近程度),只是简单地将距离作为相似性度量来确定每个数据点的近邻,所以在特征选择之后,一个数据点的某些近邻可能会拥有完全相同的距离排序,甚至是与特征选择之前相反的距离排序,这种情况会对基于距离的聚类结果产生不利影响,影响分类的准确率。



技术实现要素:

本发明是为了解决现有技术所存在的上述技术问题,提供一种可提高识别精确率的基于三元组诱导的同时选择特征及聚类的人脸识别方法。

本发明的技术解决方案是:一种基于三元组诱导的同时选择特征及聚类的人脸识别方法,包括特征提取、模型训练及聚类,其特征在于所述特征提取及模型训练按照如下步骤进行:

步骤S1:对获取的n个样本进行预处理,得到中心的像素部分,用随机矩阵对样本进行映射,使每个样本均得到一个对应的随机人脸特征列向量,即n个样本的原始数据矩阵;

步骤S2:基于三元组诱导的求解模型为:

(1)

式(1)中:

是含有n个样本的原始数据矩阵;

是特征选择矩阵;

是标量常数,取值范围;

和是由目标矩阵分解得到的两个新矩阵,即潜在的正交基矩阵和伪标签矩阵,所述,;

所述,D是对角矩阵,第个对角元素等于;

是一个权重矩阵,其位置的元素为

是一个下标集合,对应于的k个最近邻的序号,k为每个样本近邻的数目,是一个反对称矩阵,在位置的元素等于;

步骤S3,基于半二次理论,由式(1)得到需要进行交替最小化的增广函数:

(2)

式中P为存储辅助变量的阶对角矩阵,t为第t次迭代;

交替最小化优化求解目标函数:

a. 保持不变,更新,令关于U的一阶偏导为零,得到零梯度条件,利用正交半非负矩阵分解得到;

b. 保持不变,更新W,在的表达式中,用替代U,然后求解:,利用特征值分解得到W

交替执行上述a、b,直到算法收敛。

本发明借鉴多种非监督特征选择方法在过滤无标记数据的非重要特征的有效性,很好地保持了数据点的排序局部性,将人脸特征信息置于一个同时进行特征选择和聚类的框架下学习,更加有利于后续基于距离的聚类任务,可以在非监督的情况下选出更有判决力的特征,从而获得最佳识别效果,提高了人脸识别的准确率。

附图说明

图1是本发明实施例的流程图;

图2是本发明实施例ORL人脸数据库中的人脸图像举例。

具体实施方式

本发明的流程如图1所示:与现有的人脸识别方法相同,有三个处理环节,分别是特征提取、模型训练及聚类。与现有技术所不同的是本发明的样本特征提取及模型训练按如下步骤进行:

步骤S1:对获取的n个样本进行预处理,得到中心的像素部分,用随机矩阵对样本进行映射,使每个样本均得到一个对应的随机人脸特征列向量,即n个样本的原始数据矩阵;

步骤S2:构造一个由三元组诱导的图,基于三元组诱导的求解模型为:

(1)

式(1)中:

是含有n个样本的原始数据矩阵;

是投影矩阵,即特征选择矩阵;

是标量常数,取值范围;

和是由目标矩阵分解得到的两个新矩阵,即潜在的正交基矩阵和伪标签矩阵,所述,;

所述,D是对角矩阵,第个对角元素等于;

是一个权重矩阵,其位置的元素为

是一个下标集合,对应于的k个最近邻的序号,k为每个样本近邻的数目,是一个反对称矩阵,在位置的元素等于;

上述分类模型增加了对W的正交约束,抑制了选择出的任意两个维度的特征的相似性,正交约束也避免了任意的尺度缩放和全零的平凡解,这使得公式(1)可以选择出更有判决力的特征。

第一部分是基本的特征选择算法模型:

第二部分是保持排序局部性的损失函数。排序局部性(近邻的相对远近程度)描述了数据的局部结构,除了数据点的近邻关系以外,它还强调了每个数据点的近邻的远近排序。对任意数据集,用表示选择的特征组,则给出一个由以及它的近邻和组成的三元组,其对应的选择出来的特征组也构成了一个三元组。设是距离度量,当以下条件成立时,一个特征选择过程就是排序局部性得到保持的:如果,则。

基于此,为每个数据点确定恰当的特征组等价于优化下面的保持排序局部性的损失函数如下:

设是一个权重矩阵,其位置的元素为

用欧式距离表示每个成对距离,上述保持排序局部性的损失函数可以写成的形式,其等价的矩阵表示形式即。

本发明提出的计算权重矩阵的方法是基于三元组的,能同时保持近邻关系和排序信息。计算权重矩阵C后并计算其对应的拉普拉斯矩阵L,其中,D是对角矩阵,第i个对角元素等于。

第三部分是从本分类模型推导出的同时进行特征选择和聚类的一般化框架。一方面,它可以与在映射后的数据上进行K均值聚类有极大的联系;另一方面,它可以与各种基于图的学习方法结合起来。采用基于相似性和最大间隔的图:

当= 0 时,模型(1)等价于同时进行特征选择和K均值聚类;

当时,

或者在每个数据点近邻空间中用其它权重形式计算时,就构造了一个基于相似性的图,利用这种针对每对样本的二元组关系,数据的相似性可以被保持下来;

当时,就构造了一个基于最大间隔的图,利用这种针对每对样本的二元组关系,全局关系得到了保持,最大限度地提高数据整体的可分性,而且能同时保持最小的类内离散度。

本分类模型构造了一个由三元组诱导的图,利用这种针对每个样本的局部邻域的三元组关系,保持了排序局部性。

步骤S3,基于半二次理论,由式(1)得到需要进行交替最小化的增广函数:

(2)

式中P为存储辅助变量的阶对角矩阵,t为第t次迭代;

交替最小化优化求解目标函数:

a.保持不变,更新,令关于U的一阶偏导为零,得到零梯度条件,利用正交半非负矩阵分解得到;

b. 保持不变,更新W,在的表达式中,用替代U,然后求解:,利用特征值分解得到W

交替执行上述a、b,直到算法收敛(达到最大迭代次数)。

基于半二次理论,由式(1)得到需要进行交替最小化的增广函数的具体步骤如下:

初始化W(选择阶单位阵的个不同的列作为,设置t=0),利用半二次技术,使用交替搜索策略,可以通过交替最小化增广函数来优化目标函数。

对于固定的存在一个共轭函数满足,其中是极小化函数确定的辅助变量,则式中P是一个存储辅助变量的阶对角矩阵,是共轭函数。按如下方式交替最小化增广函数:

其中t代表第t次迭代,

交替最小化优化求解目标函数具体步骤如下:

S31,对于训练集中的人脸特征,保持W不变,更新,而正交半非负矩阵分解问题等价于K均值聚类,使用正交半非负矩阵分解的方法更新,令关于U的一阶偏导为零,得到零梯度条件;

S32,保持不变,更新W,在的表达式中,用替代U,然后求解

通过对进行特征值分解可得到上式的解,最优的W由个最小特征值对应的个特征向量组成。

为了详细说明本发明具体实施方式及验证本发明的有效性,将本发明提出的方法应用于一个公开的人脸图像库,即ORL数据库。该数据库包含40个人的400张黑白图像。这些图像中的人脸姿态,光照,遮挡度各异,充分模拟了实际环境。图2展示了本实验所使用的图像,采用由20个男人20个女人的400张图片构成的数据子集。每张人脸图像经过预处理后大小为35×35,使用随机矩阵映射得到1024维列向量作为训练和测试的输入特征。

首先将所有样本数据输入本发明实施例的聚类模型函数进行训练,其中每个样本的近邻参数k设为5,训练完成后得到同时进行特征选择和聚类的结果:特征选择矩阵W和聚类伪标签矩阵V;然后进行K均值聚类,输出人脸识别结果。

下表展示了本发明实验例在精确度(ACC)、归一化互信息(NMI)2个指标上和其他方法的对比,其中LapScore来自于He, X.; Cai, D.; and Niyogi, P.的文章《特征选择中的拉普拉斯评分方法》,MCFS来自于Cai, D.; Zhang, C.; and He, X.的文章《多类簇非监督特征选择方法》,UDFS来自于Yang, Y.; Shen, H.; Ma, Z.; Huang, Z.; and Zhou, X.的文章《非监督学习判决特征选择》,NDFS来自于Li, Z.; Yang, Y.; Liu, J.; Zhou, X.; and Lu, H.的文章《非负判决非监督特征选择》,RUFS来自于Qian, M., and Zhai, C.的文章《鲁棒非监督特征选择》,SOCFS来自于Han, D. and Kim, J.的文章《同时正交基聚类与非监督特征选择》。

结果表明:与现有技术相比,本发明在人脸识别的精确度和归一化互信息上有明显的提高。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1