本发明属于机器学习技术领域,特别涉及一种基于局部信息和组稀疏约束的半监督人脸识别方法。
背景技术:
人脸识别是进行身份识别的一项重要生物识别技术,在多种领域已经取得了广泛的应用,如智能门禁、人机交互、权限管理等。近年来,随着多媒体技术和网络技术的快速发展,人脸数据逐渐呈现出高维特征,这些高维人脸数据的处理不但需要消耗大量的时间和空间资源,且该类数据往往包含大量冗余信息,给基于该类数据的人脸识别方法带来了挑战。
现有的人脸识别方法虽然有对输入数据进行特征的筛选,如利用主成员分析(PCA)、FISHER等方法进行代表性特征的选择,然而这些方法主要存在两个方面的问题:(1)这些方法仅考虑了相同数据特征之间联系,而缺乏对不同数据特征之间相关性的分析,从而导致很难筛选出最具代表性的特征;(2)这些方法容易受到外界噪声的影响,尤其在数据集中存在较多未标记数据时,如果不能有效抑制噪声的干扰,将严重影响人脸识别的效果。
基于以上分析,现有的人脸识别方法对识别的准确性不高,有待改进。
技术实现要素:
本发明的目的,在于提供一种基于局部信息和组稀疏约束的半监督人脸识别方法,其可有效提高人脸特征选择和识别的准确度,同时可有效抑制数据集中噪声的干扰。
为了达成上述目的,本发明的解决方案是:
一种基于局部信息和组稀疏约束的半监督人脸识别方法,包括如下步骤:
(1)获取一个包含n个高维数据的人脸数据集X∈Rd×n,其中,d为数据维度,该人脸数据集中包含m个已标记数据集Xl∈Rd×m及对应的标签矩阵Yl∈Rm×c,其中,c为人脸数据的分类数;
(2)在数据集X上,构建基于局部信息约束的无监督人脸特征选择模型;
(3)在已标记数据集Xl上,构建基于矩阵l2,1损失函数的监督人脸特征选择模型;
(4)构建组稀疏约束的人脸特征选择目标函数;
(5)利用迭代优化算法求解步骤(4)中的目标函数;
(6)以经过步骤(5)筛选过后的人脸特征作为SVM的输入,训练得到SVM分类器,并完成对人脸的识别。
上述步骤(2)中,构建的基于局部信息约束的无监督人脸特征选择模型是;
其中,Iu∈Rc×c是c阶单位矩阵,L的定义如下:
其中,Id∈Rd×d是d阶单位矩阵,是由数据集X中第i个数据xi及其k个最近邻组成的数据集;是中心化矩阵,其中Ik+1∈R(k+1)×(k+1)是k+1阶单位矩阵,1k+1是成员全为1的向量;Si∈Rn×(k+1)为局部分类选择矩阵,Si定义如下:
其中,设数据xp是数据xi的近邻中距离由小到大第q个邻近数据。
上述步骤(3)中,构建的基于矩阵l2,1损失函数的监督人脸特征选择模型是;
其中,bl为偏差项,1l为全1向量,Yl为标签矩阵,||·||2,1为矩阵的l2,1范数,对于任意矩阵M∈Rr×p,其l2,1范数定义为:
上述步骤(4)中,构建的组稀疏约束的人脸特征选择目标函数如下:
其中,和用于增强模型的泛化能力,防止过拟合;W=[Wu,Wl]为组稀疏约束矩阵。
上述步骤(5)的具体过程是:
(51)首先对目标函数进行优化:
设目标函数相对于bl的偏导数为0,得到
将求解得到的bl代入目标函数中,得到转换后的目标函数为:
其中,Il∈Rm×m是单位矩阵;
锁定Wu求Wl,令且设定转换后的目标函数相对于Wl的偏导数为0,得到
其中,Id∈Rd×d是单位矩阵,Dl和D的定义如下:
锁定Wl求解Wu,该求解过程等价于:
该方程的最优解通过求解L+αId+βD的特征分解获得,且最优解为L+αId+βD前c个最小特征值所对应特征向量的列组合矩阵;
(52)迭代优化过程如下:
令X∈Rd×n代表输入数据集,Xl∈Rd×m和Yl∈Rm×c分别代表X中已标记数据集及其标签,t代表迭代次数;
步骤1:计算
步骤2:更新其中,Pi是P的前c个最小特征值所对应的特征向量;
步骤3:更新
步骤4:更新
步骤5:更新t=t+1;
步骤6:当两次计算的Wu小于某一值时,转至步骤7,否则重复执行步骤1-6;
步骤7:按照||wi||2的值对属性特征进行降序排序,并选择前c个特征作为数据集的最具代表性特征,并结束整个迭代过程。
采用上述方案后,本发明有效利用数据集中的局部信息和已知标签信息,可提高人脸特征选择和识别的准确度,并可以通过构件联合特征选择矩阵来达到人脸特征的组稀疏效果,进而能够更容易适应实际应用中数据的应用处理,其学习效果优于传统学习方案的效果;本发明同时还可有效抑制数据集中噪声的干扰,最终为机器学习、计算机视觉相关应用提供有效的支持。
附图说明
图1是本发明的原理示意图;
图2是本发明的流程图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
如图1和图2所示,本发明提供一种基于局部信息和组稀疏约束的半监督人脸识别方法,包括如下步骤:
(1)获取一个包含n个高维数据的人脸数据集X∈Rd×n,其中,d为数据维度,该人脸数据集中包含m个已标记数据集Xl∈Rd×m及对应的标签矩阵Yl∈Rm×c,其中,c为人脸数据的分类数。
(2)在数据集X上,构建基于局部信息约束的无监督人脸特征选择模型;
其中,Iu∈Rc×c是c阶单位矩阵,L的定义如下:
其中,Id∈Rd×d是d阶单位矩阵,是由数据集X中第i个数据xi及其k个最近邻组成的数据集;是中心化矩阵,其中Ik+1∈R(k+1)×(k+1)是k+1阶单位矩阵,1k+1是成员全为1的向量;Si∈Rn×(k+1)为局部分类选择矩阵,设数据xp是数据xi的近邻中距离由小到大第q个邻近数据,则Si可定义如下:
(3)在已标记数据集Xl上,构建基于矩阵l2,1损失函数的监督人脸特征选择模型;
其中,bl为偏差项,1l为全1向量,Yl为标签矩阵,||·||2,1为矩阵的l2,1范数,对于任意矩阵M∈Rr×p,其l2,1范数定义为:
(4)在步骤(2)和(3)的基础上,构建组稀疏约束的人脸特征选择目标函数如下:
其中,和用于增强模型的泛化能力,防止过拟合。W=[Wu,Wl]为组稀疏约束矩阵。
可以看出,目标函数中组稀疏约束矩阵的l2,1范数项||W||2,1采用按行约束方式,使得W具有组稀疏特性,从而有利于选择最具代表性的人脸特征。同时,当Wu和Wl中存在噪声特征时,||W||2,1约束将使得W中相对应的行将趋近于零,进而能够有效排除噪声干扰。
(5)求解目标函数
由于所述目标函数涉及组稀疏的l2,1约束,是非凸的,采用以下步骤对其进行优化:
设目标函数相对于bl的偏导数为0,得到
将求解得到的bl代入目标函数中,得到转换后的目标函数为:
其中,Il∈Rm×m是单位矩阵。
锁定Wu求Wl,令且设定转换后的目标函数相对于Wl的偏导数为0,得到
其中,Id∈Rd×d是单位矩阵,Dl和D的定义如下:
锁定Wl求解Wu,该求解过程等价于:
该方程的最优解可通过求解L+αId+βD的特征分解获得,且最优解为L+αId+βD前c个最小特征值所对应特征向量的列组合矩阵。
(6)迭代优化过程如下:
令X∈Rd×n代表输入数据集,Xl∈Rd×m和Yl∈Rm×c分别代表X中已标记数据集及其标签,t代表迭代次数。
步骤1:计算
步骤2:更新其中,Pi是P的前c个最小特征值所对应的特征向量;
步骤3:更新
步骤4:更新
步骤5:更新t=t+1;
步骤6:当两次计算的Wu小于某一值时,转至步骤7,否则重复执行步骤1-6;
步骤7:按照||wi||2的值对属性特征进行降序排序,并选择前c个特征作为数据集的最具代表性特征,并结束整个迭代过程。
(7)以经过步骤(6)筛选过后的人脸特征作为SVM的输入,训练得到SVM分类器,并完成对人脸的识别。
综合上述,本发明一种基于局部信息和组稀疏约束的半监督人脸识别方法,首先建立人脸特征选择模型,该模型共包含三部分:(1)在已有标签训练样本上构建基于线性回归模型约束的特征选择矩阵Wl;(2)在无标签人脸训练样本上利用局部信息约束特征选择矩阵Wu;(3)利用正则化l2,1范数构建组稀疏特征选择矩阵W=[Wu,Wl];然后通过迭代优化算法求解模型,并将求解得到的人脸特征选择矩阵W按其每个行向量的l2范数值进行降序排序,并选择其中前k个特征作为主要特征,最后利用SVM分类器对经过特征筛选后的数据进行分类识别。本发明所提出的方法将半监督人脸识别的问题转化为了l2,1组稀疏约束问题,该方法能有效提取已标注样本的信息和未标注样本之间的共享信息,不易受到数据集中噪声的干扰,具有较好的识别效果。
为了验证本发明实施例所提供基于局部信息和组稀疏约束的半监督人脸识别方法,在4个人脸数据集上作对比试验,并和3个主流的识别方法进行效果的比较,3个识别方法分别是FISHER SCORE,Feature Selection via Joint l2,1-Norm Minimization(FSNM)和Noise insensitive trace ratio criterion for feature selection(TRACFS)。
4个人脸数据集均为公开数据集,分别是ORL,YALE,YALEB和XM2VTS,表1是所选数据库的简要描述。
表1实验所选人脸数据集简介
结果的评价使用准确度(ACC),结果越大表明效果越好。实验结果如表2所示。
表2多种算法在图像数据集上性能比较
从以上表格的结果,可以看出本发明所提供的半监督人脸识别方法,有着明显的优点,所有数据集上的识别效果都比其它方法要好,从而证明了本发明所提供的方法的有效性。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。