一种基于结构化词典域转移的交叉视角人脸识别方法

文档序号：6631831阅读：248来源：国知局

一种基于结构化词典域转移的交叉视角人脸识别方法
【专利摘要】本发明是一种基于结构化词典域转移的交叉视角人脸识别方法，其包括步骤：S1：将训练出每个对样本类别有区分性的子词典串接构成结构化的源域词典；S2：学习目标域和多个中间域词典；S3：对源域及目标域的图像人脸编码、源域词典、目标域词典和多个中间域词典计算，得到并分别将源域及目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征和目标域人脸图像的域共享特征；S4：根据源域人脸图像的域共享特征，对源域人脸集中的每一类样本训练一个支持向量机模型；将目标域人脸图像的域共享特征输入所有类别的支持向量机模型，取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
【专利说明】一种基于结构化词典域转移的交叉视角人脸识别方法

【技术领域】
[0001] 本发明属于交叉视角人脸识别【技术领域】，具体涉及一种基于结构化词典域转移的交叉视角人脸识别方法。

【背景技术】
[0002] 目前大多数的自动人脸识别系统在正脸视角下可以达到较高的识别性能。但是，在实际应用场景中获取的人脸图片一般处于各种各样的视角，这种情况会使得人脸识别系统的性能大幅度退化。交叉视角人脸识别的困难主要在于人脸视角的变化处于3D空间中，而人脸图像仅捕获2D的外观特征。随着视角的变化，不同的人脸部件呈现在图像中。这导致一个特殊的现象：不同身份相似视角的人脸图像比相同身份不同视角的人脸图像更为相似。由视角变化导致的差异比身份变化导致的差异更大，使得交叉视角人脸识别非常困难。
[0003]目前常用的交叉视角人脸识别方法大致可以分为两类：一类研究主要致力于对侧面视角的人脸生成虚拟的正脸图像，这样就可以在一个统一的视角下面进行人脸识别。典型地，Blanz提出为给定的2D人脸图像构造对应的3D形变模型，并在3D形状纹理空间中进行人脸匹配。但是，这类方法计算量较大且依赖人工标定人脸关键点。Chai提出了局部线性回归模型（LLR)直接在2D域中合成虚拟的正面人脸。另外一类方法主要致力于学习针对特定视角的变换，然后用这些变换将样本投影到一个公共的子空间中进行识别。Lin提出了公共区分性特征提取方法（CDEF)来将不同模态的样本投影到一个公共的特征空间； Sharma和Li引入了偏最小二乘法（PLS)和典型相关分析（CCA)来最大化投影空间中变化视角人脸的类内相关性。最近，基于域自适应的交叉视角人脸识别方法被很多学者提出。其中主流的思想是学习源域到目标域之间的一系列的中间域表示，并利用这些中间域构造一条虚拟路径来建模两个域之间统计上的联系。其中，基于子空间的中间域表示为一类常用的虚拟路径构造方法。

【发明内容】

[0004] 本发明的目的是要解决交叉视角人脸识别中，相同身份不同视角的人脸图像分布差异大的问题，为此，本发明的目的是提供一种基于结构化词典域转移的交叉视角人脸识别方法。
[0005] 为了实现所述目的，本发明基于结构化词典域转移的交叉视角人脸识别方法，该方法包括以下步骤：
[0006] 步骤Sl:根据源域人脸集的人脸图像特征，对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典；所有类的子词典串接在一起，构成结构化的源域词血.
[0007] 步骤S2 :通过递增地减少源域词典在目标域人脸集上的重构误差，逐渐地将源域词典转移到目标域，同时学习目标域词典和多个中间域词典；
[0008] 步骤S3 :计算源域人脸集的人脸图像在源域词典上的源域图像人脸编码，对源域图像人脸编码、源域词典、目标域词典和多个中间域词典分别计算，得到源域人脸图像的源域重构图像、目标域重构图像和中间域重构图像；将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征；
[0009] 计算目标域人脸集的人脸图像在目标域词典上的目标域图像人脸编码，分别对目标域图像人脸编码、源域词典、目标域词典和多个中间域词典计算，得到目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像，将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征；
[0010] 步骤S4 :根据源域人脸图像的域共享特征，对源域人脸集中的每一类样本训练一个支持向量机模型；将目标域人脸图像的域共享特征输入所有类别的支持向量机模型，取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
[0011] 本发明的有益效果：本发明首先对源域数据集区分性的学习结构化的源域词典，有效地建模源域数据集的特征；根据域自适应的思想学习一条基于中间域词典的虚拟路径，基于该路径的特征表示能有效地减小不同域人脸图像之间的差异。

【专利附图】

【附图说明】
[0012] 图1是本发明的基于结构化词典域转移的交叉视角人脸识别方法的流程图。

【具体实施方式】
[0013] 为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。
[0014] 请参照图1示出本发明基于结构化词典域转移的交叉视角人脸识别方法，具体实施例步骤如下：
[0015] 步骤Sl:根据源域人脸集的人脸图像特征，对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典；所有类的子词典D1，D2,…，Dc串接在一起，构成结构化的源域词典；所述训练出源域词典中每个对样本类别有区分性的子词典的步骤如下：
[0016] 步骤Sll:为了使源域词典Dtl能有效的构建源域人脸集模型，将源域词典在源域人脸集上的重构误差进行最小化，并构建出最小化目标函数如下表示：

【权利要求】
1. 一种基于结构化词典域转移的交叉视角人脸识别方法，特征在于，该方法包括以下步骤：步骤Sl:根据源域人脸集的人脸图像特征，对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典；所有类的子词典串接在一起，构成结构化的源域词典；步骤S2 :通过递增地减少源域词典在目标域人脸集上的重构误差，逐渐地将源域词典转移到目标域，同时学习目标域词典和多个中间域词典；步骤S3 :计算源域人脸集的人脸图像在源域词典上的源域图像人脸编码，对源域图像人脸编码、源域词典、目标域词典和多个中间域词典分别计算，得到源域人脸图像的源域重构图像、目标域重构图像和中间域重构图像；将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征；计算目标域人脸集的人脸图像在目标域词典上的目标域图像人脸编码，分别对目标域图像人脸编码、源域词典、目标域词典和多个中间域词典计算，得到目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像，将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征；步骤S4 :根据源域人脸图像的域共享特征，对源域人脸集中的每一类样本训练一个支持向量机模型；将目标域人脸图像的域共享特征输入所有类别的支持向量机模型，取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
2. 根据权利要求1所述的交叉视角人脸识别方法，其特征在于，训练出源域词典中每个对样本类别有区分性的子词典的步骤如下：步骤Sll:为了使源域词典能有效的构建源域人脸集模型，将源域词典在源域人脸集上的重构误差进行最小化并构建出最小化目标函数：步骤S12:为了使结构化的源域词典能够区分源域人脸集中的每一类样本，构建源域词典中的每个子词典与源域人脸集中对应的第i类样本的重构能力约束项和区分性约束项模型；步骤S13 :结合最小化目标函数、重构能力约束项和区分性约束项，构建新目标函数；步骤S14 :通过对源域词典及其稀疏编码系数矩阵迭代更新来求解新目标函数，训练出源域词典中每个子词典。
3. 根据权利要求2所述的交叉视角人脸识别方法，其特征在于，所述最小化目标函数 &表示为：
其中，Es为源域词典在源域人脸集上的重构误差，Xs为源域人脸集Ys在所有类的子词典串接构成的结构化的源域词典D上的稀疏编码系数矩阵，s.t表示优化条件；X/为稀疏编码系数矩阵Xs的第1列，1为稀疏编码系数矩阵Xs的列的序号；Il.IlC1表示1°范数为统计向量中的非零元素个数；Ttl是稀疏编码的稀疏水平参数；?= =LDuD2s…SDC] _i为源域人脸集中样本类别序号，c为源域人脸集中样本类别数目A为源域词典中第i类样本的子词典。
4. 根据权利要求2所述的交叉视角人脸识别方法，其特征在于，构建所述约束项模型的步骤包括如下：步骤S121 :每个子词典对源域人脸集中的第i类样本集}f具有良好的重构能力的约束项表示为：C ，所述良好的重构能力是重构误差纪越小重构能力越好；步骤S122 :第i类样本的子词典对源域人脸集中每类样本集具有良好的区分性约柬项Γ(Α)表小为：r(A)=I1m^j丨.，所述良好的区分_ + 性M约束项f(/)j越小R分性越好·，其1丨为源域人脸集屮第#类样本^词典,,为第i类样本集if对应子词典Di的稀疏编码系数矩阵,￡f是重构误差，i为源域人脸集中样本类别序号，C为源域人脸集中样本类别数目；为第j类样本集Ff对应子词典稀疏编码系数矩阵。
5. 根据权利要求2所述的交叉视角人脸识别方法，其特征在于，所述构建新的目标函数J表示为：
其中，Xs为源域人脸集Ys在所有类的子词典串接构成的结构化的源域词典D上的稀疏编码系数矩阵，Y/为第i类样本集，Di为源域人脸集中第i类样本的子词典，为第i类样本集Y/对应子词典Di的稀疏编码系数矩阵，r(Di)表示为子词典Di对源域人脸集中每类样本集的区分性约束项，α为正的惩罚参数，||,|表示F2范数；β= [A?,=[AsiΛ_/冬]t i为源域人脸集中样本类别序号，C为源域人脸集中样本类别数目。
6. 根据权利要求2所述的交叉视角人脸识别方法，其特征在于，求解所述源域词典及其稀疏编码系数矩阵的步骤包括：步骤S141 :设定源域词典的取值，将新目标函数简化为标准的稀疏编码问题；利用追踪算法对标准的稀疏编码进行求解，得到最优解的稀疏编码系数矩阵；所述追踪算法为匹配追踪或正交匹配追踪算法；步骤S142 :设定稀疏编码系数矩阵Xs的取值，将第i类样本的子词典依据以下的子问题依次审新：
通过令新目标函数Jtl对于源域词典中第i类样本的子词典Di的一阶导数为零，得到源域词典中第i类样本的子词典Di的闭集解；迭代更新源域词典和稀疏编码系数矩阵；当迭代次数达到预设迭代次数Ttl时，迭代终止；其中为第i类样本集Yis对应子词典Di的稀疏编码系数矩阵；r(Di)表示子词典Di对源域人脸集中每类样本集的区分性约束项，a为正的惩罚参数。
7. 根据权利要求1所述的交叉视角人脸识别方法，其特征在于，所述学习目标域词典和多个中间域词典的具体步骤为：步骤S21 :依据稀疏表示的原则，通过最小化第k个中间域词典在目标域人脸集Yt上的重构误差来求解第k个稀疏编码系数矩阵Xt(k)，对稀疏编码系数矩阵Xt(k)进行优化的目标函数表示为： Zfct) = miI11 _DmXt ||2；￥/；| Λ.;||〇 <T〇. A1 其中，D(k)为给定的第k个中间域词典，k为中间域词典的序号；Xt为待求解的稀疏编码系数矩阵；s.t表示优化条件；1为稀疏编码系数矩阵Xt的列的序号；X丨为稀疏编码系数矩阵Xt的第1列；Il.Il〇表示1°范数，统计向量中的非零元素个数；Ttl是稀疏编码的稀疏水平参数；以上优化目标通过追踪算法求解；步骤S22 :将稀疏编码系数矩阵Xt(k)写做Xt(k) = {Χ/ω，X2t(k)，. . .，Xet(k)}，其中Xit(k) 为目标域人脸集Yt对第i类样本的子词典Di(k)的稀疏编码系数矩阵，那么重构误差 K二μ;-/严Jr,⑷PT以分解为：
其中，Ei表示去除子词典Di(k)后，目标域人脸集Yt在中间域词典D(k)上的重构误差；X/(k)为目标域人脸集Yt对第j类样本的子词典Dj(k)的稀疏编码系数矩阵；j关i;为了最小化重构误差Et，优化子词典Di(k)使得它能拟合当前的残余重构误差Ei,同时，为了惩罚相邻的中间域词典间的突变，限制相邻词典的增量ADi00 =Di0^-Di00要小，Di(k+1)为子词典 Di(k)的更新值；最终，优化目标函数表示为：卿 ||Λ; - 广+ 則/.f·" -/f "i 步骤S23 :假设ωi为目标域人脸集Yt中使用子词典Di(k)作为重构元素的样本的序号索引集埤二⑷:^/^^^/:^"丨淇中以为目标域人脸集的样本总数^^为目标域人脸集Yt对子词典Df的稀疏编码系数矩阵，1为Xit(k)的列的序号，设Ωi为NtXIωi 大小的收缩矩阵，且收缩矩阵Qi中坐标为（Coi(I), 1)的元素的值Qi(G)i(I), 1) = 1，收缩矩阵Ω i中其余值为0 ;定义稀疏编码系数矩阵Xit(k)的收缩矩阵为爲_ =Ι,?ΜΩ^目标域人脸集Yt的收缩矩阵为$ =F1O,，重构误差Ei的收缩矩阵为g=/(Ω,，则步骤S22中的优化目标函数J1等价于：
步骤S24:通过对Di (k+1)和尤，迭代更新来求解目标函数J1;给定尤"' 通过令目标函数^对于参数Di(k+1)的一阶导数为零来求解Di(k+1);给定Di(k+1)，通过令目标函数^对于参数的一阶导数为零求来求解的更新值、迭代更新参数 {尤气丨⑷广 1++'-^1%^当相邻词典的增量AD严小于某一预设阈值Tl时，迭代操作终止，学习得到多个中间域词典i/ftf/，迭代更新算法得到的最后一个词典定义为目标域词典Dk ;其中K为学习目标域词典和多个中间域词典的总数，K-I为中间域词典的个数，k为中间域词典的序号。
8.根据权利要求1所述的交叉视角人脸识别方法，其特征在于，对源域人脸图像、在源域词典上的稀疏编码系数矩阵为Xs、源域词典Dtl、目标域词典Dk和多个中间域词典{Ο1，=分别进行计算，得到源域人脸图像的源域重构图像（DtlXs)τ、目标域重构图像（DKxs)τ和中间域重构图像序列{(D(1)xs)τ，...，（D(IH)xs)τ};将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征又=[(/Uvf，...，(，"Ag 上的稀疏编码系数矩阵为Xt ;稀疏编码系数矩阵Xt与源域词典Dtl、目标域词典Dk和多个中间域词典分别计算，得到目标域人脸图像的源域重构图像（DtlXt)'目标域重构图像（DKxt)1和中间域重构图像序列{(D(1)xt)T，. . .，（D(IH)xt)τ};将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征典和多个中间域词典的总数，K-I为中间域词典的个数，k为中间域词典的序号。
9. 根据权利要求8所述的交叉视角人脸识别方法，其特征在于，由于域共享特征的维数较高，利用主成分分析算法对域共享特征进行降维；主成分分析中主成分的维数通过保留域共享特征的98%的数据能量来确定。
10. 根据权利要求1所述的交叉视角人脸识别方法，其特征在于，获得目标域人脸图像的类别的具体步骤如下：步骤S41 :源域人脸集中人脸图像的域共享特征表示为Fs =丨JfXl，以源域人脸集中第i类样本的域共享特征集Y/作为正样本，以源域人脸集中除第i类样本以外的所有其他类别的样本集Y/(j尹i)作为负样本，训练出代表第i类样本的支持向量机模型Yi ; 步骤S42 :将目标域人脸图像的域共享特征，输入源域人脸集的所有类别的支持向量机模型Yi中计算，得到目标域人脸图像与源域人脸集的所有类别的支持向量机模型的匹配分数Scorei ;取得分数最高的支持向量机模型对应的子类类别？定义为目标域人脸图像的类别identity(yD:
其中，Y/表示源域人脸集中第i类样本的域共享特征集，i为源域人脸集中样本类别的序号，C表示源域人脸集中的样本类别数；j为源域人脸集中除第i类以外的其他类别的序号；表示所有的模型匹配分数Scorei中的最大值。
【文档编号】G06K9/62GK104318214SQ201410583963
【公开日】2015年1月28日申请日期:2014年10月27日优先权日:2014年10月27日
【发明者】陈雪, 王春恒, 肖柏华申请人:中国科学院自动化研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈雪;王春恒;肖柏华
技术所有人：中国科学院自动化研究所
我是此专利的发明人

上一篇：一种高光谱图像在轨压缩方法
上一篇：一种间距可调的伸缩式算盘的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。