一种基于改进增量式非负矩阵分解的人脸识别方法与流程

文档序号:16000689发布日期:2018-11-20 19:25阅读:202来源:国知局

本发明涉及一种计算机人脸识别领域,尤其是涉及一种基于改进增量式非负矩阵分解的人脸识别方法。



背景技术:

基近二十年来,人脸识别技术作为一种高效的生物特征识别技术,日益受到学术界以及工业界的重视。人脸识别研究的关键是特征提取,有基于全局特征的提取,也有基于局部特征的提取。

非负矩阵分解(NMF)是在矩阵元素均为非负数的约束条件下的一种矩阵分解方法。NMF是一种局部特征提取方法,其将人脸表示成基图像的线性组合,而基图像代表了眼、鼻子、嘴等人脸的局部特征,符合人类思维局部构成整体的概念。这种方法最早由Lee等人提出并成功应用于基于物体局部特征的识别。

传统的NMF算法是一种批量式学习算法,每当有新增训练样本加入时,该算法需将新、旧训练样本整合后重新进行训练,无法继承或利用之前训练所得到的因子矩阵。这样不仅会导致大量存储和运算资源的浪费,并且也无法满足训练模型在线更新的需求。针对该问题,Serhat等人提出了基于NMF的增量式算法INMF。该算法将上一次分解得到的基矩阵近似为当前参与训练的基矩阵,避免了大规模的重复运算。

Serhat等人提出的INMF算法虽然在一定程度上解决了非负矩阵分解的在线学习问题,但仍然存在以下几个问题:

1)INMF算法的新增训练样本是逐个增加的,因此当一次性新增多个训练样本时,其新增样本顺序的不同将导致训练结果的差异化,且训练所需时间也与新增样本的数量呈正比。此外,当一次性新增训练样本达到一定规模时,其训练所需时间甚至超过NMF算法。

2)INMF算法是一种无监督算法,未能有效利用训练样本的类别信息,导致降维后获得的子空间具有较高的类间混淆度,不利于数据的判别分类。

3)INMF算法每次新增样本时,其系数矩阵H的初始化是随机赋值的,这样不利于后续迭代求解过程中目标函数梯度的快速下降,收敛速度较慢。



技术实现要素:

本发明主要是解决现有技术所存在的训练时间长、训练样本的类别信息使用率低、收敛速度慢等的技术问题,提供一种训练时间短、有效利用了训练样本的类别信息、具有较快收敛速度的基于改进增量式非负矩阵分解的人脸识别方法。

本发明针对上述技术问题主要是通过下述技术方案得以解决的:一种基于改进增量式非负矩阵分解的人脸识别方法,包括以下步骤:

A、对初始训练样本和增量训练样本进行预处理,并将每幅图像表示成带有类别标签的向量形式,初始训练样本矩阵为VP,新增训练样本矩阵为VQ,全部训练样本为VR={VP,VQ},VP对应的系数矩阵为HP,VQ对应的系数矩阵为HQ,VR对应的系数矩阵为HR,所有样本的类别标签总数为C类;

B、对初始样本VP采用非负矩阵分解算法进行训练,通过下式的迭代更新得到基矩阵WP:

将基矩阵WP作为增量训练中基矩阵WR的初始值;

C、将新增训练样本的系数矩阵HQ中的每个向量根据其对应的标签信息,初始化为已得到的原始系数矩阵HP中相同类别的均值向量,并引入索引矩阵A,满足:

其中aij表示索引矩阵A第i行j列的元素值,hj表示HQ中第j列系数向量;

D、初始化系数矩阵HQ为HQ_init,

其中Hmean为均值系数矩阵,其列向量为顺序排列的HP中第1类系数向量的均值向量,列向量为顺序排列的HP中第2类系数向量的均值向量,以此类推;

E、设定最大迭代次数maxiter;

F、计算属于k类的新增训练样本对应系数矩阵的均值向量

k的值为1至C,Qk表示HQ中属于第k类的系数向量总数;

G、计算所有新增训练样本对应系数矩阵的均值向量

H、迭代更新求解增量训练后的新基矩阵WR和新系数矩阵HQ直至迭代次数等于所设定的maxiter,迭代公式如下:

上式中表示属于第k类中第ρ列系数向量的第d个元素,下标q与ρ的对应关系为η是Fisher判别项权重参数;下标nd表示该矩阵第n行第d列的元素值,下标dq同理;下标d表示该向量第d个元素;

I、将HQ置于HP右边,即得到HR=[HP HQ];

J、利用WR对待识别人脸图像数据集VX进行特征提取,即HX=WR-1VX,并采用最近邻分类器计算HX与HR中各样本间的欧式距离实现对VX的人脸识别。

作为优选,所述步骤A中,预处理过程为将初始训练样本和增量训练样本的人脸图像规范化为相同分辨率。

作为优选,所述初始训练样本表示为:

表示初始训练样本的类别总数,初始训练样本的类别总数和增量训练样本的总数相同;P1表示初始训练样本中属于第1类的样本个数,P2表示初始训练样本中属于第1类的样本个数,以此类推,满足P=P1+P1+…+PC;表示第1类初始训练样本中的第1个样本向量,表示第1类初始训练样本中的第2个样本向量,以此类推,表示第C类初始训练样本中的第PC个样本向量;

增量训练样本表示为:

Q1表示增量训练样本中属于第1类的样本个数,Q2表示增量训练样本中属于第1类的样本个数,以此类推,满足Q=Q1+Q1+…+QC;表示第1类增量训练样本中的第1个样本向量,表示第1类增量训练样本中的第2个样本向量,以此类推,表示第C类增量训练样本中的第QC个样本向量。

本方案将FDA思想引入INMF算法,提出了基于Fisher判别分析的增量式非负矩阵解算法。该算法利用初始样本训练的先验信息,通过索引矩阵将新增系数的列向量赋值为对应类别的均向量,提高了算法的收敛速度;此外,将INMF算法改进为批量式的增量学习算法,利用索引矩阵进行初始化赋值,并对目标函数施加类间散度最大和内度最小的约束,从而获得最佳的子空间投影。通过在多个不同规模人脸数据库上的实验表明,FINMF算法相较于其它几种增量式算法有着更高的识别率,且当新增训练样本规模较大时有着较低的时间开销,具有较高的实用价值。

本发明带来的实质性效果是,训练时间短、有效利用了训练样本的类别信息、具有较快收敛速度。

附图说明

图1是本发明的一种流程图。

具体实施方式

下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。

实施例:本实施例的一种基于改进增量式非负矩阵分解的人脸识别方法,如图1所示,包括以下步骤:

A、对初始训练样本和增量训练样本进行预处理,并将每幅图像表示成带有类别标签的向量形式,初始训练样本矩阵为VP,新增训练样本矩阵为VQ,全部训练样本为VR={VP,VQ},VP对应的系数矩阵为HP,VQ对应的系数矩阵为HQ,VR对应的系数矩阵为HR,所有样本的类别标签总数为C类;

B、对初始样本VP采用非负矩阵分解算法进行训练,通过下式的迭代更新得到基矩阵WP:

将基矩阵WP作为增量训练中基矩阵WR的初始值;

C、将新增训练样本的系数矩阵HQ中的每个向量根据其对应的标签信息,初始化为已得到的原始系数矩阵HP中相同类别的均值向量,并引入索引矩阵A,满足:

其中aij表示索引矩阵A第i行j列的元素值,hj表示HQ中第j列系数向量;

D、初始化系数矩阵HQ为HQ_init,

其中Hmean为均值系数矩阵,其列向量为顺序排列的HP中第1类系数向量的均值向量,列向量为顺序排列的HP中第2类系数向量的均值向量,以此类推;

E、设定最大迭代次数maxiter;

F、计算属于k类的新增训练样本对应系数矩阵的均值向量

k的值为1至C,Qk表示HQ中属于第k类的系数向量总数;

G、计算所有新增训练样本对应系数矩阵的均值向量

H、迭代更新求解增量训练后的新基矩阵WR和新系数矩阵HQ直至迭代次数等于所设定的maxiter,迭代公式如下:

上式中表示属于第k类中第ρ列系数向量的第d个元素,下标q与ρ的对应关系为η是Fisher判别项权重参数,为经验参数,可以根据不同需求进行调整;下标nd表示该矩阵第n行第d列的元素值,下标d表示该向量第d个元素;

I、将HQ置于HP右边,即得到HR=[HP HQ];

J、利用WR对待识别人脸图像数据集VX进行特征提取,即HX=WR-1VX,并采用最近邻分类器计算HX与HR中各样本间的欧式距离实现对VX的人脸识别。

步骤A中,预处理过程为将初始训练样本和增量训练样本的人脸图像规范化为相同分辨率。

初始训练样本表示为:

C表示初始训练样本的类别总数,初始训练样本的类别总数和增量训练样本的总数相同;P1表示初始训练样本中属于第1类的样本个数,P2表示初始训练样本中属于第1类的样本个数,以此类推,满足P=P1+P1+…+PC;表示第1类初始训练样本中的第1个样本向量,表示第1类初始训练样本中的第2个样本向量,以此类推,表示第C类初始训练样本中的第PC个样本向量;

增量训练样本表示为:

Q1表示增量训练样本中属于第1类的样本个数,Q2表示增量训练样本中属于第1类的样本个数,以此类推,满足Q=Q1+Q1+…+QC;表示第1类增量训练样本中的第1个样本向量,表示第1类增量训练样本中的第2个样本向量,以此类推,表示第C类增量训练样本中的第QC个样本向量。

Fisher判别分析又称线性判别分析,是一种应用十分广泛的有监督降维方法,其主要思想是通过利用训练数据的标签信息对目标函数施加约束,通过实现类内散度最小化以及类间散度最大化以求得最佳子空间投影矩阵。

本方案将FDA思想引入INMF算法,提出了基于Fisher判别分析的增量式非负矩阵解算法。该算法利用初始样本训练的先验信息,通过索引矩阵将新增系数的列向量赋值为对应类别的均向量,提高了算法的收敛速度;此外,将INMF算法改进为批量式的增量学习算法,利用索引矩阵进行初始化赋值,并对目标函数施加类间散度最大和内度最小的约束,从而获得最佳的子空间投影。通过在多个不同规模人脸数据库上的实验表明,FINMF算法相较于其它几种增量式算法有着更高的识别率,且当新增训练样本规模较大时有着较低的时间开销,具有较高的实用价值。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

尽管本文较多地使用了训练样本、新增样本、迭代等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1