基于稀疏投影二值编码的人脸识别方法及装置与流程

文档序号:12125897阅读:232来源:国知局
基于稀疏投影二值编码的人脸识别方法及装置与流程

本发明涉及生物识别技术,尤其涉及一种基于稀疏投影二值编码的人脸识别方法及装置。



背景技术:

从原始社会到现今的信息社会,从社会从公有到私有的过程中,对于个人隐私的保护需求与日俱增。越来越多的领域需要用到可靠的生物识别技术,而人脸作为一种特殊的生物特征,具有特征唯一、相对稳定、获取简便且具备非接触性等显著优点而受到广泛关注。

现有技术中的人脸识别算法主要包括基于实数值表示人脸特征的人脸识别方法和基于稠密二值特征向量表示人脸特征的人脸识别方法。其中,基于实数值表示人脸特征的人脸识别方法是指利用预先设计的目标函数从输入的人脸图像中提取基于实数值表示的人脸特征,然后利用模式识别方法判断输入图像属于哪个人。基于稠密二值特征向量表示人脸特征的人脸识别方法是指将原始的基于实数值表示的人脸特征转化为基于稠密二值特征向量表示的人脸特征,使用的投影矩阵是稠密投影矩阵(即矩阵中的绝大部分元素为非0元素),最后采用模式识别方法判断输入图像属于哪个人。

但是,对于基于实数值表示人脸特征的人脸识别方法,一方面需要大量的存储单元、计算速度慢,一般的计算机或移动设备难以满足其存储和计算需求;另一方面,该方法对于人脸图像中的局部变化敏感,当同一张人脸图像发生变化变化的程度超过某一阈值时,分类器就会将两个原本属于同一个人的特征识别为不同人。在基于稠密二值特征向量表示人脸特征的人脸识别方法中,由于在二值量化过程中始终存在量化误差的影响,当量化后的二值特征向量的维度小于原始特征向量的维度时,很可能导致大量判别信息的丢失,从而影响二值特征向量描述人脸图像特征的能力;此外,基于稠密二值特征向量表示人脸特征的人脸识别方法还存在训练样本的过拟合问题,而过拟合会导致人脸识别方法在计算过程中对数据的适应性差,从而影响人脸识别方法的性能。



技术实现要素:

本发明提供一种基于稀疏投影二值编码的人脸识别方法及装置,以克服现有技术中的人脸识别方法识别速度慢、训练样本过度拟合及对数据的适应性差的技术问题。

本发明提供一种基于稀疏投影二值编码的人脸识别方法,包括:

获取训练集中各训练样本的各像素点对应的第一像素差值向量;其中,所述训练样本为人脸图像,所述训练集中包括多幅不同的人脸图像;

根据所述第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各所述像素点对应的第一二值特征向量;

对所有的所述第一二值特征向量进行聚类,得到多个聚类中心-单词;

将各所述训练样本相对应的第一二值特征向量组成第一矩阵,采用所述单词对所述第一矩阵进行线性重建,得到第一线性重建结果,根据所述第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量;

获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各所述第二二值特征向量组成第二矩阵,采用所述单词对所述第二矩阵进行线性重建,得到第二线性重建结果,根据所述第二线性重建结果得到第二向量;

根据所述第一向量和所述第二向量,得到人脸识别结果。

如上所述的方法,所述第一目标函数如公式一所示:

其中,R为稀疏投影矩阵,|R|0≤m表示稀疏投影矩阵R中非零元素的个数小于等于m个,B为第一二值特征向量,参数m与所述稀疏投影矩阵R的稀疏程度具有关联关系,m为正整数,X为所述第一像素差值向量。

如上所述的方法,所述将各所述训练样本相对应的第一二值特征向量组成第一矩阵,采用所述单词对所述第一矩阵进行线性重建,得到第一线性重建结果,根据所述第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量,包括:

采用所述单词对所述第一矩阵进行线性重建,得到第一线性重建结果,所述第一线性重建结果的表达式如公式二所示:

Bi=ai1S1+ai2S2+...+aikSk 公式二;

其中,Bi为第i个训练样本的各第一二值特征向量组成的第一矩阵,Sk为第k个单词,aik为在第i个训练样本的对应的所述第一矩阵采用所述单词进行线性重建时第k个单词的权重;

将所述第一线性重建结果的表达式中的各所述单词对应的权重组成第一向量(ai1,ai2,……,aik)。

如上所述的方法,所述获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各所述第二二值特征向量组成第二矩阵,采用所述单词对所述第二矩阵进行线性重建,得到第二线性重建结果,根据所述第二线性重建结果得到第二向量,包括:

获取待检测人脸的图像的各像素点对应的第二像素差值向量,并根据所述第二像素差值向量获取满足所述第一目标函数的待检测人脸的图像的各像素点对应的所述第二二值特征向量;

将各所述第二二值特征向量组成所述第二矩阵,并将所述第二矩阵采用所述单词进行线性重建,得到所述第二线性重建结构,所述第二线性重建结果的表达式如公式三所示:

B测试=b1S1+b2S2+...+bkSk 公式三;

其中,B测试为各所述第二二值特征向量组成的第二矩阵,Sk为第k个单词,bk为所述第二矩阵采用所述单词进行线性重建时第k个单词的权重;

将所述第二线性重建结果的表达式中的各所述单词对应的权重组成所述第二向量(b1,b2,……,bk)。

如上所述的方法,所述根据所述第一向量和所述第二向量,得到人脸识别结果,包括:

将所述第一向量和所述第二向量输入分类器;

获取所述分类器返回的第二向量与各所述第一向量的欧式距离;

将与第二向量的欧式距离最短的第一向量对应的训练样本所对应的人脸图像识别为待检测人脸的图像。

如上所述的方法,获取训练集中各训练样本的各像素点对应的第一像素差值向量,包括:

将各训练样本划分为多个块;

以每个块中的每个像素点为第一中心像素点,以r为半径,得到所述第一中心像素点的第一邻域像素点,并按照顺时针方向,将所述第一邻域像素点的像素值与所述第一中心像素点的像素值进行差值运算,得到长度为(2×r+1)×(2×r+1)-1维的第一像素差值向量;

获取待检测人脸的图像的各像素点对应的第二像素差值向量,包括:

将所述待检测人脸的图像划分为多个块;

以每个块中的每个像素点为第二中心像素点,以r为半径,得到所述第二中心像素点的第二邻域像素点,并按照顺时针方向,将所述第二邻域像素点的像素值与所述第二中心像素点的像素值进行差值运算,得到长度为(2×r+1)×(2×r+1)-1维的第二像素差值向量;

其中,r为正整数。

如上所述的方法,所述根据所述第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各所述像素点对应的第一二值特征向量,包括:

引入R的代理矩阵S,将所述第一目标函数变换为第二目标函数,所述第二目标函数如公式四所示:

其中,变量α表示代理矩阵S的惩罚因子,用以平衡公式四中和这两项的变量,|S|0表示代理矩阵S中非0元素的个数,参数m与所述稀疏投影矩阵R的稀疏程度具有关联关系;表示代理矩阵S与二值编码B之间的量化误差,表示代理矩阵S与R之间的误差;

对所述第二目标函数进行求解,得到所述第一二值特征向量。

如上所述的方法,所述对所述第二目标函数进行求解,得到所述第一二值特征向量,包括:

将所述第二目标函数中的S和B随机赋予初始值S0和B0,并固定所述第二目标函数中的S和B,更新所述第二目标函数中的R,得到R1,具体为:

将所述第二目标函数改成写第一表达式,所述第一表达式如公式五所示:

其中,C1=SX,为固定值;

求解第一表达式,得到R1,具体为:

通过公式六或公式七得到R1

其中,thrm表示将得到的矩阵中的最大的m个元素保留,其余的元素置0;Rt+1表示利用公式六第(t+1)次迭代得到的解,Rt表示利用公式六上一次(即第(t)次)迭代的解,当迭代次数为N时,利用公式六得到的解收敛,停止迭代,此时得到的RN=R1,其中R1表示对所述第二目标函数求解时,第一次迭代得到的R;

R1=thrm(S) 公式七;

其中,R1表示对所述第二目标函数求解时,第一次迭代得到的R。

将所述第二目标函数中的B赋予初始值B0,将所述第二目标函数中的R赋为R1,并固定所述第二目标函数中的B和R,更新所述第二目标函数中的S,得到S1,具体为:

将所述第二目标函数改成写第二表达式,所述第二表达式如公式八所示:

其中,C2=(B+αRX)/(1+α)为固定值;

求解第二表达式,得到S1,具体为:

通过公式九求解S1

对进行奇异值分解得到U,V:S1=VUT......公式九;

其中,S1表示对第二目标函数求解时,第一次迭代得到的S;

将所述第二目标函数中的S赋为S1,将所述第二目标函数中的R赋为R1,并固定所述第二目标函数中的S和R,更新所述第二目标函数中的B,得到B1,具体为:

将所述第二目标函数改成写第三表达式,所述第三表达式如公式十所示:

其中,C3=SX,为固定值;

求解第三表达式,得到B1,具体为:

通过公式十一得到B1

B=sign(C3)=sign(SX) 公式十一;

其中,sign(*)为符号函数,当自变量*大于0时,sign(*)函数输出1,否则,sign(*)函数输出0,B1表示对所述第二目标函数求解时,第一次迭代得到的B,自变量为矩阵C3中的元素;

将所述第二目标函数中的S赋为S1,将所述第二目标函数中的B赋为和B1,并固定所述第二目标函数中的S和B,更新所述第二目标函数中的R,得到R2

将所述第二目标函数中的B赋为B1,将所述第二目标函数中的R赋为R2,并固定所述第二目标函数中的B和R,更新所述第二目标函数中的S,得到S2

将所述第二目标函数中的S赋为S2,将所述第二目标函数中的R赋为R2,并固定所述第二目标函数中的S和R,更新所述第二目标函数中的B,得到B2

重复执行将所述第二目标函数中的S赋为Sm-1,将所述第二目标函数中的B赋为和Bm-1,并固定所述第二目标函数中的S和B,更新所述第二目标函数中的R,得到Rm;将所述第二目标函数中的B赋为Bm-1,将所述第二目标函数中的R赋为Rm,并固定所述第二目标函数中的B和R,更新所述第二目标函数中的S,得到Sm;将所述第二目标函数中的S赋为Sm,将所述第二目标函数中的R赋为Rm,并固定所述第二目标函数中的S和R,更新所述第二目标函数中的B,得到Bm的操作,直至完成M次迭代,第M次迭代得到的BM即为所述满足第一目标函数的各所述像素点对应的第一二值特征向量;其中,m代表第m次迭代,所述m、M均为正整数。

本发明还提供一种基于稀疏投影二值编码的人脸识别装置,包括:

计算单元,所述计算单元用于获取训练集中各训练样本的各像素点对应的第一像素差值向量;其中,所述训练样本为人脸图像,所述训练集中包括多幅不同的人脸图像;

所述计算单元还用于根据所述第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各所述像素点对应的第一二值特征向量;

聚类单元,所述聚类单元对所有的所述第一二值特征向量进行聚类,得到多个聚类中心-单词;

第一向量获取单元,所述第一向量获取单元用于将各所述训练样本相对应的第一二值特征向量组成第一矩阵,采用所述单词对所述第一矩阵进行线性重建,得到第一线性重建结果,根据所述第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量;

第二向量获取单元,所述第二向量获取单元用于获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各所述第二二值特征向量组成第二矩阵,采用所述单词对所述第二矩阵进行线性重建,得到第二线性重建结果,根据所述第二线性重建结果得到第二向量;

识别单元,所述识别单元用于根据所述第一向量和所述第二向量,得到人脸识别结果。

本发明提供一种基于稀疏投影二值编码的人脸识别方法及装置。本发明提供的基于稀疏投影二值编码的人脸识别方法,包括获取训练集中各训练样本的各像素点对应的第一像素差值向量;其中,训练样本为人脸图像,训练集中包括多幅不同的人脸图像;根据第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各像素点对应的第一二值特征向量;对所有的第一二值特征向量进行聚类,得到多个聚类中心-单词;将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量;获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量,根据第一向量和第二向量,得到人脸识别结果。本实施例的基于稀疏投影二值编码的人脸识别方法采用采用稀疏投影矩阵对实值表示的像素差值向量进行编码得到二值特征向量,并对二值特征向量进行聚类得到单词,采用单词线性重建每幅人脸图像对应的二值特征向量组成的矩阵,识别速度快,解决了训练样本过度拟合的问题,且对数据的适应性好,提高了人脸识别方法的识别人脸的准确性和快速性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的基于稀疏投影二值编码的人脸识别方法实施例一的流程图;

图2为本发明的第一像素差值向量获取示意图;

图3为本发明提供的基于稀疏投影二值编码的人脸识别方法实施例二的流程图;

图4为本发明提供的基于稀疏投影二值编码的人脸识别装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明提供的基于稀疏投影二值编码的人脸识别方法实施例一的流程图,图2为本发明的第一像素差值向量获取示意图。

如图1~2所示,本实施例的方法可以包括:

S101、获取训练集中各训练样本的各像素点对应的第一像素差值向量;其中,训练样本为人脸图像,训练集中包括多幅不同的人脸图像;

S102、根据第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各像素点对应的第一二值特征向量;

S103、对所有的第一二值特征向量进行聚类,得到多个聚类中心-单词;

S104、将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量;

S105、获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量;

S106、根据第一向量和第二向量,得到人脸识别结果。

对于步骤S101,事先获取大量的不同人脸图像组成训练集,训练集中每一张人脸图像称为训练样本。

训练集建成后,获取训练集中各训练样本的各像素点对应的第一像素差值向量,具体为:将各训练样本划分为多个块;以每个块中的每个像素点为第一中心像素点,以r为半径,得到第一中心像素点的第一邻域像素点,并按照顺时针方向,将第一邻域像素点的像素值与第一中心像素点的像素值进行差值运算,得到长度为(2×r+1)×(2×r+1)-1维的第一像素差值向量;优选地,r取3。为了清楚的解释顺时针方向,本实施例中采用r=2说明顺时针方向的含义,如图2所示,图2中带箭头虚线的路径即为顺时针方向,每个方块代表一个像素点,A代表第一中心像素点,沿该箭头虚线方向依次将第一邻域像素点的像素值与第一中心像素点的像素值分别进行差值运算,组成24维的第一像素差值向量。其中,第一邻域像素点的个数也是(2×r+1)×(2×r+1)-1个。

该步骤中,本领域技术人员可以理解的是,当r的值选定后,由于训练样本被分成的多个块,每个块中会有许多个边缘像素点的第一邻域像素点的个数不足(2×r+1)×(2×r+1)-1个,为了使得到的第一像素差值向量的维数相同,将每个块中第一邻域像素点的个数不足(2×r+1)×(2×r+1)-1个的边缘像素点舍弃。

对于步骤S102,在得到第一像素差值向量后,根据第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各像素点对应的第一二值特征向量。在本实施例中,第一目标函数如公式一所示:

其中,R为稀疏投影矩阵,|R|0≤m表示稀疏投影矩阵R中非零元素的个数小于等于m个,B为第一二值特征向量,参数m与稀疏投影矩阵R的稀疏程度具有关联关系,m为正整数,X为第一像素差值向量。

其中,m的取值规则为,矩阵中所有元素的个数的4%~6%。

采用稀疏投影矩阵对第一像素差值向量进行编码,得到的量化后的第一二值特征向量的维度远高于第一像素差值向量的维度,因此,能够最小化第一像素差值向量和第一二值特征向量之间的量化误差,可以提升第一二值特征向量描述人脸图像的能力。而且,采用稀疏投影矩阵对第一像素差值向量进行编码,使得到的第一二值特征向量具有稀疏(即大部分元素均为0)的性质,可以通过调整投影矩阵的稀疏度,将人脸识别方法计算过程中需要调制参数的数量级调整为与训练数据复杂度相当的水平,解决了训练样本中的数据过度拟合的问题。

对于步骤S103,在得到训练集的各像素点对应的第一二值特征向量后,对训练集的所有像素点对应的第一二值特征向量进行聚类,得到多个聚类中心-单词;本实施例中可以采用K-Means聚类方法或者SGONG聚类方法对训练集的所有像素点对应的第一二值特征向量进行学习,得到多个聚类中心-单词,但并不限于上述两种聚类方法。

对于步骤S104,在对训练集的所有像素点对应的第一二值特征向量进行聚类,得到多个单词后,接着获取第一向量,具体为,每个训练样本具有多个像素点,每个像素点对应一个第一二值特征向量,将一个训练样本的各第一二值特征向量按照顺序组成第一矩阵,接着,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量;每一个训练样本对应一个第一向量。

将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,比起直接采用原始的第一矩阵表示具有更好的数据适应性。

对于步骤S105,当得到训练集中每个训练样本对应的第一向量后,训练过程完成,开始人脸识别过程,采用上述获取第一向量相同的方法获取待检测人脸的图像对应的第二向量,具体为:获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量。

在该步骤中,获取第二二值特征向量的方法与获取第一二值特征向量的方法相同。

对于步骤S106,在得到第一向量和第二向量后,便可以根据第一向量和第二向量,得到人脸识别结果,比如可采用分类器的方法:将第一向量和第二向量输入分类器,使得分类器计算各第一向量和第二向量之间的欧式距离,获取分类器返回的第二向量与各第一向量的欧式距离,将与第二向量的欧式距离最短的第一向量对应的训练样本所对应的人脸图像识别为待检测人脸的图像。

本实施例的基于稀疏投影二值编码的人脸识别方法,包括获取训练集中各训练样本的各像素点对应的第一像素差值向量;其中,训练样本为人脸图像,训练集中包括多幅不同的人脸图像;根据第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各像素点对应的第一二值特征向量;对所有的第一二值特征向量进行聚类,得到多个聚类中心-单词;将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量;获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量,根据第一向量和第二向量,得到人脸识别结果。本实施例的基于稀疏投影二值编码的人脸识别方法采用采用稀疏投影矩阵对实值表示的像素差值向量进行编码得到二值特征向量,并对二值特征向量进行聚类得到单词,采用单词线性重建每幅人脸图像对应的二值特征向量组成的矩阵,识别速度快,解决了训练样本过度拟合的问题,且对数据的适应性好,提高了人脸识别方法的识别人脸的准确性和快速性。

下面对图1所示方法实施例的技术方案进行详细说明。

首先对根据第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各像素点对应的第一二值特征向量的方法进行说明。

图3为本发明实施例提供的基于稀疏投影二值编码的人脸识别方法实施例二的流程图,如图3所示,本实施例的方法包括:

S301,引入第一目标函数中的稀疏投影矩阵R的代理矩阵S,将第一目标函数变换为第二目标函数;

S302,对第二目标函数进行求解,得到第一二值特征向量。

对于步骤S301,引入R的代理矩阵S,S矩阵的大小和矩阵R相同,将第一目标函数变换为第二目标函数,第二目标函数如公式四所示:

其中,变量α表示代理矩阵S的惩罚因子,用以平衡公式四中和这两项的变量,|S|0表示代理矩阵S中非0元素的个数,表示代理矩阵S与二值编码B之间的量化误差,表示代理矩阵S与R之间的误差;其中代理矩阵S也为稀疏投影矩阵。

对于步骤S302,对第二目标函数进行求解,得到第一二值特征向量的方法,具体为:

将第二目标函数中的S和B随机赋予初始值S0和B0,并固定第二目标函数中的S和B,更新第二目标函数中的R,得到R1,具体为:

将第二目标函数改成写第一表达式,第一表达式如公式五所示:

其中,C1=SX,为固定值;

求解第一表达式,得到R1,具体为:

通过公式六或公式七得到R1

其中,thrm表示将得到的矩阵中的最大的m个元素保留,其余的元素置0;Rt+1表示利用公式六第(t+1)次迭代得到的解,Rt表示利用公式六上一次(即第(t)次)迭代的解,当迭代次数为N时,利用公式六得到的解收敛,停止迭代,此时得到的RN=R1,其中R1表示对第二目标函数求解时,第一次迭代得到的R;

R1=thrm(S) 公式七;

其中,R1表示对第二目标函数求解时,第一次迭代得到的R。

将第二目标函数中的B赋予初始值B0,将第二目标函数中的R赋为R1,并固定第二目标函数中的B和R,更新第二目标函数中的S,得到S1,具体为:

将第二目标函数改成写第二表达式,第二表达式如公式八所示:

其中,C2=(B+αRX)/(1+α)为固定值;

求解第二表达式,得到S1,具体为:

通过公式九求解S1

对进行奇异值分解得到U,V:S1=VUT.......公式九;

其中,S1表示对第二目标函数求解时,第一次迭代得到的S;

将第二目标函数中的S赋为S1,将第二目标函数中的R赋为R1,并固定第二目标函数中的S和R,更新第二目标函数中的B,得到B1,具体为:

将第二目标函数改成写第三表达式,第三表达式如公式十所示:

其中,C3=SX,为固定值;

求解第三表达式,得到B1,具体为:

通过公式十一得到B1

B=sign(C3)=sign(SX) 公式十一;

其中,sign(*)为符号函数,将自变量*大于0时,sign(*)函数输出1,否则,sign(*)函数输出0,B1表示对第二目标函数求解时,第一次迭代得到的B;自变量是指矩阵C3中的元素。

将第二目标函数中的S赋为S1,将第二目标函数中的B赋为和B1,并固定第二目标函数中的S和B,更新第二目标函数中的R,得到R2

将第二目标函数中的B赋为B1,将第二目标函数中的R赋为R2,并固定第二目标函数中的B和R,更新第二目标函数中的S,得到S2

将第二目标函数中的S赋为S2,将第二目标函数中的R赋为R2,并固定第二目标函数中的S和R,更新第二目标函数中的B,得到B2

重复执行将第二目标函数中的S赋为Sm-1,将第二目标函数中的B赋为和Bm-1,并固定第二目标函数中的S和B,更新第二目标函数中的R,得到Rm;将第二目标函数中的B赋为Bm-1,将第二目标函数中的R赋为Rm,并固定第二目标函数中的B和R,更新第二目标函数中的S,得到Sm;将第二目标函数中的S赋为Sm,将第二目标函数中的R赋为Rm,并固定第二目标函数中的S和R,更新第二目标函数中的B,得到Bm的操作,直至完成M次迭代,第M次迭代得到的BM即为满足第一目标函数的各像素点对应的第一二值特征向量;其中,m代表第m次迭代,m、M均为正整数。

其中,M的取值可根据实际需要确定,本实施例中不作限定。

下面对上一实施例中的公式六、公式十一的推导过程进行介绍。

首先对公式六的推导过程进行说明;

对于表达式一的求解过程比较困难,引入第三目标函数,第三目标函数如公式十二所示:

其中,

根据F-范数的性质,表达式是恒大于0的,因此,第三目标函数的数值不会小于表达式一的数值,因此公式十二的最优解仍然满足表达式一;

采用迭代的求解第三目标函数,即固定S更新R,将第三目标函数变换为表达式四,表达四如公式十三所示:

其中,const表示不依赖R的常量;

表达式四的向量形式如下式所示:

其中,该式的解可以表示为其矩阵形式的解可以泛化为公式十四:

采用公式十四进行迭代求解R,迭代公式即为公式六。

其次,对公式十一的推导过程进行说明。

表达式二可展开为式一的形式:由于矩阵B是正交的,因此为一个常数,因此,上式则进一步简化为:

其中,n表示训练样本的个数,c表示二值特征向量的维度,为了最大化上式,需要当(C3)ij大于等于0时,让Bij=1,当(C3)ij小于0时,让Bij=1,于是转化成了对公式十一的求解。

其次,对上述实施例中的步骤“将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量”进行说明。

将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量,包括:

采用单词对第一矩阵进行线性重建,得到第一线性重建结果,第一线性重建结果的表达式如公式二所示:

Bi=ai1S1+ai2S2+...+aikSk 公式二;

其中,Bi为第i个训练样本的各第一二值特征向量组成的第一矩阵,Sk为第k个单词,aik为在第i个训练样本的对应的所述第一矩阵采用单词进行线性重建时第k个单词的权重;

将第一线性重建结果的表达式中的各单词对应的权重组成第一向量(ai1,ai2,……,aik)。

接着,对上述实施例中的步骤“获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量”进行说明。

获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量,包括:

获取待检测人脸的图像的各像素点对应的第二像素差值向量,并根据第二像素差值向量获取满足第一目标函数的待检测人脸的图像的各像素点对应的第二二值特征向量;

将各所述第二二值特征向量组成所述第二矩阵,并将所述第二矩阵采用所述单词进行线性重建,得到所述第二线性重建结构,所述第二线性重建结果的表达式如公式三所示:

B测试=b1S1+b2S2+...+bkSk 公式三;

其中,B测试为各所述第二二值特征向量组成的第二矩阵,Sk为第k个单词,bk为所述第二矩阵采用所述单词进行线性重建时第k个单词的权重;

将所述第二线性重建结果的表达式中的各所述单词对应的权重组成所述第二向量(b1,b2,……,bk)。

其中,获取第二像素差值向量的方法与获取第一像素差值的方法相同,具体为:

将待检测人脸的图像划分为多个块;

以每个块中的每个像素点为第二中心像素点,以r为半径,得到第二中心像素点的第二邻域像素点,并按照顺时针方向,将第二邻域像素点的像素值与第二中心像素点的像素值进行差值运算,得到长度为(2×r+1)×(2×r+1)-1维的第二像素差值向量;

获取第二二值特征向量的方法与获取第一二值特征向量的方法相同,此处不再赘述。

图4为本发明提供的基于稀疏投影二值编码的人脸识别装置的结构示意图,如图4所示,本实施例的装置可以包括:计算单元401,聚类单元402,第一向量获取单元403,第二向量获取单元404,识别单元405。

计算单元401,用于获取训练集中各训练样本的各像素点对应的第一像素差值向量;其中,训练样本为人脸图像,训练集中包括多幅不同的人脸图像;

计算单元401还用于根据第一像素差值向量获取满足基于稀疏投影矩阵的第一目标函数的各像素点对应的第一二值特征向量;

聚类单元402,用于对所有的第一二值特征向量进行聚类,得到多个聚类中心-单词;

第一向量获取单元403,用于将各训练样本相对应的第一二值特征向量组成第一矩阵,采用单词对第一矩阵进行线性重建,得到第一线性重建结果,根据第一线性重建结果得到第一向量;其中,每个训练样本对应一个第一向量;

第二向量获取单元404,用于获取待检测人脸的图像的各像素点对应的第二二值特征向量,并将各第二二值特征向量组成第二矩阵,采用单词对第二矩阵进行线性重建,得到第二线性重建结果,根据第二线性重建结果得到第二向量;

识别单元405,用于根据第一向量和第二向量,得到人脸识别结果。

本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1