多方向权重优化的紧凑图结构人脸特征提取算法的制作方法

文档序号:15518694发布日期:2018-09-25 18:54阅读:536来源:国知局

本发明属于人脸识别技术领域,尤其是一种多方向权重优化的紧凑图结构人脸特征提取算法(mowclgs)。



背景技术:

完整的人脸识别技术主要包括如下三个步骤:人脸图像预处理、人脸图像特征提取和人脸图像的分类识别。具体来说,首先在复杂的环境中检测到人脸,然后对人脸图像进行感兴趣区域提取,再提取相应的人脸图像特征,最后再对人脸图像进行匹配和识别,详细操处理过程如图13所示。

特征提取作为人脸识别系统的关键部分,其目的是从图像中寻找出最具代表性、独特性的有效特征信息,所提取到的特征信息的好与坏将直接影响最终的分类与识别性能。在这一环节中,若是提取的特征足够有效,即便是采用最简单的分类器,也能够得到较好的分类结果;反之,若是特征提取这一步无法提取到有用的信息,再好的分类器也无法获得理想的结果。因此,特征提取是人脸识别系统最重要的环节。

特征提取算法一般可以分为基于全局特征和基于局部特征两种。基于全局特征的人脸提取方法主要是对训练样本的整体图像进行统计学习提取整体的特征信息,较为典型的有主成分分析法(pca)、核pca、fisher线性判别法(lda)、局部保持投影(lpp)和独立成分分析(ica)等。基于全局特征的算法适合于对整个图像进行描述,其存在的问题是无法分辨出前景和背景,特别是如果感兴趣的区域被遮挡,全局特征就会被破坏。基于局部特征的人脸提取方法主要是通过剔除图像内部的冗余信息,来提取最能表征图像特征的稳定信息,较有代表性的有局部二值模式(lbp)、局部梯度二值模式(lgp)、中心对称局部二值模式(cslbp)和韦伯局部描述子(wld)等。基于局部特征的算法很好地解决了全局特征方法中的遮挡问题,它可以在物体受到干扰时,通过一些未被遮挡的特征点来还原重要的信息。多数研究表明:基于局部特征的人脸提取方法相对于基于全局特征的人脸提取方法要更具优势,识别效果更好。

目前,基于局部图结构的特征提取算法有很多种。2011年,abusham等人将图结构这一概念用于特征提取,提出了局部图结构算子(lgs)。该算法是在4×3的邻域内构建图结构,并比较相邻像素值的大小,将其用二进制0或1表示,最后把得到的二进制字符串转换成十进制,作为中心像素的特征值。此算法的缺点在于整个计算过程中中心像素周围的取值不对称,从而造成某些信息的缺失。在此算法的基础上,有学者对lgs算法进行改进,提出了局部对称的图结构算子slgs,将对称的思想用于局部图结构算子中,通过对称的结构来表述相邻像素之间的关系,对目标像素左侧、右侧的算子进行平衡地利用,从而提取图像像素之间的空间信息。但是,上述两种方法仍然存在图像灰度在某个方向突变造成的特征提取不到位以及因权重分配不均造成特征提取不均衡等问题。



技术实现要素:

本发明的目的在于克服现有技术的不足,提出一种设计合理、能够准确地描述人脸特征且识别率高的多方向权重优化的紧凑图结构人脸特征提取算法。

本发明解决其技术问题是采取以下技术方案实现的:

一种多方向权重优化的紧凑图结构人脸特征提取算法,包括以下步骤:

步骤1、在一幅人脸灰度图像中,遍历所有的5×5大小的邻域;

步骤2、在每个邻域的中心点上分别构造0度方向、45度方向、90度方向、135度方向的图结构,每个图结构按照一定顺序使用箭头所指元素与箭头尾端元素逐个做差,如果箭头方向像素的值大于前一像素的值,则连接两像素的边赋值为1,否则赋值为0,最终按照顺序形成四个二进制字符串;

步骤3:对四个二进制字符串对应的各边分别分配不同的权重进行加权,并将每个二进制字符串转化为十进制数;

步骤4:取四个十进制数中最大的数作为中心像素的特征值;

步骤5:按照上述方法得到图片上每个点的特征值,将人脸灰度图像转换成特征空间里的点,将特征空间的两点间的距离看作相似度准则,使用三近邻分类器与数据库中已有人脸灰度图像的特征进行比对,从而判断该人脸的身份信息。

所述每个图结构均包括七个元素,并以中心点在0度方向、45度方向、90度方向和135度方向对称。

所述0度方向图结构包括的元素坐标为:(x2、y2)、(x4、y2)、(x1、y3)、(x3、y3)、(x5、y3)、(x2、y4)和(x4、y4);所述45度方向图结构包括的元素坐标为:(x3、y2)、(x4、y2)、(x2、y3)、(x3、y3)、(x4、y3)、(x2、y4)和(x3、y4);所述90度方向图结构包括的元素坐标为:(x3、y1)、(x2、y2)、(x4、y2)、(x3、y3)、(x2、y4)、(x4、y4)和(x3、y5);所述135度方向图结构包括的元素坐标为:(x2、y2)、(x3、y2)、(x2、y3)、(x3、y3)、(x4、y3)、(x3、y4)和(x4、y4)。

所述步骤2中的一定顺序为:中心点指向一侧元素并以逆时针顺序,中心点指向另一侧元素并以逆时针顺序。

所述步骤3中权重的分配原则为:距离中心像素近的边分配权重较大,距离中心像素远的边分配权重小。

本发明的优点和积极效果是:

本发明设计合理,通过遍历人脸灰度图像上所有的5×5的邻域,在每个中心点构造四个方向的图结构,充分结合中心点周围的像素,避免图像灰度在某个方向突变造成的特征提取不到位的问题;在得到的四个二进制字符串的基础上合理分配权重,最终得到图像的特征值,该特征值较为全面的描述了人脸图像的特征信息,可以进行有效的人脸识别,同时识别率有较大提高;除此之外,本发明构造的图结构尽可能靠近中心点,从而更加充分的提取周围像素的信息。

附图说明

图1是原始的5×5邻域图像像素值;

图2是本发明在邻域内构建的0度方向图结构;

图3是本发明在邻域内构建的45度方向图结构;

图4是本发明在邻域内构建的90度方向图结构;

图5是本发明在邻域内构建的135度方向图结构;

图6是本发明在0度方向图结构形成过程示意图;

图7是本发明在0度方向图结构的阈值化示意图;

图8是带有像素值的0度方向图结构;

图9是带有像素值的45度方向图结构;

图10是带有像素值的90度方向图结构;

图11是带有像素值的135度方向图结构;

图12为本发明的图结构权重分配图;

图13为现有人脸识别过程示意图。

具体实施方式

以下结合附图对本发明实施例做进一步详述。

一种多方向权重优化的紧凑图结构人脸特征提取算法,包括以下步骤:

步骤1:在一幅人脸灰度图像中,遍历所有的5×5大小的邻域。

本发明所用的数据库图片均已处理成灰度图像,并处理成相同大小尺寸。

在本实施例中,组成图结构的像素值分别为56、80、45、38、90、40、52、3、8、15、61、45、60、62、58、55、51、32、84、85、30、64、25、18、40,如图1所示。

步骤2:在每个5×5邻域中位于中心的点上构造四个方向的图结构,分别为0度、45度、90度、135度,如图2至图5所示,每个图结构按照标注的顺序使用箭头所指元素与箭头尾端元素逐个做差。如果箭头方向像素的值大于前一像素的值,那么,连接两像素的边赋值为1,否则赋值为0。最终形成四个二进制字符串。

下面以0度方向图结构为例,计算此方向上的特征值,如图6、图7及图8所示所示。将得到的图结构从中心像素出发,先计算中心像素左侧差值再计算中心像素右侧差值,使用箭头所指元素与箭头尾端元素逐个做差的方法。对于目标像素60来说,从60左侧出发,按照箭头所指方向,60<61,因此60和61相连的边则置为1;61>51,因此61和51相连的边则置为0;51<52,因此51和52相连的边则置为1;52<61,因此52和61相连的边则置为1,这样就完成了对目标像素左侧像素值的利用。接下来计算目标像素右侧的部分。60<58,因此60和58相连的边则置为0;58>8,因此58和8相连的边则置为0;8<84,因此8和84相连的边则置为1;84<58,因此84和58相连的边则置为0。通过8次比较,我们可以得到8个2进制位1、0、1、1、0、0、1、0。

按照以上方法,结合原始的5×5邻域图像像素值和45度方向图结构、90度方向图结构、135度方向图结构,如图9、图10、图11所示,计算其他三个方向的二进制字符串分别为45度:0,0,1,1,0,0,1,0。90度:0,1,0,0,0,1,0,1。135度:1,0,0,1,0,0,0,1。

步骤3:对四个字符串分别赋予不同的权重进行加权将每个二进制字符串转化为十进制数。

在本步骤中,将得到的四个8位二进制数按照如图12所示权重赋值的示意图,进一步计算特征值,可以得到四个方向的特征值

feature0=1×128+0×16+1×8+1×1+0×64+0×32+1×4+0×2=141

feature45=0×128+0×16+1×8+1×1+0×64+0×32+1×4+0×2=13

feature90=0×128+1×16+0×8+0×1+0×64+1×32+0×4+1×2=50

feature135=1×128+0×16+0×8+1×1+0×64+0×32+0×4+1×2=131

经过上述操作,可以得到四个特征值,分别记为feature0(0度方向特征值)、feature45(45度方向特征值)、feature90(90度方向特征值)、feature135(135度方向特征值)。

步骤4:取四个十进制数中最大的数作为中心像素的特征值。

通过上一步差值的计算过程,我们可以知道,这四个特征值在计算过程中,主要是差值像素值大小比较,通过比较给各边赋值,最终得到目标像素的四个特征值特征值,代表了四个方向上的像素值变化情况。在特征值大的方向上,像素之间变化大,更能体现目标像素周围像素的位置信息和梯度信息,而这种信息比一般的像素值信息更为稳定。因此在本实施例中,选取其中的最大值141作为目标像素的特征值。

步骤5:按照上述方法得到图片上每个点的特征值,人脸图像转换成特征空间里的点,将特征空间的两点间的距离看作相似度准则,使用三近邻分类器与数据库中已有的人脸图像的特征进行比对,从而判断该人脸的身份信息。

假设l(x,y)表示x、y两个样本间的距离,k表示特征维数,则距离函数l(x,y)的通用表达式为:

式(1)又称为minkowsky距离,本文采用的分类方法——三阶近邻法,就是minkowsky距离中在λ=1的一种特殊情况,其距离公式为:

然而,通过距离计算得到的具有最小值的两幅图像并不能说明就一定会属于同一类别。

有关三阶近邻法的步骤如下:先计算出跟测试图像距离最近的三幅图像。比如,距离测试图像最近的3幅图像分别属于3个不同的类:class1,class2,class3,此这情况下,若是class1与class2不属于同一类,并且class2与class3也不属于同一类,则能够判定出该测试图像属于class1;若是class1与class2属于同一类,则可得出测试图像属于class1,而且class2与测试图像相似;若是class2与class3属于同一类,则可得出该测试图像属于class2,而且class3与测试图像相似,这个时候,class1虽然与测试图像的距离最近,但它们却并不属于同一类。由于本发明的重点主要集中在特征提取方法的研究,在图像分类这一阶段,所有的实验均采用三阶近邻分类器进行分类。

需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1