基于融合HOG特征和深度信念网络的人脸识别算法的制作方法

文档序号:13983296阅读:1024来源:国知局
本发明属于图像处理
技术领域
:,具体涉及一种基于融合hog特征和深度信念网络的人脸识别算法。
背景技术
::人脸特征的分布是非常复杂和非线性的。人脸的表情,人的姿势、年龄、所处的位置,以及光照条件和覆盖等因素都不同程度地影响人脸识别效果。有效的人脸特征提取和描述是提高人脸识别精度的关键。目前,主要的特征提取方法将人脸特征分为两大类:全局特征和局部特征。全局特征可以表示完整的结构信息,例如脸部轮廓、肤色和人脸特征的整体性质。为了提取这些特征,基于全局特征的方法构建训练集的线性子空间,其他图像可以通过投影到该线性子空间来重新表达。典型的基于子空间的方法包括主成分分析(pca,principalcomponentanalysis)、线性判别分析(lda,lineardiscriminantanalysis)和独立成分分析(ica,independentcomponentanalysis)。pca方法具有很强的降低特征维度的能力,但降维过程需要很多时间,降低了算法的效率。虽然基于子空间的方法可以降低高维特征的维度并获得良好的识别效果,但是人脸本身引入的差异,如疤痕和痣等不能被识别。因此,基于子空间的方法在特征分类中有明显的局限性。局部特征对于光线条件、人脸的表情和态度变化表现得都很健壮。为了适应局部变化,局部特征方法基于面部器官与特征部位之间的对应几何关系来训练识别参数。局部特征方法主要包括gabor变换、局部二进制模式(lbp,localbinarypatterns)、定向梯度直方图(hog,histogramoforientedgradient)和局部非负矩阵分解(lnmf,localnon-negativematrixfactorization)。基于gabor变换的方法可以提取多方向和多尺度的信息,同时,对光线条件和表达方式表现得都很健壮,但是gabor变换效率较低,因为特征是高维度。相对来说,lbp是一个非参数的局部纹理描述运算符,可以捕获图像中的精细细节特征,因此,lbp特征是非常有效的纹理描述符,具有很强的分类能力。此外,lbp特征对光照不敏感,并且可以与图像的全局特征相互补充。然而,lbp算子的局限性在于受限于局部邻域,不能获得全局结构特征。同时,相邻区域的lbp码与其相邻像素有关,所以对噪声敏感。因此,尽管lbp对单调线性照明具有良好的鲁棒性,但它对随机噪声的适应性差。基于直方图序列的多级lbp方法,虽然图像的局部特征和全局特征由可调窗口提取,且不同级别的lbp直方图特征融合到纹理描述符中,但是边缘方向特征无法有效表征。与lbp(纹理特征)不同,hog(梯度特征)可以基于块内统计特性来提取。由于hog特征对方向信息和光的变化不敏感,所以可以有效地表示边缘和形状信息。因此,即使在低维度下,hog(梯度特征)也能获得较高的识别率。albiol将hog特征与用于人脸识别的弹性图相结合,达到了很高的识别准确率,这证实了hog特征对于外部干扰(如光,旋转和偏移变化)具有较强的鲁棒性。总之,全局特征可以表示面部识别中粗匹配所需的完整结构特征。然而,它缺乏对光、脸部表情和闭塞的坚固性。另一方面,局部特征主要描述脸部细节的变化,提取人脸重要特征,可以用于精确确认。通过融合全局特征和局部特征,可以大大提高人脸识别的准确性。通过弹性图匹配(ebgm,elasticbunchgraphmatching)模型来描述面部,ebgm模型实现了全局和局部特征的统一。也就是说,属性映射的结构信息描述了面部的全局属性,属性映射的顶点描绘了面部的关键区域的局部属性。kim使用全局和局部特征构建了不同的分类器,并将全局和本地信息集成在决策层上。通过融合分类器的输出可以获得高精度匹配结果。深度信念网络(deepbeliefnetwork,dbn)由geoffreyhinton在2006年提出。它是一种生成模型,通过训练其神经元间的权重,我们可以让整个神经网络按照最大概率来生成训练数据。我们不仅可以使用dbn识别特征、分类数据,还可以用它来生成数据。dbn由多层神经元构成,这些神经元又分为显性神经元和隐性神经元(以下简称显元和隐元)。显元用于接受输入,隐元用于提取特征。因此隐元也有个别名,叫特征检测器(featuredetectors)。最顶上的两层间的连接是无向的,组成联合内存(associativememory)。较低的其他层之间有连接上下的有向连接。最底层代表了数据向量(datavectors),每一个神经元代表数据向量的一维。dbn的组成元件是受限玻尔兹曼机(restrictedboltzmannmachines,rbm)。训练dbn的过程是一层一层地进行的。在每一层中,用数据向量来推断隐层,再把这一隐层当作下一层(高一层)的数据向量。如前所述,rbm是dbn的组成元件。事实上,每一个rbm都可以单独用作聚类器。rbm只有两层神经元,一层叫做显层(visiblelayer),由显元(visibleunits)组成,用于输入训练数据。另一层叫做隐层(hiddenlayer),相应地,由隐元(hiddenunits)组成,用作特征检测器(featuredetectors)。显层和隐层内部的神经元都没有互连,只有层间的神经元有对称的连接线。这样的好处是,在给定所有显元值的情况下,每一个隐元取什么值是互不相关的。也就是说,同样,在给定隐层时,所有显元的取值也互不相关:有了这个重要性质,我们在计算每个神经元的取值情况时就不必每次计算一个,而是同时并行地计算整层神经元。技术实现要素:为了克服现有的人脸识别方法存在的不足,本发明提供一种基于融合hog特征和深度信念网络的人脸识别算法。所述算法通过选择融合的hog特征作为dbn网络的输入,以帮助dbn网络了解图像特征的分布,提高dbn的表征能力;利用dbn训练提取的特征,有效减少人为干预,实现人脸识别自动化。为实现上述目标,本发明采用以下技术方案:一种基于融合hog特征和深度信念网络的人脸识别算法,所述算法包括以下步骤:1)、将源图像划分为单元格:将图像分别分割成2×2、2×4和4×4的分块并提取全局特征gfhog和分块特征bfhog;计算单元格中每个像素的梯度值和边缘直方图。像素(x,y)的水平和垂直梯度可以根据公式(1)和公式(2)获得。ix(x,y)=i(x+1,y)-i(x-1,y)(1)iy(x,y)=i(x,y+1)-i(x,y-1)(2)像素点(x,y)的梯度幅值与方向可以根据其水平方向和垂直方向得出,计算过程如式(3)、式(4)。2)、计算图像的融合特征:通过顺序级联融合特征gfhog和分块特征bfhog,得到最终的融合特征fhog;3)、训练dbn网络:将融合后的特征fhog输入到dbn网络中,训练使网络达到最优,同时通过bp算法微调整个网络;e(v,h)是在可见层与隐藏层的节点状态已知并且偏置与权重等网络参数也已知的情况下得到的。式中nv表示可见层节点数,nh为隐藏层节点数,vi表示可见层的第i个节点状态,hj为隐藏层第j个节点的状态,wij为可见层与隐藏层之间的连接权重,ai为可见层偏置,bj为隐藏层偏置。根据rbm的能量函数就可以求得可见层与隐含层节点之间的联合概率分布如式(5)、式(6)、式(7)。rbm学习目的是得到网络参数权重和偏置,找到网络最小全局能量结构,并且将能量函数指数化和正则化。在dbn的网络中,对比度散度算法用于预先训练dbn,为每个rbm优化,以获得整个网络节点的权重参数。为了从标记数据的顶部调整整个网络,在训练完成后使用监督中的反向传播(bp)算法,然后可以获得训练有素的深度信念网络。4)、学习图像的高层特征和抽象特征:将测试样本的融合梯度特征fhog输入到训练好的深度信念网络中,通过训练好的网络自下而上学习更高层更抽象的特征;5)、实现图像分类和识别:在网络顶层使用softmax逻辑回归方法进行测试样本的分类和识别。本发明的优点和有益效果为:1)本发明利用hog对方向和光线的不敏感性,首先提取了图像的全局hog特征和局部分块hog特征,将得到的全局和局部的hog特征通过级联进行特征融合,全局特征能够提取人脸轮廓的整体特征但容易受光照、遮挡等局部变化而影响识别,局部特征能很好的适应人脸的局部变化,能够很好的提升识别率,通过将全局和局部hog特征融合,可以很好的发挥全局和局部hog特征的优势,从而有效的提升识别准确率;2)本发明将融合后的hog特征和深度学习模型dbn网络运用到人脸识别中,原图像首先经过gamma校正、差分高斯滤波等预处理,并将图像都剪切成64×80像素的图像,然后对预处理好的图像进行hog特征提取并将其作为dbn的输入,对dbn进行预训练和微调,最后将测试集的图像输入到训练好的dbn网络中进行分类识别,这样就很好地结合了图像的综合特征与深度学习的优点,有利于提高图像识别的准确性和自动化。附图说明图1为本发明融合流程示意图。图2为各种融合算法效果比较示意图。具体实施方式一种基于融合hog特征和深度信念网络的人脸识别算法,所述算法包括以下步骤:1)、将源图像划分为单元格:将图像分别分割成2×2、2×4和4×4的分块并提取全局特征gfhog和分块特征bfhog;计算单元格中每个像素的梯度值和边缘直方图;2)、计算图像的融合特征:通过顺序级联融合特征gfhog和分块特征bfhog,得到最终的融合特征fhog;3)、训练dbn网络:将融合后的特征fhog输入到dbn网络中,训练使网络达到最优,同时通过bp算法微调整个网络;4)、学习图像的高层特征和抽象特征:将测试样本的融合梯度特征fhog输入到训练好的深度信念网络中,通过训练好的网络自下而上学习更高层更抽象的特征;5)、实现图像分类和识别:在网络顶层使用softmax逻辑回归方法进行测试样本的分类和识别。实施例参见附图2,本实施例选择orl、yale、cas-peal三个人脸库中的图像作为识别对象,按照本发明所述算法进行人脸识别,并将识别结果与其它几种传统人脸识别方法的识别效果进行了对比,如表1至表3所示。在表1至表3所示的客观评价指标比较表中,在识别率、特征维度、特征提取时间等几项指标的对比上,虽然本发明所述算法在特征维度和特征提取上略逊色于其他传统算法,但在识别率方面远远超过其他传统算法,从而验证了本发明所述算法的有效性和可行性。表1不同算法在orl人脸库的识别率及各参数table2不同算法在yale人脸库的识别率及各参数table3不同算法在cas-peal人脸库的识别率及各参数最后应说明的是:上述实施例仅仅是为清楚地说明本发明所作的举例,而并非对实施方式的限定。对于所述领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明的保护范围之中。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1