一种基于学习及特征鉴别的核图像微分滤波器设计方法与流程

文档序号:12124106阅读:248来源:国知局
一种基于学习及特征鉴别的核图像微分滤波器设计方法与流程

本发明涉及模式识别及分类领域,具体涉及一种基于学习及特征鉴别的核图像微分滤波器设计方法,尤其对人脸或特定目标的分类与识别。



背景技术:

提取高效且具有鉴别力的特征描述是人脸识别及其他模式识别应用中的一个关键问题,特征提取质量的好坏将直接影响后继分类、识别的性能。以人脸识别应用为例,特征提取的目标是在获得高效鉴别能力的同时尽可能增加特征的类内相似度并减小类间相似度。然而,受到表情、光照、姿势、遮挡等各种因素的影响,高效、鲁棒的特征提取仍然是一个热点研究问题。

现有人脸特征描述方法总体上可分为整体特征提取和局部特征提取两大类。整体特征提取常用的方法有PCA(参见文献“Kim K. Face recognition using principle component analysis[C]//International conference on computer vision and Pattern recognition. 1996: 586-591.”),LDA(参见文献“Belhumeur P N, Hespanha J P, Kriegman D J. Eigenfaces vs. fisherfaces: Recognition using class specific linear projection[J]. IEEE Transactions on pattern analysis and machine intelligence, 1997, 19(7): 711-720.”),DCV(参见文献“Cevikalp H, Neamtu M, Wilkes M, et al. Discriminative common vectors for face recognition[J]. IEEE Transactions on pattern analysis and machine intelligence, 2005, 27(1): 4-13.”),GDA(参见文献“Baudat G, Anouar F. Generalized discriminant analysis using a kernel approach[J]. Neural computation, 2000, 12(10): 2385-2404.”), KDCV(参见文献“Cevikalp H, Neamtu M, Wilkes M. Discriminative common vector method with kernels[J]. IEEE Transactions on Neural Networks, 2006, 17(6): 1550-1565.”)等。PCA旨在寻找使全局特征样本向量方差最大化下的降维投影,在保证重建误差最小的情况下把人脸图像向量从复杂的高维降到更容易区分的低维向量。LDA进一步利用了样本的标签信息,寻找在能扩大样本类间差异的同时又能缩小类内样本差异的降维投影。DCV算法在类内协方差矩阵的零空间内寻找判别共同矢量,通过判别共同矢量组得到最优的投影矩阵对高维人脸样本向量进行降维特征提取。GDA和KDCV分别是对LDA和DCV在核空间的扩展,其把原始向量向更高维空间进行非线性投影后再进行降维以提取更具鉴别力的特征。Gabor(参见文献“Liu C, Wechsler H. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition[J]. IEEE Transactions on Image processing, 2002, 11(4): 467-476.”)和LBP(参见文献“Ahonen T, Hadid A, Pietikainen M. Face description with local binary patterns: Application to face recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2006, 28(12): 2037-2041.”)是常见的局部特征描述子,二者对于局部光照、表情变化以及图像的非精确对齐有较好的鲁棒性。Gabor小波可以获得不同尺度和方向下的局部特征结构,对光照和表情变化都比较鲁棒。LBP用邻域各点灰度值与中心点相比较,是简单有效的人脸特征描述方法。

上述人脸特征描述均采用手工设计的特征描述子,该类方法从主观的手动设计原则出发,很难得到最优的编码方案。针对该问题,Zhen Lei等在近期提出了一种具有分类判别作用的可学习图像滤波器IFL(参见文献“Lei Z, Yi D, Li S Z. Discriminant image filter learning for face recognition with local binary pattern like representation[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 2512-2517.”)并将其与LBP结合在特征描述阶段就对人脸图像实现初步分类判别。随后,IFL又被应用到可学习人脸特征描述器DFD(参见文献“Lei Z, Pietikäinen M, Li S Z. Learning discriminant face descriptor[J]. IEEE transactions on pattern analysis and machine intelligence, 2014, 36(2): 289-302.”)上。IFL将Fisher判别准则与LBP算法融合,在提取各张人脸图片特征的同时获取不同样本图片间的类别特征,提高了滤波后图像的分类鉴别能力。可学习图像滤波器IFL不仅能使滤波后的人脸图像更具有鉴别力,更重要的是其由训练集动态学习得来,具有自适应性,在不同的训练集上可针对性地获得最优滤波器参数。由于IFL直接在像素空间进行滤波器学习,光照、表情、姿势等因素往往会造成人脸识别过程中的非线性问题,而线性的IFL不能够更好地处理此类问题。此外,为模拟LBP的临域像素对比的思想,IFL在进行滤波器学习过程中仅利用了图像的一阶微分信息,而图像中的角点、灰度变化率等高阶微分信息并未充分利用。



技术实现要素:

本发明根据上述现有技术中存在的问题,提供一种基于学习及特征鉴别的核图像微分滤波器设计方法。

为解决上述问题,本发明采用的技术方案是:一种基于学习及特征鉴别的核图像微分滤波器设计方法,其特征在于,包括:p线性判别滤波器中任意一点对应的原图像块向量以p为中心的局部区域按行拉伸组成仅包含p的临域像素信息的图像块向量;在图像块向量的基础上进行维数扩充,在原图像块向量中串联该像素点处的一阶和二阶微分信息;

设p点坐标为,该p点处沿x,y方向的一阶微分近似可由下式获得:

该p点处沿x,y方向的二阶微分近似由下式获得:

其中I为图像在坐标处的亮度;

令为第t个人的第j个样本图像,为图像在p点处经过以上微分信息扩充后的图像块向量。如果有L个待处理像素,将这L个像素的图像块向量拼合构建图像块向量矩阵;

此时类内散布阵和类间散布阵分别表示为:

其中是第类所有样本图像块向量矩阵均值,是整体均值;

对类内散布阵和类间散布阵引入核运算,即引入核运算的类内散布阵和类间散布阵分别为:

其中带有前置符号的数据表示原样本空间中数据投影到高维空间下对应的高维数据;

此时使得值最大的即为待求的高维空间中最优的滤波器向量;的最大特征值对应的特征向量即为最优, 即为滤波后样本的图像块向量。

与现有技术相比,本发明具有以下优点:

本发明在线性滤波分类器的基础上引入一阶和二阶微分信息,结合核方法在高维空间下进行滤波器学习,并在学习过程中融入线性判别分析思想,使得图像中的细节和非线性信息可以得到更好的利用并获得能够产生更具鉴别力特征描述的图像滤波器。

附图说明

图1为本发明提出一种基于学习及特征鉴别的核图像微分滤波器设计方法流程图;

图2为本发明提出的图像块向量的一阶和二阶微分信息扩充示意图;

图3是本发明的图像块向量矩阵构建示意图。

具体实施方式

以下结合附图对本发明进行进一步的说明。

参见图1,为本发明提出一种基于学习及特征鉴别的核图像微分滤波器设计方法流程图。

如图1所示,一种基于学习及特征鉴别的核图像微分滤波器设计方法,其特征在于,包括:

步骤101,线性判别滤波器中任意一点P对应的原图像块向量以P为中心的局部区域按行拉伸组成仅包含P的临域像素信息的图像块向量;

步骤102,在图像块向量的基础上进行维数扩充,在原图像块向量中串联该像素点处的一阶和二阶微分信息。

参见图2,为本发明提出的图像块向量的一阶和二阶微分信息扩充示意图。设P点坐标为,该P点处沿x,y方向的一阶微分近似可由下式获得:

该P点处沿x,y方向的二阶微分近似由下式获得:

其中I为图像在坐标处的亮度;

步骤103,构建图像块向量矩阵,形成类内散布阵和类间散布阵。

参见图3,是本发明的图像块向量矩阵构建示意图;

令为第t个人的第j个样本图像,为图像在p点处经过以上微分信息扩充后的图像块向量。如果有L个待处理像素,将这L个像素的图像块向量拼合构建图像块向量矩阵;

此时类内散布阵和类间散布阵分别表示为:

其中是第i类所有样本图像块向量矩阵均值,是整体均值;

步骤104,对类内散布阵和类间散布阵引入核运算,即引入核运算的类内散布阵和类间散布阵分别为:

其中带有前置符号的数据表示原样本空间中数据投影到高维空间下对应的高维数据;

此时使得值最大的即为待求的高维空间中最优的滤波器向量。求最优的问题可以转化为的特征值分解问题,其最大特征值对应的特征向量即为最优,即为滤波后样本的图像块向量。

上面结合附图对本发明优选实施方式作了详细说明,但是本发明不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。不脱离本发明的构思和范围可以做出许多其他改变和改型。应当理解,本发明不限于特定的实施方式,本发明的范围由所附权利要求限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1