基于稀疏贝叶斯回归的人脸姿势识别方法

文档序号:6441591阅读:192来源:国知局
专利名称:基于稀疏贝叶斯回归的人脸姿势识别方法
技术领域
本发明涉及的是一种图像处理技术领域的方法,具体是一种基于稀疏贝叶斯回归的人脸姿势识别方法。
背景技术
在人脸图像的采集过程中,由于成像设备和人脸的相对视角发生变化,从而得到不同视角下的人脸图像。假定成像设备坐标系固定,不同的成像视角可以看成由于不同的人脸方向得到的,这些不同的人脸方向即为不同的人脸姿势。目前,不同姿势下的人脸识别是人脸识别中的热点问题之一,准确、快速的人脸姿势识别又是解决该问题的一个关键环节。人脸姿势识别还在计算机视觉和计算机图形学领域中起着重要的角色和广泛的应用,比如人脸跟踪、人脸表情识别和人机交互等。由于二维人脸图像缺失第三维的信息,因此人脸姿势识别问题变的很复杂。另外还有许多因素增加了解决此问题的难度,比如环境周围光照的变化、人脸图像的质量、人脸身份的变化等。在人脸姿势识别过程中,还有一个因素需要考虑,就是人脸在深度方向发生旋转而带来的非线性变形。
基于外观的方法是一种有效,且计算成本低的方法。但是需要解决的问题也还是比较多的。比如人脸在深度方向发生旋转,引起一些非线性变化,使用一般的降维方法难以揭示数据中的本质结构,并且影响人脸外观的因素比较多,比如光照的变化、图像质量等因素也影响着此问题的解决。另外,在实际环境中,采集到的人脸图像将会受到一些因素的影响,比如周围环境光照的变化,图像采集设备的分辨率,人脸的表情变化等等。因此,直接用原始的人脸图像像素表征是远远不够的,需要给原始图像一个新的图像表征,在体现姿势差异性的同时,抑止上述提到的不利的因素。
经对现有技术的文献检索发现,Xingliang Ge等在《Optical Engineering》Vol.45,No.9,2006(光学工程,第45卷,第9期,2006年)上,提出了一种基于非线性判别的人脸姿势识别方法。该方法首先用Gabor小波提取人脸特征,然后用SLPP进行降维,最后用支持向量机进行姿势分类。该方法的姿势识别是监督的,也就是说,最终的测试样本的人脸姿势角度必须与训练样本的某个角度相一致。如果训练样本较小,那么就会存在较大的误差。其次,支持向量机需要较多的支持向量,会影响到方法的实时性。

发明内容
本发明的目的在于克服现有技术中的不足,提出一种基于稀疏贝叶斯回归的人脸姿势识别方法,使其能够得到人脸姿势的非确定解,降低错误率,其次,稀疏贝叶斯回归方法使用较少的支持向量,提高了发明的实时性。另外,本发明采用Gabor滤波器为人脸姿势识别提取Gabor特征,抑制不利因素;运用线性切空间排列方法能够探测人脸姿势图像的本质低维结构。
本发明是通过以下技术方案实现的,本发明具体步骤如下(1)采用Gabor滤波器为人脸姿势图像提取Gabor特征。
(2)将Gabor特征进行下采样,然后将采样后的特征行堆叠为一维向量,并组成样本集。
(3)在训练样本上运用线性切空间排列方法,获得人脸姿势图像的本质低维子空间,并且得到相应的投影矩阵。
(4)在低维子空间运用稀疏贝叶斯回归方法训练识别参数。
(5)将每一个测试样本通过训练得到的投影矩阵映射到低维子空间,运用训练得到的识别参数进行人脸姿势识别。
所述的提取Gabor特征,是指将人脸图像与一组Gabor变换核的卷积得到的新的人脸表征。假定I(x,y)是一幅人脸图像,ψμ,v(x,y)为Gabor变换核,其Gabor变换定义如下Oμv(x,y)=I(x,y)*ψμ,v(x,y)。其中,*表示卷积运算,O(x,y)是对μ方向和ν尺度上的Gabor变换核的卷积结果,O(x,y)是人脸图像I(x,y)的Gabor特征。
所述的线性切空间排列方法,是指在训练样本上求得一个投影矩阵A将原始数据投影到低维空间从而得到相应的低维人脸姿势数据。该方法分为四个主要步骤假定低维空间为d维,①对于每一个高维数据点xi,寻找到它的k个最近邻点。将这个局部邻域记为Xi。
②对XiH进行SVD分解,其中HK为中心化矩阵。令Vi为d个最大的特征值对应的右奇异向量,从而用Wi=H(I-ViViT)]]>表示局部邻域的切信息。
③利用迭代的方法构建全局意义上的排列矩阵B,本发明利用这样的公式B(Ii,Ii)←B(Ii,Ii)+WiWiT]]>,i=1,Λ,N。其中,Ii={i1,Λ,ik}表示xi的k个最近邻点的索引。
④最终,投影矩阵可以通过求解这样一个广义特征值问题来获得XHBHXTα=λXHXTα。设α1,α2Λ,αd为上式的特征向量,其对应于特征值λ1<λ2<Λ<λd。那么,转换矩阵A为A=(α1,α2Λ,αd)。这样就得到了投影矩阵。
所述的稀疏贝叶斯回归方法,是指在将测试样本投影到低维空间后,所采用的姿势识别方法。对于稀疏贝叶斯回归,给定一组训练集{(xi,ti)|i=1,K,N},其中,x为输入的模式向量,t为输出目标,可以用这样一个广义的线性回归问题来描述t=y(x,w)+ε。y(x,w)可以表达为一核函数K(xi,x)的线性加权和的形式y(x,w)=Σi=1NwiK(xi,x)+w0]]>。输出目标的概率密度函数为p(t|x,w,σ2)=N(y(x,w),σ2),即满足一个高斯分布。因为所有训练样本都被认为是独立的,所以,全部训练样本的似然函数可以写为p(t|{x1,L,xN},w,σ2)=N(Φw,σ2),其中,Φ是一个N×(N+1)矩阵,Φij=K(xi,xj-1),且Φi1=l。在似然函数中,w和σ的最大似然识别往往会导致过学习问题,为了避免这个问题,会用一个先验概率添加一个对权重w的约束p(w|α)=Πi=0NN(wi|0,αi-1)]]>,其中,α是假设参数向量。最终得到w的表达p(w|t,α,σ2)=N(μ,∑),其中∑-1=σ-2ΦTΦ+diag(α),μ=σ-2∑ΦTt。
本发明能够获得较高的识别正确率。本发明实验证明,在CAS-PEAL数据库上进行人脸姿势识别,能够得到人脸姿势的非确定解,正确率能达到96.83%(7个姿势),高于基于支持向量机的方法。其次,稀疏贝叶斯回归方法与基于支持向量机的方法相比使用较少的支持向量,因此本发明具有更快地运行速度且使用更少的储存空间。
具体实施例方式
下面对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。
本实施例采用了一个公用的人脸数据库CAS-PEAL数据库。CAS-PEAL数据库包含1040个人。在数据库中,共有七个人脸姿势(从左到右旋转),分别是0°,15°,-15°,30°,-30°,45°,-45°。为了降低运行成本,取200个人共1400张图像,将人脸图像缩减到20×20。首先,本实施例运用Gabor滤波器逐像素计算每个像素点的多方向、多尺度Gabor变换特征,形成Gabor特征的人脸表示。本实施例取5个尺度v∈{0,1,2,3,4}和8个方向μ∈{0,1,2,3,4,5,6,7}上使用Gabor核函数。因此,对于每一个人脸图像,可以得到40个20×20大小的Gabor特征。
为了进一步降低运行成本,初步降低空间的维数,对每个Gabor特征以采样因子1/4进行下采样,然后连接采样后的Gabor特征的所有行进行首尾相接连接成一个向量,从而可得到一个扩展的40×20×20×1/4×1/4=1000维Gabor特征向量xi=(O0,0T,O0,1T,...,O4,7T)]]>,其中,T表示转置运算。这样,就得到了向量集X=[x1,L,x1400]。
对于每一种姿势,选取四个样本作为训练样本,这样共有800个训练样本,从中运用线性切空间排列方法将人脸图像降到d维子空间。注意,在这里,本发明得到的转换矩阵A的大小为1000×d。在低维空间中运用稀疏贝叶斯回归方法训练参数w,本实施例运用高斯核函数K(xi,x)=exp(-r‖x-xi‖2)作为核函数的选择。对于发明内容中描述的计算w的公式,本实施例借助EM迭代方法来获取w。
接下来,将每一个测试样本(共600个)运用得到的转换矩阵A投影到低维子空间,然后运用稀疏贝叶斯回归方法训练的到的参数t=y(x,w)+ε识别姿势。至此,本实施例完成了人脸姿势识别的全过程。本实施例在CAS-PEAL数据库上进行人脸姿势识别,正确率能达到96.83%(7个姿势)。
权利要求
1.一种基于稀疏贝叶斯回归的人脸姿势识别方法,其特征在于,具体步骤如下(1)采用Gabor滤波器为人脸姿势图像提取Gabor特征;(2)将Gabor特征进行下采样,然后将采样后的特征行堆叠为一维向量,并组成样本集;(3)在训练样本上运用线性切空间排列方法,获得人脸姿势图像的本质低维子空间,并且得到相应的投影矩阵;(4)在低维子空间运用稀疏贝叶斯回归方法训练识别参数;(5)将每一个测试样本通过训练的得到的投影矩阵映射到低维子空间,运用训练的得到的识别参数进行人脸姿势识别。
2.根据权利要求1所述的基于稀疏贝叶斯回归的人脸姿势识别方法,其特征是,所述的提取Gabor特征,是指将人脸图像与一组Gabor变换核的卷积得到的新的人脸表征,假定I(x,y)是一幅人脸图像,ψμ,v(x,y)为Gabor变换核,其Gabor变换定义如下Oμv(x,y)=I(x,y)*ψμ,v(x,y),其中,*表示卷积运算,O(x,y)是对μ方向和v尺度上的Gabor变换核的卷积结果,O(x,y)是人脸图像I(x,y)的Gabor特征。
3.根据权利要求2所述的基于稀疏贝叶斯回归的人脸姿势识别方法,其特征是,所述的提取Gabor特征,是指取5个尺度v∈{0,1,2,3,4}和8个方向μ∈{0,1,2,3,4,5,6,7}上使用Gabor核函数。
4.根据权利要求1所述的基于稀疏贝叶斯回归的人脸姿势识别方法,其特征是,所述的线性切空间排列方法,是指在训练样本上求得一个投影矩阵A将原始数据投影到低维空间从而得到相应的低维人脸数据。
5.根据权利要求1或4所述的基于稀疏贝叶斯回归的人脸姿势识别方法,其特征是,所述的线性切空间排列方法,具体实现分四个步骤假定低维空间为d维,①对于每一个高维数据点xi,寻找到它的k个最近邻点,将这个局部邻域记为Xi;②对XiH进行SVD分解,其中HK为中心化矩阵,令Vi为d个最大的特征值对应的右奇异向量,从而用Wi=H(I-ViViT)]]>表示局部邻域的切信息;③利用迭代的方法构建全局意义上的排列矩阵B,公式为B(Ii,Ii)←B(Ii,Ii)+WiWiT,]]>i=1,Λ,N,其中,Ii={i1,Λ,ik}表示xi的k个最近邻点的索引;④最终,通过求解以下一个广义特征值问题来获得投影矩阵XHBHXTα=λXHXTα,设α1,α2Λ,αd为上式的特征向量,其对应于特征值λ1<λ2<Λ<λd,那么,转换矩阵A为A=(α1,α2Λ,αd),这样就得到了投影矩阵。
6.根据权利要求1所述的基于稀疏贝叶斯回归的人脸姿势识别方法,其特征是,所述的稀疏贝叶斯回归方法,是指在将测试样本投影到低维空间后,对于稀疏贝叶斯回归,给定一组训练集{(xi,ti)|i=1,K,N},其中,x为输入的模式向量,t为输出目标,用一个广义的线性回归问题来描述t=y(x,w)+ε,其中,y(x,w)=Σi=1NwiK(xi,x)+w0;]]>输出目标的概率密度函数为p(t|x,w,σ2)=N(y(x,w),σ2),即满足一个高斯分布;所有训练样本都被认为是独立的,则全部训练样本的似然函数为p(t|{x1,L,xN},w,σ2)=N(Φw,σ2),其中,Φ是一个N×(N+1)矩阵,Φij=K(xi,xj-1),且Φi1=1;用一个先验概率添加一个对权重w的约束p(w|α)=Πi=0NN(wi|0,αi-1),]]>其中,α是假设参数向量;最终得到w的表达p(w|t,α,σ2)=N(μ,∑),其中∑-1=σ-2ΦTΦ+diag(α),μ=σ-2∑ΦTt。
7.根据权利要求6所述的基于稀疏贝叶斯回归的人脸姿势识别方法,其特征是,对于权重w采用EM迭代方法来获取。
全文摘要
一种基于稀疏贝叶斯回归的人脸姿势识别方法,用于图像处理技术领域。步骤如下采用Gabor滤波器为人脸姿势图像提取Gabor特征;将Gabor特征进行下采样,然后将采样后的特征行堆叠为一维向量;在训练样本上运用线性切空间排列方法,获得人脸姿势图像的本质低维子空间,并且得到相应的投影矩阵;在低维子空间运用稀疏贝叶斯回归方法训练识别参数;将每一个测试样本通过训练的得到的投影矩阵映射到低维子空间,运用训练的得到的识别参数进行人脸姿势识别。本发明能够得到人脸姿势的非确定解,降低错误率,提高实时性。
文档编号G06K9/00GK101079103SQ20071004197
公开日2007年11月28日 申请日期2007年6月14日 优先权日2007年6月14日
发明者张田昊, 杨杰, 杜春华, 吴证, 袁泉 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1