一种基于混合回归的头部姿态估计方法

文档序号：6633349阅读：740来源：国知局

一种基于混合回归的头部姿态估计方法
【专利摘要】该发明公开了一种基于混合回归的头部姿态估计方法，属于计算机视觉和机器学习【技术领域】，特别涉及视觉映射中的头部姿态估计方法。该方法提取头部图像的梯度方向直直方图特征，并利用混合回归模型建立图像特征与头部姿态之间的非线性映射关系，最终利用已建立的混合回归模型对待估计头部图像进行姿态估计。通过上述方法，既能准确地对头部图像对应的姿态进行准确连续的估计，也避免了较大的计算复杂度。
【专利说明】一种基于混合回归的头部姿态估计方法

【技术领域】
[0001] 本发明属于计算机视觉和机器学习【技术领域】，涉及视觉映射中的头部姿态估计问题。

【背景技术】
[0002] 头部姿态估计是指根据包含头部的数字图像，利用机器学习和计算机视觉的方法准确快速地估计该图像中对应头部的偏转角度，也称为头部姿态。它是近年来计算机视觉和机器学习领域研究的热门问题，在人机交互、安全驾驶和关注度分析等方面都有非常广泛的应用。例如：在人机交互领域，头部的偏转角度可以用于控制电脑或机器显示的方向和位置；在安全驾驶领域，头部姿态可用于辅助视线估计，从而提示驾驶员正确的视线方向。近年来，头部姿态估计在流形学习和子空间理论发展的基础上，有了进一步的发展。现有头部姿态估计方法可以分为三个大的类别：1.基于容貌的方法，2.基于分类的方法和3.基于回归的方法。
[0003] 基于容貌的头部姿态估计方法的基本原理是将输入的头部图像与数据库中已有的图像进行一一比对，并将找到的最相似的图像所对应的角度作为待估计图像的头部姿态（即角度）。该类方法最大的缺陷在于其只能输出离散的头部偏转角度，并且由于需要与所有已有图像进行依次比对，运算量巨大。参见文献：D.J.Beymer，Face Recognition under Varying Pose,IEEE Conference on Computer Vision and Pattern Recognition，pp. 756-761，1994 和 J. Sherrah，S. Gong，and E. J. Ong, Face Distributions in Similarity Space under Varying Head pose Image and Vision Computing，vol. 19， no. 12, pp. 807-819, 2001。
[0004] 基于分类的头部姿态估计方法是指根据输入图像的特征和对应头部偏转角度训练分类器，并利用学习好的分类器区分待估计图像头部偏转角度所属的类别，从而确定头部姿态的大致范围。该类方法中常用的分类器包括支持向量机（Support Vector Machine，SVM)，线性判决分析（Linear Discriminative Analysis，LDA)，核线性判决分析 (Kernel Linear Discriminative Analysis，KLDA)，这类方法的主要缺点是无法估计输出连续的头部姿态，参见文献：J. Huang，X. Shao, and H. Wechsler，Face Pose Discrimination using Support Vector Machines(SVM)， International Conference on Pattern Recognition，pp. 154-156, 1998。
[0005] 基于回归的头部姿态估计方法是目前最常用的估计方法，该方法的基本原理是利用已有图像特征和对应的头部角度建立映射函数，并利用映射函数估计待处理图像对应的头部姿态。该类方法解决了前述两种方法无法估计输出连续姿态的问题，同时减少了运算复杂度，参见文献 G.Fanelli，J. Gall，and L Van Gool，Real Time Head Pose Estimation with Random Regression Forests, IEEE Conference on Computer Vision and Pattern Recognition，2011，pp. 617-624 和文献 H. Ji，R. Liu，F. Su，Z. Su，and Y. Tian, Convex Regularized Sparse Regression for Head Pose Estimation, IEEE International Conference on Image Processing，pp. 3617-3620,2011。

【发明内容】

[0006] 本针对【背景技术】的不足解决的技术问题是提供一种基于混合回归的头部姿态估计方法。该方法提取头部图像的梯度方向直直方图特征，并利用混合回归模型建立图像特征与头部姿态之间的非线性映射关系，最终利用已建立的混合回归模型对待估计头部图像进行姿态估计。通过上述方法，既能准确地对头部图像对应的姿态进行准确连续的估计，也避免了较大的计算复杂度。
[0007] 为了方便地描述本
【发明内容】
，首先对一些术语进行定义。
[0008] 定义1:头部姿态。在三维空间中头部旋转的角度通常由一个向量表示，该向量由三个元素构成，第一个元素为俯仰角，第二个元素为偏航角，第三个元素为旋转角。
[0009] 定义3:俯仰角。在图2(b)所示的x-y-z坐标系中，俯仰角是指以x轴为中心旋转的角度Q。
[0010] 定义3 :偏航角。在图2 (a)所不的x-y-z坐标系中，偏航角是指以z轴为中心旋转的角度小。
[0011]定义4:旋转角。在图2(c)所示的x-y-z坐标系中，旋转角是指以z'为中心旋转的角度W。
[0012] 定义5 :梯度方向直方图特征。利用像素强度梯度或边缘的方向分布描述一幅图像中的物体的表象和形状的视觉特征提取方法。其实现方法先将图像分成小的叫做方格单元的连通区域；然后采集方格单元中各像素点的梯度方向或边缘方向直方图；最后把这些直方图组合起来就可以构成特征描述子。为了提高精确度，还可以把这些局部直方图在图像的更大的区间（block)中进行对比度归一化（contrast-normalized),此方法通过先计算各直方图在这个区间（block)中的密度，然后根据这个密度值对区间中的各个方格单元做归一化。通过该归一化能对光照变化和阴影有更强的鲁棒性。
[0013] 定义6:高斯分布。又名正态分布，是一个在数学、物理及工程等领域都非常重要的概率分布。具体是指：对于任意随机变量X，若其概率密度函数满足

【权利要求】
1. 一种基于混合回归的头部姿态估计方法，该方法包括：步骤1 :采集N幅包含不同个体姿态各异的头部图像，并根据采集每幅图像时头部的姿态，记录N幅图像各自对应的头部俯仰角、倾斜角和旋转角度，即头部姿态向量:yn e妒，yn 的第一维表示俯仰角，第二维表示倾斜角，第三维表示旋转角，下标η表示第η幅图像对应的姿态；步骤2:对采集的图像进行彩色图像转灰度图像的处理，若采集图像已经为灰度图像则无需在进行转化处理；步骤3 :截取出采集图像的头部区域，再对剪裁出的区域进行下采样，变换成大小为 64X64像素的图像，对每一幅采集图像提取梯度方向直方图特征，并记第η幅图像对应的梯度方向直方图特征向量Xn ; 步骤4 :将所有的N幅图像对应的梯度方向直方图特征向量在列方向上按顺序排列得到输入数据矩阵X，即X = [X^ χ2,...，χη]; 步骤5 :将N幅图像对应的头部姿态向量在列方向上按顺序排列为数据矩阵Y，即Y = [yi，5^2，· · ·，yJ ; 步骤6:设所有输入特征伏η})=1;和输出姿态合服从混合高斯分布，各高斯分布中心、协方差和混合系数，分别用符号y k，E ,和Jik表示，其中下角标k表示第k个高斯分布，k = 1，2, ... K ;
其中zn e 9^为κ维隐变量,其元素取值为〇或1,并且只有一个元素取值为1,取值为1 的元素的位置决定了第η个观测样本{xn，yn}属于哪一个高斯，例如：第k个元素为1，则代表第η个观测样本{x n，yn}属于第k个高斯，ρ(ζη| Θ)代表第η个观测样本{xn，yn}属于任意一个高斯的概率，简记为nk，k= 1，...Κ，Θ表示此混合回归模型中的所有参数，S卩：〇 ={yk，Σ k，nk，Ak，bk，3k}，p(x n，yn|zn，Θ)表示已知观测样本{xn，yn}属于任意一个高斯条件下的概率分布，该分布为以U k为中心，协方差为Σ k的高斯分布，用表不；已知lxn，yn}属于任意一个高斯分布的条件下，\和7"之间存在线性回归关系，回归关系由回归矩阵Ak，偏差bk，和噪声方差水平β k共同决定：
得到输入梯度方向直方图特征也分别服从混合高斯分布，即：
其中表示输入特征的各高斯分布中心和协方差；由输入和输出之间的线性关系，可知：
步骤7 :根据步骤6中的假设，定义输入特征和输出姿态的似然函数为：
当上述似然函数取得最大值时候的参数Θ即为最佳混合回归模型的参数；为了方便求解参数Θ，需要对上述似然函数作取对数运算，即：
按照期望最大值算法求解步骤7中定义的似然函数最大值对应的参数Θ ; 期望最大值方法的具体求解步骤为：估计步骤：计算在当前参数设置?°ld下每一观测样本对lxn，yn}针对k个高斯分布中每一个高斯的后验概率^(21>"，7"，?°1<1)，
这里用 Wnk 简记 Pk(znI xn, yn，Θ。1' ；最大化步骤：根据当前参数?°ld建立Q函数， /I--O- 4-71
该函数的等价形式为：
对Q函数关于各参数求导，并令导数为〇,可以求得当前使得Q函数最大的参数，
同时得到各回归参数的取值如下，
这里X = [X, 1[]，1【是一个包含N个1的向量，Wk = diag{wnk，η = 1，2,…，N}; 重复上述的估计步骤和最大化步骤，直到似然函数取得最大值为止，此时的参数取值为最佳参数取值；步骤8 :对于任一待估计图像按照步骤3中的方法截取头部区域并下采样成大小为 64X64像素的图像，并提取梯度方向直方图特征向量Xt，根据步骤7中得到的分布参数 AtL Σ?，31P计算待估计图像对应特征向量xt属于k个高斯分布中每一个的概率p k(zk = 11xt, Θ),
将上述概率简计为π k (X); 步骤9 :计算Xt属于各个高斯分布条件下，对应的输出头部姿态^^;^ + !^，并利用步骤 8中求得的概率加权平均，得到最后姿态估计，
2.如权利要求书1所述的一种基于混合回归的头部姿态估计方法，其特征在于所述步骤3中在对梯度方向直方图特征计算的过程中，区域个数的参数设置为2X2,每一区域中图像单元的个数参数设置为8X8,方向柱的个数设置为9,最后得到任意一幅图像对应的梯度方向直方图特征的维数为4086。
【文档编号】G06K9/62GK104392241SQ201410619368
【公开日】2015年3月4日申请日期:2014年11月5日优先权日:2014年11月5日
【发明者】潘力立申请人:电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：潘力立;
技术所有人：电子科技大学;
我是此专利的发明人

上一篇：服务器及其适配卡固定架的制作方法
上一篇：一种改进的序贯故障诊断策略优化方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。