一种对人脸图片进行笑脸识别的提取方法

文档序号：6581733阅读：1644来源：国知局

专利名称：一种对人脸图片进行笑脸识别的提取方法
技术领域：
本发明涉及模式识别与人工智能技术领域，特别是涉及一种对人脸图片进行笑脸
识别的提取方法。
背景技术：
笑脸识别技术是指识别出一幅静态人脸图像，或一段动态视频中的人脸是否为笑脸表情的一种技术。笑脸识别技术属于模式识别与人工智能技术领域，可以将其理解为人脸表情技术的一个子集。人脸表情识别(Facial E邓ressionRecognition) —般是指将人类的表情分为七类(中性，快乐，害怕，悲伤，生气，厌恶，鄙视)，对静态图片或视频中的人脸表情进行自动分类。但是，表情识别技术还不够成熟，还未能真正在实际中应用。相对而言，笑脸识别技术更易实现，也更具实用性(除了中性，笑脸是人类最易做出的表情)，因此市场上已出现一些笑脸识别技术的应用。例如，以笑脸识别功能为卖点的数码照相机和数码摄相机的问市，就是笑脸识别技术的典型应用。典型的笑脸识别算法，是基于Gabor特征，以及AdaBoost和支持向量机(Support Vector Machine, SVM)算法实现的。首先对整个人脸图像提取多尺度，多方面的Gabor特征，以得到维数非常之大的特征向量。例如，在一幅64X48的图像中，每融两个像素点，提取8方向和5个尺度的Gabor特征的话，所得到的特征向量的维数是30720。这样高的特征维数，是很难应用到实际系统中。因此一般要用AdaBoost算法对其进行特征选择，主要思想是从大量的特征值中选出对识别真正有用的特征。但AdaBoost算法的实现需要多次迭代，一般需要比较长的训练时间。比如，要从30720维特征中，选择出对分类最有用的300 维特征，一般需要2小时的训练时间，所以现有技术由于特征维数过高的缺点，存在算法实现的代价比较大，实验周期比较长。

发明内容
本发明的目的在于克服上述笑脸识别算法的实现效率与时间的不足，提供了一种
专门针笑脸的更加简便并高效的识别算法。本发明采用的技术方案为本发明提供一种对人脸图片进行笑脸识别的提取方法，笑脸识别中使用层次化的梯度直方图PH0G (PYRAMID HISTOGRAM OF ORIENTATION GRADIENTS)特征区别笑脸与非笑脸，所述的笑脸识别方法步骤如下 (11)基于Haar特征与AdaBoost算法的人脸检测； (12)定位人脸嘴部区域； (13)层次化的梯度直方图特征提取算法； (14)支持向量机(Support Vector Machine, SVM)训练与识别。
作为一种优选方案，层次化的梯度直方图raoG特征算法的提取步骤如下 (21)提取欲提特征区域的边界轮廓，对于输入图像I(x， y)，用ca皿y算子计算其边缘，得到一个边缘轮廓图像E(x，y); (22)在金字塔等级为1的子框中，将图像平均分成2工个网格； (23)在每个等级的每一个网格中，根据步骤(21)计算得到的图像的轮廓信息，计
算其梯度直方图H0G，即网格的梯度直方图。 (24)将步骤(23)中算得的每一个网格中的HOG级联叠加起来，以得到KTOG特征向量。其中，步骤(23)的梯度直方图HOG的计算方法如下在一个网格中，对处于轮廓中的每一点，计算其梯度的大小以及方向，根据该点的梯度方向，将其梯度大小加入到相应的方向直方图中。对于笑脸表情的识别，梯度直方图统计20或40个方向的梯度方向，梯度的计算以 3X3的Sobel算子作为模版，计算梯度前，不对图像进行高斯滤波。
步骤(24)的具体步骤如下 (71)在每个等级中，将特征向量的数值归一化到0 1之间；
(72)级联叠加起来的结果，即是我们的PHOG特征计算结果。作为更进一步的优选方案，步骤(12)中找出人脸图像中的嘴部位置区域，在嘴部
区域提取raoG特征。作为另外一种优选方案，步骤(14)使用支持向量机对特征向量进行训练以及识别。本发明的基本原理是以一种能够表示嘴部形状的特征来识别笑脸与非笑脸。提
取特征时，仅对嘴部区域提取raoG特征，即可做出识别效果。raoG特征原来是用于图像分类中，用于描述目标形状的一种描述子。在大类别图像分类中raoG特征起到了积极效果。
其可以描述目标图像整体形状和局部空间的形状。等级0的HOG特征，相当于目标图像的整体形状特征。而等级l以上各个网格的HOG特征，即相当于对局部空间形的描述了。
本发明与已有的笑脸识别算法相比，具有以下的优点和有益效果
(1) raOG特征与Gabor特征相比，特征维数明显减少，在训练阶段，提取特征时，效
率明显提高了许多。 (2)因为raOG特征维数的减小，所以不需要经过一个类似于AdaBoost的特征选择过程。因此，提取出PHOG特征后，可以直接运用支持向量来对特征进行训练，大大减化了算法流程。 (3)ra0G作为一种描述目标形状的描述子，具有更加直观的物理意义。在只对嘴部图像进行特征提取的时候，其表达的意义即是对嘴部形状的描述。显然，嘴部的形状，可以轻易的区别出笑脸与非笑脸的表情。本发明针对Gabor特征维数过高的缺点，提出使用KTOG特征来区分笑脸与非笑脸，实验结果表明，其可以以很低的特征维数，得到与Gabor特征识别率相当的实验结果。因此，可以大大的提高算法的效率，更易于在现实中使用。

图1是本发明的系统结构2是raoG特征提取步骤示意图
图3是raOG特征与Gabor特征实验结果对比图
具体实施例方式
下面结合附图对本发明做进一步的说明，实施本发明的识别设备可以是数码相机以及数码摄相机等，用嵌入式系统设备为平台进行识别，可采用C语言编制各类图像处理程序，便能较好的实施本发明。本发明的系统结构框图如图l所示，当设备采集到某一图像后，先进入人脸检测程序，判断图像中是否存在人脸。通常可使用的人脸识别算法为基于类Haar特征以及 AdaBoost的人脸检测算法，当算法判定图像中存在人脸时，其会返回一个或数个矩形框信息，以标注图像中人像存在的位置；当在人脸检测阶段检测到人脸位置后，即可进入笑脸识别阶段，否则算法停止。进入笑脸识别阶时，我们先定位人脸图像中的嘴部区域，嘴部定位的算法可以有多种选择，只要能定位到嘴部的大致区域即可；之后，提取嘴部区域的raOG 特征，提取步骤如下首先提取欲提特征区域的边界轮廓，然后图像按不同的分辨率分解成不同金字塔等级的网格，之后对每个等级中的每个网格提取HOG特征，最后将所有HOG特征级联起来，得到最终的raOG特征，如图2所示，(a)为在不同金字塔等级切分子网格的结果，
(b)为图像的轮廓图像(c)为不同金字塔等级的特征，将其级联起来，即得到raoG特征；最后，直接将raoG特征用支持向量机进行训练即可。根据本发明的算法，在公用表情数据库Cohn-Kanade数据库进行对比实验，所得到的结果如图3的表格对示，可以看出，使用raOG特征及SVM算法训练，识别率比Gabor特征更高。因此，本发明所提出的算法不仅简单易实现，算法效率高，并且在识别精度上也比传统的Gabor特征更高。用在数码照相机及其它智能设备，将有更高的效率。
权利要求
一种对人脸图片进行笑脸识别的提取方法，其特征在于，笑脸识别中使用层次化的梯度直方图PHOG特征区别笑脸与非笑脸，所述的笑脸识别方法步骤如下(11)基于Haar特征与AdaBoost算法的人脸检测；(12)定位人脸嘴部区域；(13)层次化的梯度直方图特征提取算法；(14)支持向量机训练与识别。
2. 根据权利要求i所述的提取方法，其特征在于，所述层次化的梯度直方图raoG特征算法的提取步骤如下(21) 提取欲提特征区域的边界轮廓，对于输入图像I (x，y)，用canny算子计算其边缘，得到一个边缘轮廓图像E(x，y);(22) 在金字塔等级为1的子框中，将图像平均分成21个网格；(23) 在每个等级的每一个网格中，根据步骤(21)计算得到的图像的轮廓信息，计算其梯度直方图HOG，即网格的梯度直方图；(24) 将步骤(23)中算得的每一个网格中的HOG级联叠加起来，以得到raOG特征向量。
3. 根据权利要求2所述的提取方法，其特征在于，所述步骤(23)的梯度直方图HOG的计算方法如下在一个网格中，对处于轮廓中的每一点，计算其梯度的大小以及方向，根据该点的梯度方向，将其梯度大小加入到相应的方向直方图中。
4. 根据权利要求3所述的提取方法，其特征在于，对于笑脸表情的识别，梯度直方图统计20或40个方向的梯度方向。
5. 根据权利要求3所述的提取方法，其特征在于，对于笑脸表情的识别，梯度的计算以 3X3的Sobel算子作为模版。
6. 根据权利要求3所述的提取方法，其特征在于，对于笑脸表情的识别，计算梯度前，不对图像进行高斯滤波。
7. 根据权利要求2所述的提取方法，其特征在于，所述步骤(24)的具体步骤如下(71) 在每个等级中，将特征向量的数值归一化到0 1之间；(72) 级联叠加起来的结果，即是我们的PH0G特征计算结果。
8. 根据要求l所述的提取方法，其特征在于所述步骤(12)中找出人脸图像中的嘴部位置区域，在嘴部区域提取raoG特征。
9. 根据要求l所述的提取方法，其特征在于所步骤(14)使用支持向量机对特征向量进行训练以及识别。
全文摘要
本发明涉及模式识别与人工智能技术领域，特别是涉及一种对人脸图片进行笑脸识别的提取方法。本发明提供一种对人脸图片进行笑脸识别的提取方法，笑脸识别中使用层次化的梯度直方图PHOG(PYRAMID HISTOGRAM OF ORIENTATIONGRADIENTS)特征区别笑脸与非笑脸，所述的笑脸识别方法步骤如下(11)基于Haar特征与AdaBoost算法的人脸检测；(12)定位人脸嘴部区域；(13)层次化的梯度直方图特征提取算法；(14)支持向量机(Support Vector Machine，SVM)训练与识别。本发明针对Gabor特征维数过高的缺点，提出使用PHOG特征来区分笑脸与非笑脸，可以以很低的特征维数，得到与Gabor特征识别率相当的实验结果。因此，可以大大的提高算法的效率，更易于在现实中使用。
文档编号G06K9/46GK101699470SQ200910193459
公开日2010年4月28日申请日期2009年10月30日优先权日2009年10月30日
发明者白洋, 郭礼华, 金连文申请人:华南理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭礼华;金连文;白洋
技术所有人：华南理工大学
我是此专利的发明人

上一篇：一种基于Linux嵌入式系统的动态电源管理的方法
上一篇：业务信息处理系统及处理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。