基于最大方向编码的人脸表情特征提取及识别方法

文档序号：9453434阅读：471来源：国知局

基于最大方向编码的人脸表情特征提取及识别方法
【技术领域】
[0001] 本发明属于数字图像处理技术领域，具体涉及对图像的人脸表情特征提取及人脸表情识别处理。
【背景技术】
[0002] 表情是人类用来表达情绪的一种基本方式，是非语言交流中的一种有效手段。人们可通过表情准确而微妙地表达自己的思想感情，也可通过表情辨认对方的态度和内心世界。人脸表情识别所要研究的就是如何自动、可靠、高效地利用人脸表情所传达的信息。人脸表情可以分为6种基本情感类别：惊奇、恐惧、厌恶、愤怒、高兴、悲伤，和一种最为普遍的表情类别：中性。其中中性是人脸表情进行转换的中间过程和所有人一般状态下所表现出来的最为普遍的表情类别。一个人脸表情识别系统（FER) -般包括3个环节，即人脸检测、表情特征提取、表情分类。其中人脸检测目前已经成为了一个单独的研究方向，现有的研究已经在该方面上研究出了一些成果。表情特征提取是FER系统中最重要的部分，有效的表情特征提取工作将使识别的性能大大提高。
[0003]目前常用的人脸面部表情识别算法有：
[0004] (1)基于人脸动作编码系统FACS和运动单元AU的算法，可参考文献：J.Hamm， C.G.Kohler,R.C.Gur,andR.Verma，"Automatedfacialactioncodingsystemfor dynamicanalysisoffacialexpressionsinneuropsychiatricdisorders，'，Journal ofNeuroscienceMethods，vol. 200,no. 2,pp.237-256,2011 ;
[0005] (2)基于主成分分析PCA的算法，可参考文献：YongCY，SudirmanR，Chew KM.FacialExpressionMonitoringSystemUsingPCA-BayesClassifier[C].Future ComputerSciencesandApplication(ICFCSA)，2011InternationalConference on.IEEE，2011 :187-191;
[0006] (3)基于LDP的算法，可参考文献：T.Jabid，M.H.Kabir，and0?Chae，"Robust facialexpressionrecognitionbasedonlocaldirectionalpattern，'TTRIJournal， vol. 32,no. 5,pp.784-794,2010。
[0007] 上述人脸面部表情提取方法都在一定程度上存在问题。方法（1)需要准确的五官定位及面部追踪才可以获得较好的效果，且对于噪声光照敏感，易受到干扰；方法（2)虽然拥有较小的计算量和特征维度，但是会忽略局部特征，局部特征在识别过程中也是非常重要的部分，因此对于识别精度有一定的影响；方法（3)虽然较前述两个有所改进，但是随着所取最大值个数的提升，其编码组合数目会大幅增加，用于区域图像分块处理之后，其整幅图像的特征维度会急剧增加；且LDP也仅是用周围像素与中心像素进行比较，直接取周围像素的最大运算值进行编码，非理想条件下，对噪声也不具有一定的抗力。LDP编码由如下公式计算而得：
[0008]
车中叫表示经过Kirsch算子运算后各像素点的八方向的响应值的绝对值，k表示取最大值的个数，mk表示mi中最大的第k个值。随着k的增大其特征维度会急剧增大，且抗干扰的能力不高。

【发明内容】

[0009] 本发明针对上述存在的问题，公开了一种基于最大方向编码的人脸表情特征提取方法，能够有效的提取有用信息并减少计算量，提高抗干扰能力。
[0010] 本发明的基于最大方向编码的人脸表情特征提取方法，包括下列步骤
[0011] 对输入的待处理人脸图像进行预处理，得到待提取图像，所述预处理包括：图像灰度化处理、尺寸归一化处理；
[0012] 分别以待提取图像的各像素点为中心，计算各中心像素点的八个方向响应值，并对各响应值所在位置进行二进制编码，例如从000到111 ;
[0013] 查找各中心像素点的最大响应值、最小响应值，并记最大响应值所在位置编码为 Max，最小响应值所在位置编码为Min;
[0014] 判断与最小响应值的差值是否小于预设阈值Th(经验值，通常可设置为 200-300)，若是，则当前中心像素点的编码值为0,若采用6位的二进制编码，则其编码值为〇的编码为〇〇〇〇〇〇 ;否则，当前中心像素点的编码设置为：Max为高位，Min为低位的串接码；将各中心像素点的编码的十进制值作为其特征值，即得到待提取图像的各像素点的特征值并输出。
[0015] 本发明改进了LDP的原始编码模式，首先，不直接使用所计算出来的响应值进行编码，而是利用最大最小响应值所在位置，将位置参数作为编码值进行编码，从而可以将原来八位的二进制编码缩减为六位的二进制编码值，降低了特征维度和后续识别的运算时间；其次因为对于中心像素而言，其八方向的响应值并不具有同等的地位，从而才会产生各个方向不同的响应值，因此可以利用最大最小响应值的所在方向来确定一个目标像素，这比直接选取最大三个响应值进行编码的LDP方法更加精确，原始方法可能会出现完全不同像素成为了同一种编码的情况，利用周围像素的明暗信息所代表的方向性进行编码可以排除部分偶然重合的情况，提高编码准确度；最后，为了排除部分噪声对于编码方式的影响，加入了门限值，当最大最小响应值之差达到门限值之后才进行编码，门限的引入排除了部分内在外在误差，提高了人脸表情特征提取方法的抗干扰能力。
[0016] 基于本发明的表情特征提取方法，本发明还公开了一种基于最大方向编码的人脸表情识别方法，包括下列步骤：
[0017] 步骤1 :输入人脸图像，基于本发明的表情特征提取方法得到各人脸图像的像素点的特征值；
[0018] 步骤2 :基于各人脸图像的像素点的特征值进行SVM训练，得到SVM分类器；
[0019] 步骤3 :输入待识别人脸图像，基于本发明的表情特征提取方法得到待识别人脸图像的像素点的特征值，并基于步骤2得到的SVM分类器输出当前待识别人脸图像的表情识别结果。
[0020] 综上所述，由于采用了上述技术方案，本发明的有益效果是：降低了LDP原始编码的特征维度和计算量以及编码准确度，提高了人脸表情特征提取及表情识别的抗干扰能力。
【附图说明】
[0021] 图1是【具体实施方式】中，人脸表情识别流程示意图；
[0022] 图2是【具体实施方式】中，本发明改进的LDP编码（DLDP编码）示意图。
【具体实施方式】
[0023] 为使本发明的目的、技术方案和优点更加清楚，下面结合实施方式和附图，对本发明作进一步地详细描述。
[0024] 为了方便描述，首先给出【具体实施方式】所涉及的相关专业术语的简要描述：
[0025] (l)Haar-like特征。哈尔特征（Haar-like)是用于物体识别的一种数字图像特征，哈尔特征使用检测窗口中指定位置的相邻矩形，计算每一个矩形的像素和并取其差值，然后用这些差值来对图像的子区域进行分类。
[0026] (2)图像二值化。就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果。在灰度图像中，常采用一个字节表示一个像素点，其灰度级为 0~255,其二值化方法为构造用一个二进制位表示一个像素点的图像，设置二值化阈值T，将大于T的像素点设置为1，小于等于T的点设为0。
[0027] (3)Adaboost算法。Adaboost是一种迭代算法，其核心思想是针对同一个训练集训练不同的弱分类器，然后把这些弱分类器集合起来，构成一个强分类器。常用于人脸检测与定位。
[0028] (4) :Kirsch算子。Kirsch算子是R.Kirsch提出来一种边缘检测新算法，它采用 8个模板对图像上的每一个像素点进行卷积求导数，这8个模板代表8个方向，对图像上的 8个特定边缘方向做出最大响应，运算中取最大值作为图像的边缘输出。
[0029] (6):直方图均衡化。直方图均衡化的基本思想是把原始图的直方图变换为均匀分布的形式，这样就增加了象素灰度值的动态范围从而可达到增强图像整体对比度的效果。
[0030] (7) :SVM。SVM(SupportVectorMachine，支持向量机）是一个有监督的学习模型，通常用来进行模式识别、分类、以及回归分

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：解梅;张锐;黄成挥;李佩伦;
技术所有人：电子科技大学;
我是此专利的发明人

上一篇：一种用于模态参数识别的信号降噪方法
上一篇：一种图像特征点类型的识别方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。