基于最大方向编码的人脸表情特征提取及识别方法_2

文档序号：9453434阅读：来源：国知局

析，是属于机器学习的范畴。它是针对线性可分情况进行分析，对于线性不可分的情况，通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分。
[0031] (8):十折交叉验证。指将数据集分成10份，轮流将其中9份作为训练数据，1份作为测试数据，进行试验。每次试验都会得出相应的正确率（或差错率）。10次的结果的正确率（或差错率）的平均值作为对算法精度的估计，一般还需要进行多次10折交叉验证 (例如10次10折交叉验证），再求其均值，作为对算法准确性的估计。
[0032] 参见图1，本发明的基于最大方向编码的人脸表情识别方法具体实现包括下述步骤：
[0033] 步骤1人脸检测及人脸图像预处理
[0034] 步骤1. 1人脸检测
[0035] 对输入的原始图像进行人脸检测与定位，例如采用Adaboost方法。利用含有人脸和不含有人脸的图像对分类器进行训练，其中含有人脸的图像为正样本，不含有人脸的图像为负样本。
[0036] 1)求取训练样本的四种Harr-Like特征，形成特征集。
[0037] 2)训练弱分类器，训练弱分类器的目的是为了确定阈值，使得对所有训练样本的分类误差最低。
[0038] 3)级联弱分类器形成强分类器。
[0039] 步骤1. 2人脸图像预处理
[0040] 通过步骤1. 1得到人脸图像后，进行尺度归一化，扩大或缩小到预设尺寸大小，例如256*256。若是彩色图像则需要先进行图像二值化获得灰度图像。为了获得更精确的特征提取及识别，可以对尺度归一化后的灰度图像进行直方图均衡处理后再进行特征提取处理。本【具体实施方式】中所采用的直方图均衡处理具体为：将尺度归一化后的灰度图像分割为预设尺寸（例如3*3)的图像块，得到每一块区域图像，再计算每一个区域图像的直方图，按顺序进行首尾相连，之后进行直方图均衡，得到最终的待检测图像，用以进行人脸表情的特征提取及识别处理。直方图均衡的计算公式为：?％ _= …- 1，其中L是图像中灰度值总数，叫是灰度为rk的像素数目，r,为原直方图分布中的第k种灰度值，n为尺寸归一化后的灰度图像的总像素个数，&是r,经过变化后的灰度值。
[0041] 步骤2表情特征提取
[0042] 分别以经步骤1预处理后的图像（待提取图像）各像素点为中心，并计算各中心像素点的八个方向响应值，本【具体实施方式】中，采用Kirsch算子得到各中心像素点的八个方向响应值，即得到待提取图像的各像素点的八个方向响应值。
[0043] 然后基于本发明改进的LDP编码方式（DLDP编码）计算对应的编码值（DLDP):
[0044]DLDP= (8Max+Min)s(x)
[0045]
[0046] 其中，Max表示经过Kirsch算子运算后得到的八个方向的响应值中，最大响应值所在位置的二进制编码（位置编码方式为从〇〇〇到111)，Min表示最小的响应值所在的位置（从〇〇〇到111)，s(x)是关于最大响应值与最小响应值（八个方向的响应值中）的差值 x的函数。若差值x小于预设阈值Th(本【具体实施方式】中，其值设置为243)，则s(x) =0，即不对其编码，将编码值置为〇,即〇〇〇〇〇〇 (才用6位进行编码）；若差值x大于或等于Th，则s(x) = 1，对当前像素点（中心像素点）进行编码，其编码为：用Max作为高位，Min作为低位串接码。最后取编码的十进制值作为当前像素点的特征值。参见图2,图中的"X"表示当前中心像素点，"（〇厂（7)"表示位置编号，方格内的数字分别表示灰度值（2-a)、响应值 (2-b)。从图2-b所对应的各响应值可知，其最大响应值为位置（4)的537,最小响应值为位置2的87,因两者之差大于243,故当前中心像素点的编码为100与010的串接码：100010，即DLDP= 32 〇
[0047] 步骤3表情分类
[0048] 基于步骤2得到多幅具备对应特征值的人脸图像（分类图像），并将其分为10份，其中9份作为训练图像，1份作为检测图像。将9份训练图像输入SVM进行训练，得到一个初级SVM分类器，之后采用十折交叉验证法，对样本进行其他9次训练，得到9个初级SVM 分类器。最后将10个初级分类器级联成为一个强分类器，即本发明表情识别所用的SVM分类器。
[0049] 步骤4表情识别
[0050] 对输入的原始图像执行步骤1，得到待识别的人脸图像，执行步骤2,得到待识别人脸图像各像素点的特征值后，再输入步骤3得到的SVM分类器进行表情识别并输出识别结果。
[0051] 本发明改进了现有LDP的编码方法，简化特征维度和计算量，且降低了部分不同像素使用同一种编码值出现的频率（参考表1，对于两种响应值，现有的LDP编码的编码值相同，而本发明的DLDP的编码值不同），相较于常用的LDP，PCA方法，又提高了精确度，在 DLDP中加入门限，提高对噪声的干扰能力。
[0052] 表1 :DLDP与LDP编码对比表
[0053]
[0054] 以上所述，仅为本发明的【具体实施方式】，本说明书中所公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换；所公开的所有特征、或所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以任何方式组合。
【主权项】
1. 基于最大方向编码的人脸表情特征提取方法，其特征在于，包括下列步骤对输入的待处理人脸图像进行预处理，得到待提取图像，所述预处理包括：图像灰度化处理、尺寸归一化处理；分别W待提取图像的各像素点为中屯、，计算各中屯、像素点的八个方向响应值，并对各响应值所在位置进行二进制编码；查找各中屯、像素点的最大响应值、最小响应值，并记最大响应值所在位置编码为Max, 最小响应值所在位置编码为Min; 判断与最小响应值的差值是否小于预设阔值化，若是，则当前中屯、像素点的编码值为O;否则，当前中屯、像素点的编码设置为：Max为高位，Min为低位的串接码；将各中屯、像素点的编码的十进制值作为其特征值，输出待提取图像的各像素点的特征值。2. 如权利要求1所述的方法，其特征在于，基于Kirsch算子计算待提取图像的各中屯、像素点的八个方向响应值。3. 如权利要求1或2所述的方法，其特征在于，所述预设阔值化的取值范围为 200-300。4. 如权利要求1或2所述的方法，其特征在于，对输入的待处理图像进行预处理还包括：将尺寸归一化后的灰度图像分割成预设尺寸的图像区域，并计算每一个图像区域的直方图，按顺序进行首尾相连后，进行直方图均衡处理，将直方图分布中的第k种灰度值r,变换为Sk,所述4二巧=。矿k二0，，L- 1，其中L为灰度图像中灰度值总数，n,表示灰度值为r,的像素数目，n为尺寸归一化后的灰度图像的总像素个数。5. 基于最大方向编码的人脸表情识别方法，其特征在于，包括下列步骤：步骤1 :输入人脸图像，基于权利要求1所述的人脸表情特征提取方法得到各人脸图像的像素点的特征值；步骤2 :基于各人脸图像的像素点的特征值进行SVM训练，得到SVM分类器；步骤3 :输入待识别人脸图像，基于权利要求1所述的人脸表情特征提取方法得到待识别人脸图像的像素点的特征值，并基于步骤2得到的SVM分类器输出当前待识别人脸图像的表情识别结果。6. 如权利要求5所述的方法，其特征在于，所述步骤2中，采用十折交叉验证法得到10 个初级SVM分类器，再将所有初级SVM分类器级联得到SVM分类器。
【专利摘要】本发明公开了一种基于最大方向编码的人脸表情特征提取及识别方法。本发明改进了LDP的原始编码模式，即利用最大最小响应值所在位置，将位置参数作为编码值进行编码，利用最大的响应值、最小的响应值的所在方向来确定一个目标像素，且当最大的响应值、最小的响应值之差达到门限值才进行编码。同时还公开了基于本发明的特征提取方法的人脸表情识别方法。本发明改进了现有LDP的编码方法，简化特征维度和计算量，利用周围像素的明暗信息所代表的方向性进行编码可以排除部分偶然重合的情况，提高编码准确度，门限的引入排除了部分内在外在误差，提高了人脸表情特征提取方法的抗干扰能力。
【IPC分类】G06K9/62, G06K9/00
【公开号】CN105205460
【申请号】CN201510594355
【发明人】解梅, 张锐, 黄成挥, 李佩伦
【申请人】电子科技大学
【公开日】2015年12月30日
【申请日】2015年9月17日

完整全部详细技术资料下载

当前第2页1 2