一种结合降维和认知引力模型的人脸表情识别方法

文档序号：9274915阅读：437来源：国知局

一种结合降维和认知引力模型的人脸表情识别方法
【技术领域】
[0001] 本发明涉及一种图像处理、维数约减、情感计算和模式识别技术，特别涉及一种结合降维和认知引力模型的人脸表情识别方法。
【背景技术】
[0002] 随着信息技术的不断发展，社会发展对情感计算提出了更高的要求，有广泛的应用价值。例如在人机交互方面，一个拥有情感能力的计算机能够对人类情感进行获取、分类、识别和响应，进而帮助使用者获得高效而又亲切的感觉，采用情感计算技术探测驾驶司机的精力是否集中，感受到的压力水平等，并做出相对反应。此外，情感计算还能应用在机器人、智能玩具、游戏、电子商务等相关产业中，以构筑更加拟人化的风格和更加逼真的场景。情感也反映了人类的心理健康情况，情感计算的应用可以有效地帮助人们避免不良情绪，保持乐观健康的心理。
[0003] 人的面部表情，语音，生理指标等都能在一定程度上反映人类的情感。本发明涉及人脸表情识别中的维数约减和分类。目前使用到人脸表情识别中的维数约减方法有很多，如主成分分析方法（PrincipalComponentAnalysisPCA)正交局部投影保持（Orthogonal LocalityPreservingProjections0LPP)，以及偶子空间非负矩阵分解等。但是这些方法不能同时最小化类内距离，最大化类间距离，以及在低维空间中保持高维空间中的流形结构。近年来提出了较多的能同时实现上述3个目标的维数约减算法，其中一种称为长程相关反馈的维数约减算法RF(Long-termRelevanceFeedback)对多媒体数据有较好的效果。但是该方法不能直接应用于人脸表情识别，因为抽取的特征不仅包括用于人脸识别的特征也包括表情识别的特征，而人脸差别很大的人却可能有相同的表情，这使得同一表情的人脸样本之间的距离较大，这样的距离对目标函数用于表情识别造成负面影响。为此本发明对最小化离得较远但属于同一类别的样本之间的距离进行一定的惩罚，并据此提出一种能克服上述缺点的维数约减方法，称之为增强型长程相关反馈ERF维数约减算法（Enhanced Long-termRelevanceFeedback)〇
[0004]ERF除了能克服RF的缺点外，还能从训练数据中提取到样本的密度信息，而这个信息有利于分类。传统的分类器如支持向量机（SupportVectorMachineSVM)，稀疏表示分类（SparseRepresentation-basedClassifierSRC)，K_ 近邻分类（KNN)等都不能很好的使用样本的密度信息。而一种基于认知引力模型的分类器能够利用样本的密度信息，但是该方法使用自信息估算引力模型的质量，而自信息既随着样本密度的变化而变化，又随着训练样本个数的变化而变化，使得样本之间的引力估算不准确。

【发明内容】

[0005] 本发明的目的在于克服现有技术的缺点与不足，提供一种结合降维和认知引力模型的人脸表情识别方法，该人脸表情识别方法简单，易于实现，是一种认知引力模型提出了一种新的质量计算方法和认知引力计算方法。
[0006] 本发明的目的通过下述技术方案实现：一种结合降维和认知引力模型的人脸表情识别方法，包括以下步骤：
[0007] (1)使用基于金字塔的方向梯度直方图（PyramidofHistogramofOriented GradientsPHOG)提取测试样本x的特征，称为PHOG特征；
[0008] (2)采用增强型长程相关反馈维数约减算法ERF(EnhancedLong-termRelevance Feedback)的投影映射W，对提取的PHOG特征降维，将测试样本映射到低维空间y=WTx，其中y是样本x映射到低维空间之后的结果；
[0009] (3)计算测试样本的质量m(y);
[0010] (4)根据测试样本和训练样本的质量，按如下公式计算每个训练样本j= 1，2,…，n对测试样本Xi的引力，其中n是训练样本的个数；
[0011]
(10)
[0012] (5)从每个表情类别中，分别选出对测试样本引力最大的k个训练样本，并将每个类的这些引力求和，对测试样本引力最大的那个类别即为训练样本的表情类别。
[0013] 在使用所述结合降维和认知引力模型的人脸表情识别方法之前，还需要训练，训练的过程包括如下步骤：
[0014] (1)提取每个训练样本的PHOG特征；
[0015] (2)使用训练数据训练维数约减方法ERF，获得投影映射W，将训练数据从高维空间转换到低维空间；
[0016](3)计算每个训练样本的质量。
[0017] 所述增强型长程相关反馈维数约减算法ER的包括如下步骤：
[0018] (1)定义增强长期相关反馈的维数约减方法的目标函数如下：
[0019]
(1)
[0020] 其中WTXLbXW，WTXLfXW，WTXLwXW，WTXLmXW是 4 个优化目标，a1和a2为平衡参数。
[0021] WTXLbXW的目标是最大化类间距离，定义如Eq. 2,式中於表示不属于第c类的训练样本个数，C表示总类别个数，li，^表示第i、第j个样本的类别标签。
[0022]
(2)
[0023] WTXLwXW的目的是最小化类内距离，定义如Eq. 3,式中Nc表示属于第c类的训练样本个数。
[0024] 7 (3)
[0025] WTXLfXW的目的是对最小化离得较远但属于同一类别的样本之间的距离进行一定的惩罚，定义如Eq. 4,式中Nf表示与xi属于同一类并且互相不为k邻域的样本的个数， Nk(Xj)表示Xj的k邻域。
[0026]
(4)
[0027]WTXLmXW的目的是在低维空间中保持高维空间中的流形结构，其中的L-定义如Eq. 5,式中lk+1G Rk+1为元素全为1的列向量，S#RnX(k+1)，Si=1当x5为 = ，撒(X/)}的第p个元素，（Si)pq= 0其它情况。 (5) "
，
[0031] (2)将Eq. 1所示的优化问题转化为Eq. 6所示的求广义特征值的问题，其中W由最大的q个广义特征值对应的广义特征向量组成，q为维数约简之后的维度。
[0032]X(Lb+aiLf)XTff=AX(Lw+a2Lf)XTff, (6)
[0033] (3)获得投影映射W，将训练数据从高维空间转换到低维空间Y=WTX
[0034] -种结合降维和认知引力模型的人脸表情识别方法中的质量计算方法的步骤如下：
[0035] (1)计算样本y的密度，其中>^是71的第K近邻。
[0036]
(7)
[0037] (2)计算样本的自信息I (y): 「00381
(8)
[0039] (3)通过归一化自信息，计算样本的质量m(y):
[0040]
[0041] (9)
[0043] 其中，m(y)为样本的质量。
[0044] 本发明相对于现有技术具有如下的优点及效果：
[0045] 1、本发明提出的ERF相对于RF在目标方程中增加了一项优化目标，该优化目标能对最小化距离较远属于同一类的样本之间的距离进行惩罚，能够避免最小化这些距离时对目标函数影响过大，导致其它的优化目标不能很好的实现。
[0046] 2、本发明提出的ERF相对于RF对优化目标中的各项使用了更好的归一化方法，该归一化目标能够使得各优化目标的数量级在不同训练样本个数的情况下相对恒定，从而使得ERF中的平衡参数能够在较小的范围内选择。
[0047] 3、本发明提出的ERF能够从训练样本中提取到样本的分布密度信息，该信息有利于分类。
[0048] 4、本发明使用一种新的方法计算认知引力模型的质量，使得样本的质量几乎只与样本的分布密度相关，能够更好的利用样本的分布密度信息，从而使得新的认知引力模型更有利于分类。
[0049] 5、本发明将一种新的基于认知引力模型的分类器用于人脸表情识别，相对支持向量机，K-近邻分类，稀疏表示分类，该分类能够更好的利用样本的分布密度信息。
【附图说明】
[0050] 图1是一种结合降维和认知引力模型的人脸表情识别方法的流程图。
【具体实施方式】
[0051] 下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。
[0052] 实施例
[0053] 如图1所示，本实施例

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：文贵华;孙亚新;
技术所有人：华南理工大学;
我是此专利的发明人

上一篇：一种基于2d视频序列的手势识别及人机交互方法和系统的制作方法
上一篇：人物的识别方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。