结合支持向量机二次识别的模糊核聚类语音情感识别方法

文档序号:6365113阅读:222来源:国知局
专利名称:结合支持向量机二次识别的模糊核聚类语音情感识别方法
技术领域
本发明属于语音处理和人工智能交叉领域,特别涉及智能人机交互系统中的情感识别方法。
背景技术
目前,基于传统的统计方式的语音情感模式识别方法,又或者是诸如神经网络的机器学习,这些传统经典方法只有在样本数据足够大的时候才会取得理想的识别率,因此当实际中样本数据较少或者有限时,传统方法的工程应用将会受到限制。另外,众所周知自然情感的表述以及所呈现的状态经常是比较模棱两可的或者说是混杂的(见文献Emotion classification irom speech using evaluator reliability-weightedcombination of ranked—lists,Audhkhasi, K.,Narayanan, S.,In ICASS, Issue July,2011,pp :4956-4959.)。因此在设计语音情感识别系统是应当考虑到情感的混杂属性,所以 以往的识别方法只是赋予未知情感一个单独的预测标签不是最优的(见文献A Frameworkfor Automatic Human Emotion Classification Using Emotion Profiles, Emily M.,Narayanan, S. , IEEE Trans On Audio, Speech and Language Processing, 2011, vol.19,pp.1507-1520)。

发明内容
为解决上述问题,本发明中,我们利用模糊集理论知识,用模糊隶属度来表征未知语音情感的模糊属性,而非ー个单独的分类预测标签,从而更为合理;由于使用了模糊核非线性映射是不同情感的区分度増大。实验结果也证明本发明中的提出的方法是有效的。首先利用模糊核聚类算法(见文献A Kernel Method For Speaker RecognitionWith Little Data, Lin L.,Shuxun ff.,In ICSSP, 2006, vol. I)迭代出姆种情感的码本,让后利用平均模糊加权矢量量化误差最小准则来分类未知语音的情感类别。基于模糊核矢量量化方法会出现陷入局部最优,从而出现识别率下降,针对高兴和生气在这种情况下易混淆,故而经过试验验证采用支持向量机(见文献Chih-Chung C. , Chih-Jen Lin.LIBSV—A Library for Support Vector Machine. http://www. csie. ntu. edu. tw/ cjlin/libsvm/.)方法进行二次识别。其具体原理是核方法的基本思想是通过非线性映射将数据映射到高维特征空间,但是在高维空间中的计算是非常耗时的,因此实际中我们使用Mercer核来简化计算。假设序列X= {xl,x2,...,xN}作为输入数据,在特征空间中输入数据可以表示为O(X1),
i= N,这里①( )Rd — Rq, d << q是非线性映射,它可以用来求特征空间的内积,公式如下K(Xi, Xj) = (O (Xi)) ①(Xj)) (I)因为高斯核函数所对应的特征空间是无穷维的,那么有限的样本在该特征空间中必然是线性可分的;另外,高斯核函数对噪声的敏感程度远远低于其它核函数。因此,本发明中使用满足Mercer条件的高斯核函数。在高斯核函数中,其中S 2表征的是离散度,在本文中利用样本的方差O 2来表示该离散度,当特征样本方差小,表示特征样本矢量之间比较集中,这时候为了能够得到好的分类,必须增大特征矢量的可区分性,由式(2)和(3)知,方差小,特征空间中样本与各类矢量之间距离将增大,从而使得矢量之间可区分性增强,反之亦然。同时,当利用样本方差O2来表示核函数中的离散度,无需为得到合适S 2而进行大量实验,实现參数的自适应调整。新高斯核函数如下
权利要求
1.结合支持向量机二次识别的模糊核聚类语音情感识别方法,包括1,非线性核函数映射;2,平均模糊加权最小矢量量化误差准则;3,结合支持向量机二次识别。
2.根据权利要求I所述的结合支持向量机二次识别的模糊核聚类语音情感识别方法,其特征是1,使用梅尔倒谱系数,通过非线性核函数映射到高维特征空间,这样既可以扩展不同情感的差异性而且也适用于不同数据分布结构的样本;2,通过平均模糊加权最小矢量量化误差准则估计样本类别标签,而非一个硬标签更为合理,3,结合支持向量机对高兴和生气用线性预测系数进行二次识别,从而整体提高了识别率。
全文摘要
结合支持向量机二次识别的模糊核聚类语音情感识别方法。它先用梅尔倒谱系数,通过非线性核函数映射到高维特征空间,利用模糊核聚类得到聚类中心作为矢量量化的码书,让后通过平均模糊加权最小矢量量化误差准则估计样本类别标签,估计完标签后利用支持向量机法并用线性预测系数对高兴和生气进行二次识别。它是人机交互系统中自动识别情感的重要组成部分,它是机器与人进行有感情交互的第一步,对以人为设计中心的系统具有重要的应用前景。
文档编号G06K9/62GK102663432SQ20121011397
公开日2012年9月12日 申请日期2012年4月18日 优先权日2012年4月18日
发明者何文洲, 徐斌, 王良翼, 黄杰 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1