一种基于模糊支持向量机的语音情感识别方法

文档序号:2827637阅读:398来源:国知局
一种基于模糊支持向量机的语音情感识别方法
【专利摘要】本发明涉及语音情感识别技术,具体的说是涉及一种基于模糊支持向量机的语音情感识别方法。本发明的方法包括:对输入的带有情感的语音信号进行预处理;所述预处理包括预加重滤波和加窗分帧;提取处理后的语音信号的特征信息梅尔倒普系数(MFCC);对所提取的梅尔倒普系数用核主成份分析(KPCA)进行降维处理;根据降维后的梅尔倒普系数特征信息进行分类识别,并输出识别结果;具体的分类识别方法为采用FSVM算法进行;本发明的有益效果为,通过MFCC情感特征,然后用KPCA对特征降维减少了冗余的信息,比直接使用MFCC特征的识别效果要好很多,其识别率更高,效果更好,且识别速度更快。本发明尤其适用于语音智能情感识别。
【专利说明】一种基于模糊支持向量机的语音情感识别方法

【技术领域】
[0001] 本发明涉及语音情感识别技术,具体的说是涉及一种基于模糊支持向量机的语音 情感识别方法。

【背景技术】
[0002] 专家已经从生理和心理两个领域对情感研究了很长一段时间,随着人工智能的快 速发展,人机交互中的情感研究引起了广大专家的极大兴趣。在人机交互中,希望人类跟机 器能更自然的进行交流,这就需要机器能够理解人类的情感,所以机器对情感的分类识别 显得尤其重要了。在人类交流中,语音包含了丰富的信息,所以机器可以通过语音对情感进 行分类识别。专家们对语音情感分类识别已经进行了大量的研究和分析,一般包括语音情 感库的建立、情感特征提取、分类识别方法的研究。前人为了提高语音情感的识别率,对每 一个环节都进行了改进研究,但没有形成一个统一的系统,识别率也不是很高。前人用梅尔 倒谱系数(MFCC)作为识别特征,但在识别之前没有对此特征做进一步处理,这就会出现很 多冗余的信息影响识别效果。前人在使用分类器的时候发现噪声或孤立点对识别率影响特 别大,为了消除这种影响提高识别率,选择一个合适的分类器成了研究的重点。为了提高语 音情感识别率,对情感特征作适当处理和选择合适的分类方法尤其重要。


【发明内容】

[0003] 本发明所要解决的,就是针对传统技术存在的问题,提出一种基于模糊支持向量 机的语音情感识别方法。
[0004] 本发明解决上述技术问题所采用的技术方案是:一种基于模糊支持向量机的语音 情感识别方法,其特征在于,包括以下步骤:
[0005] a.对输入的语音信号预处理;所述预处理包括预加重滤波和加窗分帧,其中预加 重滤波的预加重系数α为0. 97,加窗分帧的帧长为30ms ;
[0006] b.提取处理后的语音信号的特征信息;所述特征信息为梅尔倒普系数(MFCC);其 中,特征信息为26维,包括13维梅尔倒普系数以及13维由梅尔倒普系数推导出的一阶差 分倒普系数;
[0007] c.对提取的梅尔倒普系数进行降维处理;所述降维处理具体为采用核主成份分 析(KPCA)进行降维;KPCA的处理过程如下:
[0008] cl.将所获得的η个指标(每一指标有m个样品)的一批数据写成一个(mXn)维 数据矩阵

【权利要求】
1. 一种基于模糊支持向量机的语音情感识别方法,其特征在于,包括以下步骤: a. 对输入的语音信号预处理;所述预处理包括预加重滤波和加窗分帧; b. 提取处理后的语音信号的特征信息;所述特征信息为梅尔倒普系数; c. 对提取的梅尔倒普系数进行降维处理;所述降维处理具体为采用核主成份分析进 行降维; d. 将降维处理后的梅尔倒普系数特征信息输入模糊支持向量机分类器,模糊支持向量 机分类器输出分类识别结果;所述模糊支持向量机分类器采用模糊支持向量算法对语音训 练样本进行训练,具备语音情感分类识别能力;所述语音训练样本经过上述步骤a?c处理 后,再用于训练模糊支持向量机分类器;所述模糊支持向量算法的具体步骤为:
【文档编号】G10L17/04GK104091602SQ201410331505
【公开日】2014年10月8日 申请日期:2014年7月11日 优先权日:2014年7月11日
【发明者】周代英, 谭发曾, 贾继超, 田兵兵, 寥阔 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1