一种用于混合语音情感识别的语音特征筛选方法

文档序号:8513351阅读:371来源:国知局
一种用于混合语音情感识别的语音特征筛选方法
【技术领域】
[0001] 本发明涉及模式识别领域,具体涉及语音情感识别方法和特征选择方法。
【背景技术】
[0002] 校园霸凌是一种常见的社会现象,多发生在中小学生群体中。校园霸凌有多种表 现形式,如:身体暴力、言语欺凌、损坏财物、孤立等,其中言语欺凌最为频发。言语欺凌中通 常包含辱骂、悲伤等负面情感,因此可以用语音情感识别的方法检测言语欺凌。
[0003] 目前语音情感识别领域的研宄大多基于单一对象的单一情感,而校园霸凌的语境 通常由多人语音构成,包含欺凌者和受害人的不同情感,因此适用于单一情感识别的分类 算法和声学特征并不适用于混合情感识别。

【发明内容】

[0004] 本发明是为了实现混合语音情感识别的语音特征筛选,从而提供一种用于混合语 音情感识别的语音特征筛选方法。
[0005] 一种用于混合语音情感识别的语音特征筛选方法,它由以下步骤实现:
[0006] 步骤一、将混合语音数据按类别平均划分为训练集和测试集,并分别提取各个语 音样本的声学特征参数,记为M i,并放入备选特征集合s = IMJ,已选特征集合D为空集;i =1,2,…,N ;N为正整数;
[0007] 每次选取一个Mi作为分类算法的输入,则计算其识别率R(M D,重复此过程N次, 分别得到N个声学特征参数的识别率R(Mi);
[0008] 步骤二、在备选特征集合S中找出单一识别率最高的声学特征参数MiJfM i从备 选特征集合S移到已选特征集合D中;
[0009] 步骤三、用备选特征集合S中剩下的元素依次与已选特征集合D中元素配合,作为 分类算法的输入,计算其识别率,在备选特征集合S中找出使R(D+Mi)最大的M i;
[0010] 判断是否有R(D+Mi)彡R(D),如果判断结果为是,则将声学特征参数吣从备选特 征集合S移至已选特征集合D中,并执行步骤四;如果判断结果为否,则执行步骤五;
[0011] 步骤四、用备选特征集合S中剩下的元素重复执行步骤三,直到 MaX(R(D+Mi))〈R(D),MiE S,已选特征集合D中元素不再增加,此时已选特征集合为D = {Μ」} ;,j = 1,2,…,p ;p为正整数;执行步骤七;
[0012] 步骤五、对已选特征集合D中的每个元素 Mj,计算R(D-Mj),找出使R(D-Mj)最大 的M j;
[0013] 判断是否有R (D - Mj)彡R(D),如果判断结果为是,则从已选特征集合D中去掉%, 并执行步骤六;如果判断结果为否,则执行步骤七;
[0014] 步骤六、用已选特征集合D中剩下的元素重复执行步骤五,直到1^以1?(0-Mj)) <R (D),Mj e D,已选特征集合D中元素不再减少,此时已选特征集合为D = {M』};
[0015] 步骤七、返回执行步骤三,直至已选特征集合D中不再有元素增加或减少,将最终 的已选特征集合D作为最佳特征组合,完成混合语音情感识别的语音特征筛选。
[0016] 本发明给出一种混合语音情感识别中的声学特征筛选方法,本发明能够从一系列 声学特征中找出一组最佳特征集合,使得分类方法的平均识别率达到最高。实现混合语音 情感识别的高精度语音特征筛选。
【附图说明】
[0017] 图1是【具体实施方式】一的特征筛选过程中平均识别率的变化仿真示意图;
【具体实施方式】
【具体实施方式】 [0018] 一、基于混合语音情感识别的声学特征筛选方法,由以下步骤组 成:
[0019] 步骤一、将混合语音数据按类别平均划分为训练集和测试集,并分别提取各个语 音样本的声学特征参数,记为Mi,i = 1,2,…,N,放入备选特征集合S = {Mi,i = 1,2,…,N}, 而已选特征集合D为空集。每次选取一个Mi作为分类算法的输入,计算其识别率R(M J,重 复此过程N次,分别得到N个声学特征参数的识别率R(Mi),i = 1,2,…,N ;
[0020] 步骤二、在S中找出单一识别率最高的声学特征参数Mi,将%从备选特征集合S移 到已选特征集合D中;
[0021] 步骤三、用S中剩下的元素依次与D中元素配合,作为分类算法的输入,计算其识 别率,在S中找出使R(D+Mi)最大的吣。若R(D+Mi)彡R(D),则将M iWS移至D中,并继续 步骤四,否则进入步骤五;
[0022] 步骤四、用S中剩下的元素重复步骤③,直到Max(R(D+Mi))〈R(D),MiE S,D中元 素不再增加,此时已选特征集合为D= {M」,j = 1,2,···,ρ};
[0023] 步骤五、对D中的每个元素 Mj, j = 1,2, "·,ρ,计算R(D-Mj),找出使R(D-Mj)最 大的Μ」。若有R(D - Mj)彡R(D),则从D中去掉Mj (并且不会放回S中),并继续步骤六,否 则进入步骤七;
[0024] 步骤六、用D中剩下的元素重复步骤⑤,直到Max (R(D-Mj) )〈R (D),MjE D,D中元 素不再减少,此时已选特征集合为D= {M」,j = 1,2, ···,(!};
[0025] 步骤七、重复步骤③至⑥,直到D中不再有元素增加或减少。至此得到最佳特征组 合 D = {Μ』,j = 1,2, ...,n} 〇
[0026] 下面以GMM(Gaussian Mixture Model,高斯混合模型)分类算法作用于混合语音 的 24 个 MFCC(Mel Frequency Cepstral Coefficients,Mel 频率倒谱系数)特征为例,说 明上述特征筛选算法的有效性。言语欺凌实验由不同年龄的8个女生和7个男生表演,采 集混合情感语音数据共80段,涉及语境包括:日常会话2类,分别以"快乐"和"中性"为主, 混以其它情感;言语欺凌2类,分别以"辱骂"和"悲伤"为主,混以其它情感。图1给出特 征筛选过程中平均识别率的变化。
[0027] 图1中,第1至4步是特征增加过程,平均识别率随特征数目的增加而升高,第4 步的识别率与第3步相同,说明第4步中新增的特征可有可无,但在第4步中该特征与已有 特征的配合最好,故暂留在已选特征集中,进入下一轮筛选。第5步新增特征后,识别率开 始下降,新增特征已是剩余备选特征中与已选特征配合最好的,故剩余特征已无可选,特征 增加过程结束。第6步删除第5步新增特征,恢复到第4步状态,从第7步开始已选特征集 进入删减过程,删除已选集中配合最差的特征,识别率不变。第8步继续删除配合最差特征 后,识别率下降,说明已选特征集中剩下的每个特征对分类都有贡献,不应删除,特征删减 过程结束。第9步重新将第8步所删特征加入,恢复到第7步状态。第10步再次进入特征 增加过程,在剩余备选特征(不含已删除特征)中选择与已选特征配合最好的特征,但识别 率下降,说明剩余备选特征中已无可用,增加过程结束。第11步将第10步新增特征删除, 之前的一轮删减和增加过程中已选特征集没有变化,至此特征筛选过程结束,平均识别率 达到最高82. 5%。具体识别结果如表1。
[0028]表 1
【主权项】
1. 一种用于混合语音情感识别的语音特征筛选方法,其特征是:它由以下步骤实现: 步骤一、将采集的混合语音样本数据按类别平均划分为训练集和测试集,并分别提取 各个语音样本数据的声学特征参数,记为Mi,并放入备选特征集合S = {MJ,初始化已选特 征集合D为空集;i = 1,2,. . .,N ;N为正整数; 每次选取一个Mi,并计算其识别率R (Mi),重复此过程N次,分别得到N个声学特征参数 的识别率R(Mi); 步骤二、在备选特征集合S中找出单一识别率最高的声学特征参数Mi,将%从备选特 征集合S移到已选特征集合D中; 步骤三、用备选特征集合S中剩下的元素依次与已选特征集合D中元素配合,并分别计 算其识别率,在备选特征集合S中找出使R(D+Mi)最大的语音样本的声学特征参数Mi; 判断是否有R(D+Mi)彡R(D),如果判断结果为是,则将该语音样本的声学特征参数Mi从备选特征集合S移至已选特征集合D中,并执行步骤四;如果判断结果为否,则执行步骤 五; 步骤四、用备选特征集合S中剩下的元素重复执行步骤三,直到MaxOUD+M^XRQ), MiE S,则已选特征集合D中元素不再增加,此时已选特征集合为D = {Μ」} ;j = 1,2,. . .,p ; P为正整数;执行步骤七; 步骤五、对已选特征集合D中的每个元素 Mj,计算R(D - Mj),找出使R(D - Mj)最大的 Mj; 判断是否有R(D - Mj)多R(D),如果判断结果为是,则从已选特征集合D中去掉Mj,并执 行步骤六;如果判断结果为否,则执行步骤七; 步骤六、用已选特征集合D中剩下的元素重复执行步骤五,直到Max (R(D - Mj)) <R(D), MjE D,已选特征集合D中元素不再减少,此时已选特征集合为D = {M j ; 步骤七、返回执行步骤三,直至已选特征集合D中不再有元素增加或减少,将最终的已 选特征集合D作为最佳特征组合,完成混合语音情感识别的语音特征筛选。
2. 根据权利要求1所述的一种用于混合语音情感识别的语音特征筛选方法,其特征在 于混合语音数据的类别分为:霸凌语音数据和日常语音数据。
【专利摘要】一种用于混合语音情感识别的语音特征筛选方法,涉及模式识别领域,具体涉及语音情感识别方法和特征选择方法。它是为了实现混合语音情感识别的语音特征筛选。本发明给出一种混合语音情感识别中的声学特征筛选方法,本发明能够从一系列声学特征中找出一组最佳特征集合,使得分类方法的平均识别率达到最高。实现混合语音情感识别的高精度语音特征筛选。本发明适用于混合语音情感识别的语音特征筛选。
【IPC分类】G10L25-63
【公开号】CN104835508
【申请号】CN201510152151
【发明人】叶亮, 李月, 吴少川, 石硕, 李卓明, 于婷, 任浩, 刘鑫
【申请人】哈尔滨工业大学
【公开日】2015年8月12日
【申请日】2015年4月1日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1