1.一种基于集成学习的混合模型语音情感识别方法,其特征在于,该方法包括以下步骤:
步骤1:构建情感识别语音数据集;
步骤2:对语音信号进行预处理;
步骤3:从步骤2预处理过后的语音信号中提取帧级别具有时序信息的语音信号特征;
步骤4:利用步骤3提取到的语音信号特征分别采用多种算法进行建模,获得多种预测模型;
步骤5:利用步骤4生成的多种预测模型对语音信号进行预测,得到一组预测概率值,将得到的一组预测概率值作为输入数据加入岭回归模型继续训练,构建混合模型;
步骤6:待测语音信号经过步骤2~5处理后,根据混合模型的输出结果判断语音信号的情感类别。
2.根据权利要求1所述的基于集成学习的混合模型语音情感识别方法,其特征在于,步骤2中,预处理包括以下步骤:
步骤s201:对语音信号进行端点检测,去除音频的首尾静音片段;
步骤s202:对语音信号进行预加重;
步骤s203:对步骤s202得到的信号进行分帧处理;
步骤s204:将步骤s203分帧后的每一帧信号进行加窗处理。
3.根据权利要求1所述的基于集成学习的混合模型语音情感识别方法,其特征在于,步骤4中,采用四种算法建模,包括:基于bagging的rf算法,基于boosting的adaboost算法,基于boosting的gbdt算法,以及基于boosting的xgb算法,生成的四种预测模型为rf模型、adaboost模型、gbdt模型和xbg模型。
4.根据权利要求1所述的基于集成学习的混合模型语音情感识别方法,其特征在于,步骤5中,构建混合模型具体包括:
步骤s501:将情感识别语音数据集分成训练集和测试集,多种预测模型均使用该训练集训练,分别得到多个预测模型的预测概率值,形成一组预测概率值;
步骤s502:将得到的一组预测概率值作为训练数据输入岭回归模型重新训练,构建混合模型。
5.根据权利要求2所述的基于集成学习的混合模型语音情感识别方法,其特征在于,步骤s201中,使用vad算法语音信号进行端点检测。
6.根据权利要求2所述的基于集成学习的混合模型语音情感识别方法,其特征在于,步骤s204中,使用汉明窗对信号进行加窗处理,汉明窗函数w(n)如下:
其中,n是窗的宽度。
7.一种基于集成学习的混合模型语音情感识别系统,其特征在于,该系统包括:
预处理模块,用于对语音信号进行预处理;
信号处理模块,从预处理过的语音信号中提取帧级别具有时序信息的语音信号特征;
集成学习模型构造模块,生成多种预测模型;
混合模型构造模块,利用集成学习模型构造模块生成的多种预测模型对特征进行预测,将预测概率值作为输入数据加入岭回归模型继续训练,构建混合模型;
情感识别模块,待测语音信号经过预处理模块、信号处理模块、集成学习模型构造模块和混合模型构造模块处理后,根据混合模型的输出结果判断语音信号的情感类别。
8.根据权利要求7所述的基于集成学习的混合模型语音情感识别系统,其特征在于,预处理模块包括:
端点检测模块,对语音信号进行端点检测,去除音频的首尾静音片段;
信号预加重模块,对语音信号进行预加重;
分帧处理模块,对信号预加重模块处理后的信号进行分帧处理;
加窗处理模块,对分帧处理模块处理后的每一帧信号进行加窗处理。
9.根据权利要求7所述的基于集成学习的混合模型语音情感识别系统,其特征在于,采用四种算法建模,包括:基于bagging的rf算法,基于boosting的adaboost算法,基于boosting的gbdt算法,以及基于boosting的xgb算法,生成的四种预测模型为rf模型、adaboost模型、gbdt模型和xbg模型。
10.根据权利要求7所述的基于集成学习的混合模型语音情感识别系统,其特征在于,混合模型构造模块包括:
模型训练模块,将情感识别语音数据集分成训练集和测试集,多种预测模型均使用该训练集训练,分别得到多个预测模型的预测概率值;
岭回归模型训练模块,将多种预测模型的预测概率值作为训练数据输入岭回归模型重新训练,构建混合模型。