带噪语音情感识别方法、系统、设备及存储介质与流程

文档序号：25652514发布日期：2021-06-29 21:00阅读：来源：国知局

技术特征：
1.带噪语音情感识别方法，其特征是，包括：获取待识别的带噪语音信号；对待识别的带噪语音信号进行端点检测处理；根据端点得到若干个有声音的语音片段；对有声音的语音片段进行特征提取，得到语音特征；将语音特征输入到训练后的语音情感识别模型中，输出情感类别。2.如权利要求1所述的带噪语音情感识别方法，其特征是，对待识别的带噪语音信号进行端点检测处理；根据端点得到若干个有声音的语音片段；具体包括：对待识别的带噪语音信号进行稀疏转换处理；对稀疏转换处理后的语音信号，随机生成高斯随机矩阵；将高斯随机矩阵作为语音信号的观测矩阵；基于观测矩阵，采用正交匹配追踪算法omp进行样本重建，得到端点检测结果。3.如权利要求2所述的带噪语音情感识别方法，其特征是，对待识别的带噪语音信号进行稀疏转换处理；具体包括：采用离散余弦变换，对待识别的带噪语音信号进行稀疏转换处理。4.如权利要求2所述的带噪语音情感识别方法，其特征是，基于观测矩阵，采用正交匹配追踪算法omp进行样本重建，得到端点检测结果；具体包括：(1)：根据观测矩阵，得到每一帧的语音观测值；(2)：首次运行时，残差设定为语音观测值，计算残差与传感矩阵的相关系数；非首次运行时，计算上一次迭代估计值与语音观测值的残差，和残差与传感矩阵的相关系数；(3)：在传感矩阵中，寻找相关系数最大原子，利用相关系数最大原子更新信号重建的支撑集；(4)：基于支撑集，使用最小二乘法对观测值进行逼近，得到的信号的估计值；(5)：更新残差，计算残差条件熵；(6)：判断是否达到稀疏度条件，如果是，就返回(2)；如果否，就计算第一次迭代与最后一次迭代的残差条件熵差值，且此时的信号的估计值认为是重建样本；(7)：判断第一次迭代与最后一次迭代的残差条件熵差值是否高于设定阈值，如果高于设定阈值，则认为当前帧语音为有声段；如果低于设定阈值，则认为当前帧语音为无声段，获得当前帧语音的端点检测结果；(8)：基于端点检测结果，获得重建样本中的有声音的语音片段。5.如权利要求4所述的带噪语音情感识别方法，其特征是，计算上一次迭代估计值与语音观测值的残差，和残差与传感矩阵的相关系数；具体包括：第t次迭代所获得的重建残差r
t
的计算公式为：其中，a
t
是omp算法第t次迭代过程中由传感矩阵的原子构成的支撑集，为第t次迭代过程中最小二乘法计算的估计值，y是观测值。6.如权利要求4所述的带噪语音情感识别方法，其特征是，更新残差，计算残差条件熵；
具体包括：对每次迭代得到的残差进行存储，更新残差；基于更新后的残差，计算残差条件熵；所述基于更新后的残差，计算残差条件熵；残差条件熵σ
e
的计算公式为：a
t
‑1是omp算法第t
‑
1次迭代过程中由传感矩阵的原子构成的支撑集，为t
‑
1次迭代过程中最小二乘法计算的估计值。7.如权利要求4所述的带噪语音情感识别方法，其特征是，稀疏度条件指的是在样本重建过程中每次迭代完之后要判断迭代次数与稀疏度k的大小来判断是否终止迭代；如果迭代次数小于k要继续迭代，否则终止迭代。8.带噪语音情感识别系统，其特征是，包括：获取模块，其被配置为：获取待识别的带噪语音信号；端点检测模块，其被配置为：对待识别的带噪语音信号进行端点检测处理；根据端点得到若干个有声音的语音片段；特征提取模块，其被配置为：对有声音的语音片段进行特征提取，得到语音特征；输出模块，其被配置为：将语音特征输入到训练后的语音情感识别模型中，输出情感类别。9.一种电子设备，其特征是，包括：一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序；其中，处理器与存储器连接，上述一个或多个计算机程序被存储在存储器中，当电子设备运行时，该处理器执行该存储器存储的一个或多个计算机程序，以使电子设备执行上述权利要求1
‑
7任一项所述的方法。10.一种计算机可读存储介质，其特征是，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1
‑
7任一项所述的方法。

完整全部详细技术资料下载

当前第2页1 2 3