一种病理嗓音的识别方法

文档序号：2827241阅读：445来源：国知局

一种病理嗓音的识别方法
【专利摘要】本发明公开了一种病理嗓音的识别方法，包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块，所述特征参数输入模块和特征优化模块对病理嗓音特征库进行采样和优化淘选，所述病理嗓音识别模块根据特征参数计算匹配度Match，所述匹配判断模块用以统计识别结果，所述内容呈现模块用以输出。本发明通过EM算法，消掉隐变量，通过特征优化组合参数，经过分类器，再运用基于期望值最大化的高斯混合模型（GMM-EM）对优化后的嗓音特征进行有效识别，明显提高正确识别率。
【专利说明】一种病理嗓音的识别方法
【技术领域】
[0001]本发明属于声音识别领域，具体的涉及一种病理嗓音的识别方法。
【背景技术】
[0002]对嗓音状况的调查表明，目前我国至少有I亿人患有各种嗓音疾病，原因涉及到生理和工作环境等许多方面。如何保留和提高喉发音功能及其检测方法成为了众多信号处理及统计模式识别领域研究者共同关注的焦点。随着计算机技术及统计模式识别的迅猛发展，建立在模型统计基础上的病理嗓音自动检测也迅速成为了研究热点，经过几十年的发展，形成了众多的研究方法。
[0003]在特征优化方面，本发明运用连接F属性的评估的属性选择的优化算法，再用两种分类器，对数据进行进一步优化分类，探讨各种病理嗓音的特征。接下来用基于期望值最大化的高斯混合模型，对优化后的嗓音特征进行有效识别。一般的利用传统的高斯混合模型识别的流程如图1所示，分为训练部分和识别部分。建模首先要提取嗓音信号的特征，特征提取之后特征优化，然后训练得到模型。识别部分首先进行特征提取，再进行特征优化，此时需要与训练好的模型进行匹配得到匹配得分，再和设定的阈值比较，最后得到判别结果。但是传统的基于极大似然估计的高斯混合模型必须要求数据处理中不含隐变量，而实际实验中嗓音特征无法避免的会存在隐变量，这就给基于极大似然估计的高斯混合模型识别语音带来了困难。

【发明内容】

[0004]本发明的目的是克服目前病理嗓音系统存在的上述缺点，通过EM算法，消掉隐变量，通过特征优化组合参数，经过分类器，再运用高斯混合模型，明显提高正确识别率。
[0005]为实现上述技术目的，达到上述技术效果，本发明通过以下技术方案实现:
一种病理嗓音的识别方法，包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块，所述病理嗓音识别模块包括基于期望值最大化的高斯混合模型(GMM-EM)建立单元、模型训练单元和语音识别单元，
其中所述模型(GMM-EM)建立单元和模型训练单元包括以下步骤:
步骤2.1)确定高斯混合模型代表公式，如下:
【权利要求】
1.一种病理嗓音的识别方法，包括特征参数输入模块、特征优化模块、病理嗓音识别模块、匹配判断模块和内容呈现模块，其特征在于，所述病理嗓音识别模块包括基于期望值最大化的高斯混合模型(GMM-EM)建立单元、模型训练单元和语音识别单元，其中所述模型(GMM-EM)建立单元和模型训练单元包括以下步骤: 步骤2.1)确定高斯混合模型代表公式，如下:
2.根据权利要求1所述的病理嗓音的识别方法，其特征在于，所述特征参数输入模块包括数据库单元和选择单元，并且所述特征参数输入模块和特征优化模块包括以下步骤:步骤1.1)对病理嗓音特征库进行特征空间采样，生成特征子集；步骤1.2)用连接F属性评估的属性选择算法评价特征子集，并得到其优劣程度的得分Match ；步骤1.3)将特征子集优劣程度得分与连接F属性评估的属性选择算法中设定的阈值相比较，若Match大于阈值则转入下一步，否则转入步骤1.1); 步骤1.4)验证特征选择的结果。
【文档编号】G10L15/10GK103778913SQ201410027836
【公开日】2014年5月7日申请日期:2014年1月22日优先权日:2014年1月22日
【发明者】张晓俊, 曹毅, 陶智, 黄程韦, 吴迪, 肖仲喆申请人:苏州大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张晓俊;曹毅;陶智;黄程韦;吴迪;肖仲喆
技术所有人：苏州大学
我是此专利的发明人

上一篇：多功能效果吉他的制作方法
上一篇：一种数据处理的方法和系统的制作方法