一种基于移动终端的嗓音检测评估装置及方法

文档序号：2829121阅读：636来源：国知局

专利名称：一种基于移动终端的嗓音检测评估装置及方法
技术领域：
本发明涉及移动终端和嗓音检测技术领域，具体涉及一种基于移动终端的嗓音检测评估装置及方法。
背景技术：
随着医学技术的发展和人们健康意识的提高，人们更加重视嗓音疾病对生活质量造成的影响，嗓音声学评估、喉功能检测、嗓音矫治与保健成为了耳鼻咽喉科新的发展趋势。然而，随着人口老龄化和慢性疾病人口比例的逐年增长，传统的医疗服务面临巨大的压力和挑战。因此，一种便携式、低成本、有效的嗓音分析检测系统亟待出现。目前，国内外主要使用电子计算机及频谱分析仪采集、分析、统计嗓音声样，对嗓音进行声学分析。国内已有的嗓音医学相关系统为国产USSA语音频谱分析系统(彭策，万柏坤.嗓音分析在疾病诊断中的应用[J].生物医学工程学杂志，2007，24(6):1419-1422.)，声样采集均在环境噪音小于45dB SPL的空调室内，受检者口距麦克风10-15cm,自然舒适平稳发元音/a/、/i/各3 5秒各I次，声强控制在80dB SPL左右，通过A/D转换，输入电子计算机进行嗓音声学参数分析，采集的声学参数有:基频(H))、基频微扰(Jitter)、振幅微扰(Shimmer)、规范化噪声能量(NNE)、基频标准差(SDFO)等。国外的相关系统有美国Tiger Electronics (上海)公司生产的Dr.Speech Science语音分析系统，法国开发的嗓音工作站EVA (Marseille French)(Hu Ruimin, Peng Jun, Zhu Rong.Electronic Mail Voice Assistant(EVA).HighTechnology Letters, 19981.)和美国Kay Elemetrics公司的多维语音分析系统MDVP (Mult1-Dimensional Voice Program)(Kent RD,Vorperian HK, Kent JF,DuffyJR.Voice dysfunction in dysarthria:application of the Mult1-Dimensional VoiceProgram.Journal of communication disorders, 20034.；Maryn Y, Corthals P, De BodtM, Van Cauwenberge P, Deliyski D.Perturbation measures of voice:a comparativestudy between Mult1-Dimensional Voice Program and Praat.Folia phoniatrica etlogopaedica, 20094.)，以上提及的这些软件的采样环境与上述国产的系统基本相同，处理结果和参数分析较优于国产系统。多维语音嗓音分析软件的主要功能是研究正常嗓音和病变嗓音的声学性质，能从语音信号中提取包括频率抖动、振幅抖动、基频、能量等32项声学参数，利用这些参数可以评价嗓音的特性，同时可以利用各参数的正常参考值对病变嗓音进行临床分析。但上述系统、软件价格昂贵，且受于时间和环境的限制，不能随时随地方便快捷对嗓音信号进行分析评估，适用人群非常少，在国内外尚未得到普及。如今移动终端(如手机、掌上电脑等)已经发展的十分迅速，计算速度和能力非常惊人，且得到很大范围的普及，需对嗓音进行评估的人群日益增加(教师、音乐人等)，但是基于移动终端的嗓音评估系统尚属空白。此外，由于嗓音信号的多变性，迄今尚未找到一种完善的方法可以使各类人群、各种环境条件下都能获得满意的检测结果，也缺少对性别差异等的考虑。目前已有一些针对嗓音分析或者性能评估的专利，但是其中有的是针对特定人群对嗓音性能进行评估(德米特里戈洛夫金，崔哲珉.评估演唱者的嗓音性能的方法和使用该方法的设备.CN101740025A_200910.)，有的是提供一种嗓音谐噪比的分析方法(颜永红，王迪，张建平一种自动嗓音谐噪比分析方法 CN101452698_200710.)，有的几乎未涉及嗓音生理参数(KAY ELEMETRICS CORP.Speech analysis apparatus.US23732081A_1981-2-23.)，都缺少可以适用于各类人群比较便捷并且可以对重要生理参数进行分析评估的系统。请参见中国专利CN101740025A“评估演唱者的嗓音性能的方法和使用该方法的设备”德米特里戈洛夫金等人提出的一种用于评估卡拉OK设备的演唱者的嗓音性能的方法；参见中国专利CN101452698 “一种自动嗓音谐噪比分析方法”颜永红等人发明的使用自相关图表征的时域和耳蜗谱域通道之间相关性来判断谐波成份进行谐噪比分析的方法；参见美国专利US23732081A“speech analysis apparatusTferbeson, WilliamD等人发明的将音调频率信号等通过电压传感器到视觉显示装置。

发明内容
针对现有技术存在的问题，本发明提供一种基于移动终端的嗓音检测评估装置及方法。本发明的技术方案是:一种基于移动终端的嗓音检测评估装置，包括嗓音检测评估终端，用于对嗓音信号进行检测并分析嗓音状态，其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元；所述嗓音检测评估终端采用移动终端；所述信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块；嗓音信号采集模块用于采集测试者的嗓音信号，采集到的嗓音信号在嗓音信号数据保存模块进行保存，嗓音检测评估结果在检测评估结果保存模块进行保存；所述嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块；嗓音信号处理模块用于截取嗓音信号中的周期性信号；嗓音信号周期检测模块用于对截取的周期性信号进行周期检测；特征参数提取模块用于对嗓音信号周期检测模块的输出信号进行特征参数提取，特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;嗓音信号特征评估分析模块用于对特征参数提取模块的提取结果进行分析，得出测试者嗓音状态；所述数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块；嗓音信号输出模块用于将嗓音信号特征评估分析模块的分析结果输出到外部，嗓音信号波形绘制模块用于将采集到的测试者的嗓音信号绘制成波形并显示，检测日志访问模块用于将特征参数提取模块的提取结果和嗓音信号特征评估分析模块的分析结果生成检测日志，进行长期跟踪分析。
采用上述基于移动终端的嗓音检测评估装置进行嗓音检测评估方法，包括以下步骤:步骤1:通过嗓音检测评估终端采集测试者的嗓音信号，将所采集到的嗓音数据绘制波形曲线显示并保存数据；步骤2:截取采集到的嗓音信号中的周期性信号；截取采集到的嗓音信号中的周期性信号的具体方法如下:步骤2.1:对采集到的嗓音信号进行小波变换，并得到嗓音信号中高频部分的小波系数；步骤2.2:对小波变换后的嗓音信号进行分帧，计算分帧后每帧信号的小波系数的偏方差值；步骤2.3:选取小波系数的偏方差值最小的一帧嗓音信号作为周期性信号并保存；步骤3:对截取的周期性信号进行周期检测；步骤3.1:通过快速傅里叶变换确定周期性信号的基频；人的嗓音频率范围为50-500HZ，测试者嗓音在该频率范围内的最大值位置即为估算的嗓音信号中周期性信号的基频。通过傅里叶变换确定周期性信号的基频，具体步骤如下:步骤3.1.1:对周期性信号进行傅里叶变换；步骤3.1.2:在变换后的周期性信号中选取人的嗓音频率范围内的频率，其中的最大峰值位置作为主峰值；人的嗓音频率范围为50-500HZ ；步骤3.1.3:提取最大峰值位置的1/N位置处的±5%范围内的峰值即作为分峰值，N为整数，N=l，2，3,4,5……；步骤3.1.4:判断主峰值与分峰值的比值，若该比值小于10，则该主峰值为基频，否则该主峰值不是基频，返回步骤3.1.3，提取最大峰值位置的1/(N+1)位置处的±5%范围内的峰值即作为分峰值，继续判断主峰值与分峰值的比值；步骤3.1.5:得到周期性信号的基频；步骤3.2:采用小波变换的方法对周期性信号进行小波分解和小波重构，得到小波重构信号；嗓音基频变化范围较大，从低音男性的50Hz到高音女性或儿童的500Hz，接近三个倍频程，根据嗓音信号据估计的基础频率不同，小波分解的层数一般为9层以上(包括9层)，小波重构的层数一般为6层或7层。根据理论和实验分析得出:基础频率约为50-172HZ的嗓音信号应选择在第7层进行小波重构；基础频率约为172-344HZ的嗓音信号应选择在第6层进行小波重构；基础频率约为344-500HZ的嗓音信号应选择在第5层进行小波重构。步骤3.3:对小波重构信号进行周期检测，得到嗓音信号的周期；对比较复杂的嗓音信号周期检测即转化为对比较简单的小波重构信号的周期检测，小波重构信号的波形是类正弦曲线，对小波重构信号进行周期检测的步骤如下:步骤3.3.1:通过导数特性检测得到小波重构信号的峰值位置序列；
步骤3.3.2:去除峰值位置序列中的重复峰值，得到新的峰值位置序列；步骤3.3.3:检测步骤3.3.2得到的峰值位置序列中的每个点的前后15%的范围内的极大值，得到小波重构信号的极大值位置序列；采用同样方法，重复步骤3.3.f步骤3.3.3可得到原始嗓音周期性信号的极大值位置序列；步骤3.3.4:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配，完成周期检测；将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配，具体是:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列里的数值按顺序进行比对，计算相应位置数值之差，若差值<基本周期的20%(基本周期为基频的倒数)，则该数值保留，否则舍弃，得到新的嗓音周期性信号的极大值位置序列就是周期性信号的峰值位置序列，进而得到嗓音信号的周期，完成嗓音信号的周期检测。步骤4:对周期检测后的嗓音信号进行特征参数提取，并对提取结果进行显示和保存，特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE;基频(Fundamental Frequency, F0)是声带振动的基础频率,单位为Hz,表示每秒声带振动的次数，是最常用的声学检测指标之一。一般来说，正常男性的基频在130Hz左右，正常女性的基频在250Hz左右，正常儿童的基频在340Hz左右。基频主要是由声带振动的速率决定的。声带振动部分的长度，声带组织的张力以及声带质量的大小是决定基频的三大因素。微扰分为频率微扰(Jitter)和振幅微扰(Shi_er):基频微扰和振幅微扰主要反映嗓音信号的瞬时变化情况，一般来说，病理嗓音较正常嗓音有更高的基频微扰值和振幅微扰值[8]。嗓音随声带的质量、振动幅度、紧张度而变化，人的嗓音频率与幅度不是衡定不变的，发声时声信号频率与振幅出现微小、快速、不规则的变化，这种变化称之为频率微扰商(FPQ或称Jitter)和振幅微扰商(APQ或称Shimmer),音调微扰与频率的百分比表示频率变动幅度，基本周期平均数除微扰程度得出相对平均微扰。Jitter及Shimmer均表达嗓音信号的短时变化，是反映声带不规律性振动的有效指标，分别反映声音的撕哑程度及粗糙程度，不同的声样其Shimmer、Jitter不同，发/i/时，声带拉紧，张力较大，通过声门的气流量较发/a/时小，而声门下压则较大，故声带振动相对发/a/时规则，发元音/i/时对Jitter和Shi_er值影响最小,病理状态下更易受代偿影响。基频微扰(Jitter)是指相邻周期间声波频率的变化率，用于度量指定的一个周期与相邻前几个周期或后几个周期的差异量，反映声带振动周期间频率的差异。基频微扰有五个计算公式:
Jitter = 100 Yi 丨 I — ”X(…一 U I (%)M^k + l ,^ x(n + j ^l}
i=ia)基频微扰(RAP)的定义是移动平均数为3b)基频微扰(PPQ)的定义是移动平均数为5c)基频微扰(Ilp)的定义是移动平均数为11
d)基频微扰(abs)的定义是
权利要求
1.种基于移动终端的嗓音检测评估装置，其特征在于:包括嗓音检测评估终端，用于对嗓音信号进行检测并分析嗓音状态，其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元；所述嗓音检测评估终端采用移动终端；所述信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块；嗓音信号采集模块用于采集测试者的嗓音信号，采集到的嗓音信号在嗓音信号数据保存模块进行保存，嗓音检测评估结果在检测评估结果保存模块进行保存；所述嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块；嗓音信号处理模块用于截取嗓音信号中的周期性信号；嗓音信号周期检测模块用于对截取的周期性信号进行周期检测；特征参数提取模块用于对嗓音信号周期检测模块的输出信号进行特征参数提取；嗓音信号特征评估分析模块用于对特征参数提取模块的提取结果进行分析，得出测试者嗓音状态；所述数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块；嗓音信号输出模块用于将嗓音信号特征评估分析模块的分析结果输出到外部，嗓音信号波形绘制模块用于将采集到的测试者的嗓音信号绘制成波形并显示，检测日志访问模块用于将特征参数提取模块的提取结果和嗓音信号特征评估分析模块的分析结果生成检测日志，进行长期跟踪分析。
2.据权利要求1所述的基于移动终端的嗓音检测评估装置进行嗓音检测评估的方法，其特征在于:包括以下步骤: 步骤1:通过嗓音检测评估终端采集测试者的嗓音信号，将所采集到的嗓音数据绘制波形曲线显示并保存数据；步骤2:截取采集到的嗓音信号中的周期性信号；步骤3:对截取的周期性信号进行周期检测；步骤3.1:通过快速傅里叶变换确定周期性信号的基频；步骤3.2:采用小波变换的方法对周期性信号进行小波分解和小波重构，得到小波重构信号；步骤3.3:对小波重构信号进行周期检测，得到嗓音信号的周期；对小波重构信号进行周期检测的步骤如下: 步骤3.3.1:通过导数特性检测得到小波重构信号的峰值位置序列；步骤3.3.2:去除峰值位置序列中的重复峰值，得到新的峰值位置序列；步骤3.3.3:检测步骤3.3.2得到的峰值位置序列中的每个点的前后15%的范围内的极大值，得到小波重构信号的极大值位置序列；采用同样方法，重复步骤3.3.广步骤3.3.3可得到原始嗓音周期性信号的极大值位置序列；步骤3.3.4:将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配，得到嗓音信号周期；步骤4:对周期检测后的嗓音信号进行特征参数提取，并对提取结果进行显示和保存，特征参数包括基频、微扰、谐噪比、信噪比和标准化声门噪声能量NNE ；步骤5:对特征参数提取结果和健康嗓音数据的特征参数进行比对分析，得出测试者嗓音状态；步骤6:对分析结果进行显示，并且根据特征参数提取结果和分析结果生成测试者嗓音检测日志，可以根据需要随时查阅。
3.据权利要求2所述的基于移动终端的嗓音检测评估方法，其特征在于:步骤2所述的截取采集到的嗓音信号中的周期性信号，具体方法如下: 步骤2.1:对采集到的嗓音信号进行小波变换，并得到嗓音信号中高频部分的小波系数；步骤2.2:对小波变换后的嗓音信号进行分帧，计算分帧后每帧信号的小波系数的偏方差值; 步骤2.3:选取小波系数的偏方差值最小的一帧嗓音信号作为周期性信号并保存。
4.据权利要求2所述的基于移动终端的嗓音检测评估方法，其特征在于:步骤3.1所述的通过快速傅里叶变换确定周期性信号的基频，具体步骤如下: 步骤3.1.1:对周期性信号进行傅里叶变换；步骤3.1.2:在变换后的周期性信号中选取人的嗓音频率范围内的频率，其中的最大峰值位置作为主峰值；人的嗓音频率范围为50-500HZ ；步骤3.1.3:提取最大峰值位置的1/N位置处的±5%范围内的峰值即作为分峰值，N为整数，N=l，2，3,4,5……；步骤3.1.4:判断主峰值与分峰值的比值，若该比值小于10，则该主峰值为基频，否则该主峰值不是基频，返回步骤3.1.3，提取最大峰值位置的I/ (N+1)位置处的±5%范围内的峰值即作为分峰值，继续判断主峰值与分峰值的比值；步骤3.1.5:得到周期性信号的基频。
5.据权利要求2所述的基于移动终端的嗓音检测评估方法，其特征在于:步骤3.2所述的采用小波变换的方法对周期性信号进行小波分解和小波重构，得到小波重构信号，小波分解的层数至少为9层，小波重构的层数为6层或7层。
6.据权利要求2所述的基于移动终端的嗓音检测评估方法，其特征在于:步骤3.3.4所述的将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列进行模糊匹配，完成周期检测，具体是将小波重构信号的极大值位置序列与原始嗓音周期性信号的极大值位置序列里的数值按顺序进行比对，计算相应位置数值之差，若差值< 基本周期的20%，则该数值保留，否则舍弃，得到新的嗓音周期性信号的极大值位置序列就是周期性信号的峰值位置序列，进而得到嗓音信号的周期。
7.据权利要求2所述的基于移动终端的嗓音检测评估方法，其特征在于:步骤5所述的健康嗓音数据的特征参数，具体如下:正常人频率微扰0.18±0.07 %、振幅微扰1.60±0.74 %、谐噪比25.34±3.12 dB、信噪比25.39±3.09 dB、声门噪声能量-16.95±3.57 dB ;男性基频平均值160.81 ±24.27 Hz、女性基频平均值297.42±35.89Hz、基频总平均值206.35±70.77 Hz。
全文摘要
一种基于移动终端的嗓音检测评估装置，包括嗓音检测评估终端，其包括信号采集及数据保存单元、嗓音信号处理及评估单元和数据输出单元；嗓音检测评估终端采用移动终端；信号采集及数据保存单元包括嗓音信号采集模块、嗓音信号数据保存模块和检测评估结果保存模块；嗓音信号处理及评估单元包括嗓音信号处理模块、嗓音信号周期检测模块、特征参数提取模块和嗓音信号特征评估分析模块；数据输出单元包括嗓音信号输出模块、嗓音信号波形绘制模块和检测日志访问模块。本发明具有嗓音信号采集、处理、分析和评估功能，基于移动终端的嗓音检测评估装置具有便携、低成本、性别差异不敏感等优点。
文档编号G10L25/66GK103093759SQ20131001610
公开日2013年5月8日申请日期2013年1月16日优先权日2013年1月16日
发明者徐礼胜, 边钺岩, 王娇娜, 汪威, 靳雁冰, 纪朋飞申请人:东北大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐礼胜;边钺岩;王娇娜;汪威;靳雁冰;纪朋飞
技术所有人：东北大学
我是此专利的发明人