基于多分辨率小波的数字助听器语音增强方法

文档序号:8006304阅读:242来源:国知局
基于多分辨率小波的数字助听器语音增强方法
【专利摘要】本发明提出了基于多分辨率小波的数字助听器语音增强方法。所述方法首先对语音信号预处理,对语音信号分帧并计算音频信号频谱;再进行小波分解与重构,利用多分辨率小波对信号声压级频谱进行小波分解,获得信号声压级频谱的离散平滑逼近和式,重构音频信号声压级频谱;提取音频声压级频谱特征点;采用单通道压缩放大,使得声音强度始终处于患者的最适域;傅立叶逆变换,获得放大后的音频。本发明产生的语音波形与原信号波形的拟合度高,保留了语音特征,能够有效提高增强语音的可懂度,提高了语音的识别率;算法实现简单,算法复杂度低。
【专利说明】基于多分辨率小波的数字助听器语音增强方法
【技术领域】
[0001]本发明属于语音信号处理【技术领域】,特别涉及基于多分辨率小波的数字助听器语音增强方法。
【背景技术】
[0002]数字助听器中涉及的核心算法包括语音增强算法,声源定位算法,回声消除算法,响度补偿算法等。近十年来,现代数字信号处理技术在数字助听器中的应用不断发展,数字助听器性能不断提升,为听障人士的听力恢复作出了很大的贡献。
[0003]在数字助听器领域中,如何使助听器在噪声环境中更好的处理语音,从而帮助助听器使用者获得更为清晰的言语信号,一直以来被所有听力学临床工作者和助听器使用者所关注。高品质的降噪能力能够提高助听器的佩戴者的言语理解能力。
[0004]虽然数字助听器在过去的十年取得了巨大的进步,但调查发现,只有30%的助听器使用者在对产品满意度调查中表示满意,许多使用者表示有不适的感觉。其中语音增强技术就是影响使用者舒适度的关键性因素之一。
[0005]语音增强算法在提高语音清晰度等方面取得了较大的成功,但在可懂度方面的研究比较少。语音可懂度对于听者尤其是听障患者的言语理解能力有十分重要的影响。(HELLGRENJ.Analysis of feedback cancellation in hearing aids with filtered-xLMS and the direct method of closed loop identification[J].IEEE Transactions onSpeech and Audio Process.2002, 10 (2):119-131.)。
[0006]目前助听器中最流行的是多通道频率补偿算法(Kwen-SiongChong, Bah-HweeGwee,Chang, J.S.A 16-Channel Low-Power Nonuniform Spaced Filter Bank Corefor Digital Hearing Aids[C].1EEE Transactions on Circuits and Systems
11: ExpressBriefs,2006,53 (9): 853-857 ),其基本思想就是把信号按照频率分成多个频带,在每个频带内根据各信号的特性单独进行响度补偿,根据每个频带带宽的划分大小,又分为等带宽(WyrschS.Subband signal processing for hearing aids [C].Proceedings of the 1999 IEEE International Symposium on Circuits andSystems, Jull999, vol.3, 29-32)和非等带宽的算法(王青云,赵力,赵立业等.一种数字助听器多通道响度补偿方法[J].电子与信息学报,2009,31(4):832-835)。但是语音频谱中的许多重要特征(如基音频率和频谱包络等)对言语的识别具有很重要的意义,多通道频率补偿算法几乎忽略了对这些特征的保护,造成语音结构变形和识别率低等问题。因此,研究可以有效地保留语音特征的单通道语音增强算法,具有很重要的意义。
[0007]多分辨率分析是建立在信号和系统的分辨率基础上的。信号具有不同的频率,系统也有各自的系统带宽,系统的分辨率与该系统中的信号频率和系统带宽密切相关。带宽宽则分辨率高;反之,分辨率低。子波变换是傅里叶变换的发展,它具有多种形式,其中小波变换就是一种多分辨率分析的子波变换方法。
【发明内容】

[0008]本发明的目的在于克服现有技术的不足,提出基于多分辨率小波的数字助听器语音增强方法。所述方法解决了传统多通道补偿算法忽略保护语音特征,造成语音结构变形和识别率低的问题,有效提高增强语音的可懂度,使得患者听起来更舒适,在提高患者听力水平的同时增强其言语辨别力。
[0009]为了解决上述技术问题,本发明采用的技术方案是:基于多分辨率小波的数字助听器语音增强方法,包括步骤如下:
[0010]步骤A,音频预处理,首先对原始音频信号进行分帧处理,分帧后计算每帧音频信号的频谱;
[0011]步骤B,小波分解与重构,利用多分辨率小波对信号声压级频谱进行小波分解,获得信号声压级频谱的离散平滑逼近和式,再重构音频信号声压级频谱,由此获得声压级频谱的平滑拟合曲线;
[0012]步骤C,提取特征点,检测出重构后的音频声压级频谱包络的各极值所在,确定为音频频谱的特征点;
[0013]步骤D,单通道压缩放大,根据病患的听力特性曲线计算各特征点的增益值;利用插值算法,获得全频带增益特性曲线;由计算得出的全频带增益特性,对原音频信号频谱进行增益补偿,使得声音强度始终处于患者的最适域;
[0014]步骤E,傅立叶逆变换,对补偿后的音频频谱进行傅立叶逆变换,最终得到符合患者听力需求的语音信号。
[0015]步骤A中,所述音频预处理,具体过程如下: [0016]步骤A-1,对原始音频信号进行分帧,取20ms为一帧,帧移为IOms ;
[0017]步骤A-2,通过快速傅立叶变换FFT计算出每帧音频信号的的频谱特性S (W),其变换公式如下:
【权利要求】
1.基于多分辨率小波的数字助听器语音增强方法,其特征在于,包括步骤如下: 步骤A,音频预处理,首先对原始音频信号进行分帧处理,分帧后计算每帧音频信号的频谱; 步骤B,小波分解与重构,利用多分辨率小波对信号声压级频谱进行小波分解,获得信号声压级频谱的离散平滑逼近和式,再重构音频信号声压级频谱,由此获得声压级频谱的平滑拟合曲线; 步骤C,提取特征点,检测出重构后的音频声压级频谱包络的各极值所在,确定为音频频谱的特征点; 步骤D,单通道压缩放大,根据病患的听力特性曲线计算各特征点的增益值;利用插值算法,获得全频带增益特性曲线;由计算得出的全频带增益特性,对原音频信号频谱进行增益补偿; 步骤E,傅立叶逆变换,对补偿后的音频频谱进行傅立叶逆变换,最终得到符合患者听力需求的语首?目号。
2.根据权利要求1所述的基于多分辨率小波的数字助听器语音增强方法,其特征在于,步骤A中,所述音频预处理,具体过程如下: 步骤A-1,对原始音频信号进行分帧,取20ms为一帧,帧移为IOms ; 步骤A-2,通过快速傅立叶变换FFT计算出每帧音频信号的的频谱特性S (w),其变换公式如下:
3.根据权利要求2所述的基于多分辨率小波的数字助听器语音增强方法,其特征在于,步骤B中,所述小波分解与重构,具体过程如下: 步骤B-1,利用Mallat算法对信号声压级频谱进行小波分解,获得信号声压级频谱的离散平滑逼近和式Si (η):
4.根据权利要求3所述的基于多分辨率小波的数字助听器语音增强方法,其特征在于,步骤D中,所述单通道压缩放大,具体过程如下: 步骤D-1,根据病患的听力特性曲线计算任意特征点的增益值,将原始音频全部映射至听力受损患者的听力范围内; 步骤D-2,利用插值算法,获得全频带增益特性曲线; 整个听力频带被m个特征点划分成m+1个频带;对任一频点W,设定其所在频带的两个端点分别为Wl、《H,所在频带的两个端点增益值分别为iLl,\,I为小于等于m的自然数; 贝U该频点的增益值G (w)为:
【文档编号】H04R25/00GK103475986SQ201310393791
【公开日】2013年12月25日 申请日期:2013年9月2日 优先权日:2013年9月2日
【发明者】曹旭来, 张玲华 申请人:南京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1