数字式助听器增益控制优化方法

文档序号:7889497阅读:246来源:国知局
专利名称:数字式助听器增益控制优化方法
技术领域
本发明属于数字信号处理方法用于数字式助听器增益的优化方法,特别针对连续实时言语声信号进行连续动态的放大处理,而同时又避免由于大量数据处理产生的时间延迟而造成的失真。本发明的方法可广泛应用于高保真型连续的实时言语数字信号处理器, 如助听器。
背景技术
数字式助听器增益控制优化方法的意义助听器的最基本功能是把原声放大即根据听力患者在不同频率的损失状况来设置可控的增益,使具有残余听力的配戴者能够听到并听清原声信号。自1996年第一款商业化数字式助听器进入市场以来,由于其强大的运算与处理功能,持续下降的尺寸与功耗,软件化的通用性开放平台与持续可控的编程特性, 目前95%以上的助听器都是数字式。数字式助听器的核心组成部分是芯片与控制其功能的嵌入式软件,各种主要性能都由数字式信号处理算法转化成嵌入式软件来实现。在所有性能中,声源输入信号的增益控制是一切其它助听器性能的基础性能。当前通用的增益控制方法为在频域内的“多通道宽动态压缩”算法,即在独立的频段内根据实时输入信号的功率大小来及时改变增益大小。据统计在人口 10%都有不同程度的听力损失,而这其中有超过80%为不可逆的感音神经性听力损失(Sensori-Neural Hearing Loss)。其特点是在不同频域内不同程度的听力动态范围缩小。听力动态范围指的是包括从可感知的最小的听阈到最大可忍受的声压级。而听力损失主要指的是患者的听阈声压级的不同程度升高即正常的小声听不到,直到正常的轻,中,甚至到大声时才到达其听阈;可当正常的很大声时,患者也会像正常人一样感知为很大声,所以患者的听力动态范围被缩小了。而控制增益的“宽动态压缩”算法就是为了能够在设置增益时能很好的补偿缩小的动态范围在正常的小声时把声音放大到患者的“小声”感知水平,而当声压级信号进一步增强时能及时改变增益使正常的“大声/很大声”让患者也感知为“大声/很大声”而不会因为过分的放大成为“太大声”。同时助听器的首要目的是让患者能够进行正常言语交流,所以助听器的增益控制也以言语声信号为首要处理目标。目前数字式助听器增益控制的算法,使用基本的对连续实时数字信号的处理方法,进行以下处理对输入的言语信号进行分析并计算出功率,然后根据计算出的功率大小计算出应使用的增益,接着把增益施加到输入信号上计算出输出信号。而对于一个数字式助听器的整体放大性能的实施,除了以上增益算法,还包括在应用算法前的以下数字信号处理器前端步骤麦克风把声信号转换成模拟电信号,模拟电信号转换成数字式电信号;到算法应用后的数字信号处理器后端步骤把输出数字式信号转换成模拟电信号,由放大器把输出模拟电信号放大并把它转换成声信号输出到助听器的扬声器上。所以整个数字式助听器的功能由3大组成部分来实现电声转换,模拟信号处理,
3数字信号处理。而助听器的功能就是在我们日常生活中这无时无处不在的声的世界中连续实时的收集声信号,然后处理,接着放大,并送到听力患者的耳膜前使之成为患者能感知的声音。这整个“收集,处理,放大”的过程需要时间,特别是这个“处理”过程取决于其复杂程度,可能需要很大的延迟才能完成所有步骤。好在我们人类对于我们周围的声的环境世界有着自己独特的感知系统与处理功能,而助听器的使用前提也是配戴者主要是他/她的最前端的声音感知器官系统部分受损,而其他听力系统,如听神经传导与中枢听力是完整正常的。在这个前提下,我们就可以假设助听器配戴者可以接受某种程度的信号处理延迟,同时能重新感知并接受放大处理过的声信号,并能提高并恢复患者的正常言语交流。那么给出延迟的界限就变得至关重要了。现代化的数字式助听器在其“处理”步骤过程中,可以进行非常多的各种算法运算。但除了 “延迟”这个制约条件外,算法复杂性也是一个制约条件,因为复杂的算法就意味高功耗。而耗电量大就需要经常换电池,这也是助听器使用中不能容忍的。所以各种已知的算法的优化,如增益控制,也至关重要。

发明内容
本发明的目的是提供一种数字式助听器增益处理的优化方法。该方法根据人类听力感知的特性来限制整个运算的最高延迟时间,同时在最大的时间延迟范围内充分优化增益控制算法,使数字式助听器的应用软件能够有效的完成大量运算而不产生可感知的失真及其它由延迟引起的影响言语识别的副作用。本发明提出的优化方法包括
1)建立延迟模型用于量化延迟,延迟模型的延迟由3大部分组成
(1)前端声/电信号转换,模拟信号数字信号转换;
(2)数字信号处理;
(3)后端数字信号模拟信号转换,电/声信号转换;
整个数字式助听器系统的延迟由时域mT来描述
y [n] = x[n] + a*x[n_m]
这其中,x(t)/y (t)为系统输入/输出声信号,n用来表示任何时刻并在采样率的时钟条件下的一个数字数据,a只是整体的用来表示信号的放大;变量m用来表示在采样率的时钟条件下有几个数字式数据的延迟;
2)确定言语声信号模型该模型中所有语音是由一个特殊的发声管所产生,并由肺部呼出气体动作过程所组成;管的一端为原始信号发生源即声波信号由肺部呼出的动作所产生为原动力,而另一端为嘴唇与鼻孔;这个特殊发声管系统包括三大组成部分
(1)声源发声动力源,主要决定发声的声压级;
(2)声带只产生声脉冲音,决定语音基本频率;
(3)声道主要发声器官,可产生多个可发共振峰
3)增益算法优化根据基本增益控制模型,对具体增益算法的步骤进行优化,增益控制算法应该在延迟时间不超过2ms、mT ( 2ms内完成;或者说对于连续的言语声信号,增益更新率可控制在2ms,这个更新率有效达到以下目的
(I)当一个大声信号突然发生时能及时改变并降低增益,以防止佩戴者产生听力不舒适;
(2)防止数字信号运算溢出;
(3)防止放大器过载3.;
4)增益步骤优化包括对处理算法复杂性、频域精度、时域延迟的优化。本发明的优点是本发明合理分配各算法步骤用以实现频谱特定放大所需的连续动态助听器增益变化控制,从而实现将由于大量运算步骤可能产生的失真降到最低。该方法充分利用人类听力言语发音和感知过程的时间特性与数字信号处理中的高效模块处理方式,并用来合理分配每个算法步骤到不同的帧,进而在完成任何一个特定助听器性能(如动态增益控制)的同时并不产生可感知的失真。该方法可在任何现代化开放式“数字式助
听器平台/芯片”上使用。


图I为本发明完整的助听器声信号处理模型。
图2为本发明无延迟传导途径延迟模型。
图3为整个助听器处理过程中的时间延迟模型。
图4为显示整个延迟过程由3大组成部分。
图5为语音信号所产生结构模型。
图6为基本增益控制模型。
图7为增益算法考虑的因素。
图8为具体增益算法的步骤。
图9为示范性输入与输出采样点之间的关系。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
如图所示,本发明包括
一、建立模型用于量化延迟
I、助听器系统模型与实用声信号延迟模型
为了合理的推导出怎样控制信号处理的合理延迟时间,本发明首先建立以下一个完整的助听器声信号处理模型(图I)
根据图I的这个模型,对于助听器配戴者而言,当一个声源信号在助x(t)听器麦克风前产生时,,从声源信号到佩戴者的最前端听力感知检测系统(空气传导检测系统)来说,它有2个主要传输途径
1)通过助听器,经过处理后,经过延迟而到达耳膜前;
2)通过助听器的泄气孔或耳道与助听器之间的空隙,无信号处理延迟而到达耳膜前; 而当这个声源信号是配戴者自己在讲话时,佩戴者的最前端听力检测系统就会有第3个传输途径(骨气传导检测系统)通过脑骨直接传给中耳的骨链声信号传递系统。这就是一个完整的单声源-3途径组成的听力前端检测系统模型。而对于从耳道/泄气孔声信号L(t)与助听器配戴者自己讲话的脑骨传输信号 B (t),它们都在同时到达耳膜前而归类为无信号处理延迟。
对于同一个声源信号x(t),当它在到达耳膜前声需要经过处理,产生延迟,然后才成为到达耳膜前的主要声信号P(t-to),其中to为延迟时间。所以在耳膜处产生的声信号y (t)为
y(t) = P (t-tO) + L(t) + B (t)
注意这里所有信号都是实时连续的声波信号,更具体的讲是被传导的声波能量信号。 但是这个模型在使用时不够方便。2、进一步简化的延迟模型
从实际应用的角度考虑,图I模型中的2个无延迟声信号传导途径可以进一步简化为一个无延迟传导途径而成为下一个模型(图2)
这个简化就把助听器佩戴者的声信号传导途径归为两路经过助听器处理有延迟而到达耳膜前,与无延迟直接到达耳膜前。即在患者听力检测系统前从一个声源会得到2个组合相加的合成信号。对于助听器配戴者来讲,从到达其耳前的声源信号x(t)到实际最终到达其耳膜处的声源信号y(t)这个模型显示出直接相关的只有两个模块
1)有声信号延迟的助听器系统;
2)无声信号延迟的直接传导系统。助听器在处理x(t)时需要以下几个主要组成部分
1)麦克风把声信号转化成电信号;
2)信号处理器分析电信号并根据听力损失做相应放大处理;
3)放大器把电信号做实际的放大;
4)扬声器把电信号转化成声信号;
这个模型给我们提供了在实际设计信号处理系统时可用的概念依据。3、实用模型
在实际助听器设计应用中,基于图2的概念模型,我们进一步得到以下模型(图3)
相对于图I和2的模型,图3给出的是整个助听器处理过程中的时间延迟模型。同时需要说明的是图I和图2中显示的系统输入/输出声信号x(t)/y(t)在图3中分别显示为 x[n]和y[n],以表示其信号为数字信号。在图3这个数字信号处理模型中,在任意一个时刻,一个声压级信号x[n]都会产生一个相应的合成输出信号y[n]。在整个数字式助听器系统中,以下模型(图4)进一步给出了主要组成部分
图4显示出整个延迟过程由3大部分组成
1)前端声/电信号转换,模拟信号数字信号转换;
2)数字信号处理;
3)后端数字信号模拟信号转换,电/声信号转换。同时图4显示出2个时钟一个是“前端”与“后端”同时使用的信号数据采样频率(Fs),一个是“数字信号处理”的数据处理频率。而整个系统的延迟时域由mT来描述 y [n] = x[n] + a*x[n_m]
这其中,“n”用来表示任何时刻并在采样率的时钟条件下的一个数字数据,“a”只是整体的用来表示信号的放大。这里关键变量是用来表示在采样率的时钟条件下有几个数字式数据的延迟。图4这个模型表示出在声信号处理过程中包括的几个步骤和几个数字处理过程中的由2个脉冲时钟所表示的时间观念。声音传播是一个波动信号形式,其基本信息表达形式由频率(Hz),强度(dB SPL),持续时间段(S) 3个变量来表示。在图4的数字式助听器模型中,采样率(Fs)设置出以下信息
1)Fs =采样点/秒
2)最高声信号频率=Fs/2
3)每个采样点之间的时间=1/Fs:基本延迟时间计算单位=T0用采样点间隔做时间单位,由图3模型中显示出总体助听器信号处理的延迟时间 =mT :在采样率单位时间内需要多少延迟时间可由多少个采样点m来决定。以目前的实际言语声信号处理的应用,采样率可控制在Fs =[8000, 16000]Hz,以Fs = 16000Hz为标准采样率,那么在Ims (I毫秒)中就有16个采样点。在图4的模型中,在采样率时钟速率之外,是数字式助听器的算法指令的执行时钟速率(数据处理频率)。在每一个数据采样率中间,助听器数字信号处理器根据软件程式都会执行多个算法指令。具体能执行多少由数据处理频率及处理器结构决定。在实际算法执行过程中,如果最高助听器信号处理可允许延迟量(延迟时间),那么所有算法指令就需在延迟时间内完成,以避免造成主要言语声信号失真,如物理声学延迟效应的预防mT = 2ms:预防声染色效应。二、言语声信号模型确定
I、基本言语发声信号模型
本发明所针对的是数字式助听器对人类言语声信号的处理,而整个有关声信号的范畴也是针对人类进行言语交流时所能发出的语音信号。图5所展示的是这种语音信号所产生结构模型,用以理解这类语音信号的特性从而对我们的信号处理系统的信号分析,处理延迟等做出合理规范。整个模型的基础概念是所有语音是由一个特殊的发声管所产生,并由肺部呼出气体动作过程所组成。管的一端为原始信号发生源即声波信号由肺部呼出的动作所产生为原动力,而另一端为嘴唇与鼻孔。这个特殊发声管系统包括三大组成部分
1)声源发声动力源,主要决定发声的声压级;
2)声带只产生声脉冲音,决定语音基本频率;
3)声道主要发声器官,可产生多个可发共振峰,并控制包括图5所示的7个生理发声系统组件。任何言语发声都由声源气体呼出后由从声带到声道的各部位的波动共振调制来形成。这个发声系统的主要信息以空气波动的方式传递,所以最为有效的表达形式是在频域。具体任何一个言语发声音素,包括元音和辅音,信息都在频域表现为几个可区别的峰值。从图5的生理结构模型,任何一个发声系统组件所能产生的共振峰频率都会受限于其生理极限,而不可能波动的非常快或非常。所以本发明所针对的言语音频信号就规范于从声带所产生的脉冲基本频率(IOOHz)到辅音发出的第3或第4共振峰(6000Hz)。即我们在助听器的实时的信号处理过程中,信号分析的能力要包括分辨100到6000Hz频域宽度。
在言语交流的发声过程中,连续的言语声信号的产生由声带和声道的各个组件的特定共振峰的连续实时改变所组成。从图5的模型中,每一个音素产生的相应共振峰的状态改变都不会太快。所谓状态改变如已在发音时改变其强度。所以此发明所规范的处理连续稳态语音时间最小的时间大于100ms。2、梳状滤波器效应
当 2ms > mT〈 IOms 时,(ref. Digital Hearing Aids, James M. Kates, 2008), 助听器处理过的声信号与未处理过的原声信号的组合信号会产生梳状滤波器效应,并在 (l/2mT)Hz及其倍频处产生信号衰减。如果一个语音的共振峰恰好在这些信号衰减处,那么这个语音信号不仅没有被放大,反而被衰减并使整个言语信号失真。3、回声效应
当 IOms ^ mT ^ 50ms,回声效应会产生(ref. Principles of Digital Audio, 4th Edition, Ken C. Pohlmann, 2000),这样也会造成言语信号失真。三、增益算法优化 I、增益更新率概念
根据以上模型步骤推导,助听器信号处理算法之一的增益控制算法应该在延迟时间不超过2ms (mT ( 2ms)完成。或者说对于连续的言语声信号,其在助听器的增益更新率可控制在2ms。这个更新率也可有效达到以下目的。当一个大声信号突然发生时能及时改变并降低增益,以防止佩戴者产生听力不舒适;防止数字信号运算溢出;防止放大器过载。2、基本增益控制模型
当助听器开始工作时它的基本功能是连续实时地把麦克风前的声信号根据佩戴者的听力损失进行放大并输送到佩戴者耳膜处。现代化数字式助听器可以把整个增益控制过程智能化并能部分模拟人耳的听力接收功能,通过实时的输入信号分析,及时更新调整增益。 而整个增益控制过程是由助听器内的嵌入式软件中的增益控制算法来实现。图6给出了一个基本增益控制流程图。图6的左列显示的是完成增益控制算法的基本程序步骤。而右列模块内容是对左列程序步骤的进一步说明。此增益控制可以在时域由滤波器的形式,或由频域的傅立叶方法,或由时域滤波器与频域傅立叶组合的法实现。但不论使用任何方法,图6左列的基本步骤都需要被执行。而此发明的目的是首先规范整个需要完成算法的时间,在此基础上来怎样优化在执行算法的具体步骤,以期在规范的时间内完成所需的算法指令。而具体选择哪一种方法来实现增盈算法,并不在此发明考虑范围。此发明会给出增益算法设计的主要考量因素,并会给出如果在频域控制增益时可使用的一种增益控制的优化方法。3、增益步骤优化
首先在设计增益算法时,要考量几个基本因素,并在这几个基本因素上进行优化。而整个算法的优化是由以下几个方面的取舍决定的
在助听器实时处理声信号的过程中,图7中这几个方面是相互制约的。这其中“数字量化误差”主要由硬件提供的算法精度与软件编码优化决定,所以不在此发明考虑之内。在余下的3个因素中,“处理算法复杂性”和“频域精度”是与“时域延
8迟”相互制约的。精确的输入讯号分析需要提高频域精度,但也会大量增加所需运算时间。 而在讯号分析的基础之上做各种近一步处理,如增益控制,降噪等,越复杂的方法就需要越多的运算,从而增加延迟时间并消耗更多现有电池的能量使其减少寿命。如前所述,图6所提供的增益算法为基本主要步骤算法,而“处理算法复杂性”由系统设计预先决定,所以也不在此发明的主要考虑范围。此发明给出在使用频域增益控制方法时对这种算法的一种优化。而关键性特征是此种算法能够在规定的2毫秒中完成所需预算。根据图6,图8描述了一种具体增益算法所需的步骤,这其中的x[n]为每次处理数据帧的输入信号采样点,而y[n]为每次处理数据帧的输出信号采样点。采样点由mT决定。当采样率Fs=16000Hz,T=O. 0000625秒或0.0625毫秒。如果以I毫秒为单位, mT=l=m*0. 0625,m=16。所以32个采样点等于2毫秒。以下图9给出数据处理过程中使用的数据单位。图9给出示范性输入与输出采样点之间的关系。这其中有如下概念
1)采样点根据采样率每次取得的数据点
2)输入采样帧与输出采样帧根据可允许的延迟时间而收集的数据点,输入与输出采用一样的点数
3)处理块在处理每一帧时所用的数据
从数据处理的并以直观的角度看,增益算法可以在得到一个数据点后马上对其处理然后接着把这个处理过的数据点输出。但这种方法一是只能在时域进行,二是其效率极低,三是没有这个必要因为声是波动信号,这种点与点之间的信号变化不能准确反映出频域声波特性。而最有效的分析判断声信号特征的方法是使用傅里叶变换,但傅里叶变换需要等到一组合适数量的输入点之后才能进行,所以我们要使用‘帧’来进行输入与输出。而增益的变化也是以‘帧’为单位的。即为了得到最佳频域分析处理效果我们使用一组采样数据点 (帧);至于每帧的点数可由我们前边所述的合理延迟时间来决定。图8给出的就是这种以傅里叶变换为基础的增益算法。另外图8给出的算法步骤在实际助听器执行过程中我们可以按照这个程序一步一步对每一个输入巾贞来处理完成,然后接着把这一巾贞输出。但这种方法效率低且没有必要, 因为我们知道增益变化率不需很高,所以只要在增益变化率可允许的延迟范围内完成增益处理,我们进一步优化增益算法。从图9看出,在每次当前帧的所有数据点被输入的同时,也有同样数据点数被输出。换句话说,在当前帧被输入的同时,上一被处理过的帧也同时被输出。即在当前帧的输出是由上一帧的输入帧所产生的增益对当前帧的输入实施所产生的。图8中所描述的算法是基于每次增益更新时所需要完成的步骤。从前所述,增益更新率应限制在2毫秒内。那么在优化图8的增益算法时,可进一步把其分成3个大的步骤
1)听力频域输入能量估算;
2)听力频域通道增益法则计算;
3)增益对输入信号的实施。
无论是哪一种基于帧的算法,都可以帧中的点数按照增益变换率可以允许的延迟时间内把最高点数分成两帧来使用。这样当前帧中所算出的增益可被用到下一帧的输入而不影响有效的增益变换率。即上边所述的第三步骤被使用在当前的输出帧,而第一和二步骤被使用在当前的输入帧上。在算法中,对于输入信号的处理中所使用的傅里叶变换是标准的数字信号处理方法,其结果是得到线性等分的频域数据。但这种等分的频域分析处理结果不能恰当的反映出人类听力对频域分析使用的特征,所以图8中的傅里叶变换所产生的线性频域数据是需要被变换到适当的“听力通道”频域内的。每个“听力通道”的频域宽度是由我们人类内耳耳蜗的频域分析特性(critical band)所推导引申出来的。这些步骤的结果是我们整个输入信号分析,能量估计,增益运算,及增益实施都是以频域内“线性”与“听力通道”变换为基础的。
权利要求
1.一种数字式助听器增益控制优化方法,其特征在于该方法包括I)建立延迟模型用于量化延迟,延迟模型的延迟由3大部分组成(1)前端声/电信号转换,模拟信号数字信号转换;(2)数字信号处理;(3)后端数字信号模拟信号转换,电/声信号转换;整个数字式助听器系统的延迟由时域mT来描述y[η] = X[η] + a*x[n_m]这其中,x(t)/y (t)为系统输入/输出声信号,η用来表示任何时刻并在采样率的时钟条件下的一个数字数据,a只是整体的用来表示信号的放大;变量m用来表示在采样率的时钟条件下有几个数字式数据的延迟;2)确定言语声信号模型该模型中所有语音是由一个特殊的发声管所产生,并由肺部呼出气体动作过程所组成;管的一端为原始信号发生源即声波信号由肺部呼出的动作所产生为原动力,而另一端为嘴唇与鼻孔;这个特殊发声管系统包括三大组成部分(1)声源发声动力源,主要决定发声的声压级;(2)声带只产生声脉冲音,决定语音基本频率;(3)声道主要发声器官,可产生多个可发共振峰;根据该模型,在实时信号处理过程中,信号分析能力包括分辨100到6000Hz频域宽度; 处理连续稳态语音时间最小的时间大于IOOms ;3)增益算法优化根据基本增益控制模型,对具体增益算法的步骤进行优化,增益控制算法应该在延迟时间不超过2ms、mT ( 2ms内完成;或者说对于连续的言语声信号,增益更新率可控制在2ms,这个更新率有效达到以下目的(O当一个大声信号突然发生时能及时改变并降低增益,以防止佩戴者产生听力不舒适;(2)防止数字信号运算溢出;(3)防止放大器过载;4)增益步骤优化包括对处理算法复杂性、频域精度、时域延迟的优化。
2.根据权利要求I所述的数字式助听器增益控制优化方法,其特征在于所述的基本增益控制模型包括输入信号的点采样、采样帧输入分析、增益估算、增益评估与校正、把增益实施到输入信号和输出点米样。
全文摘要
本发明提出一种在实时连续信号处理条件下数字式助听器增益控制优化方法。该方法提出关于言语信号增益处理最大运算延迟可于量,并合理分配各算法步骤用以实现频谱特定放大所需的连续动态助听器增益变化控制,从而实现将由于大量运算步骤可能产生的失真降到最低。该方法充分利用人类听力言语发音和感知过程的时间特性与数字信号处理中的高效模块处理方式,并用来合理分配每个算法步骤到不同的帧,进而在完成任何一个特定助听器性能(如动态增益控制)的同时并不产生可感知的失真。该方法可在任何现代化开放式“数字式助听器平台/芯片”上使用。同时这种方法可作为基本原则来指导进一步实现其它各种助听器辅助性能,如单/双麦克风降噪,啸叫反馈抑制等。
文档编号H04R25/00GK102595297SQ20121003365
公开日2012年7月18日 申请日期2012年2月15日 优先权日2012年2月15日
发明者张朝英, 王树峰 申请人:嘉兴益尔电子科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1