助听器和提高语言清晰度的方法

文档序号:2820316阅读:857来源:国知局
专利名称:助听器和提高语言清晰度的方法
技术领域
本发明涉及一种助听器和一种提高语言清晰度(speechintelligibility)的方法。本发明还涉及使助听器适应于特定声音环境。更具体地说,本发明涉及一种助听器,其具有在噪声环境下实时提高语言清晰度的装置。另外,本发明涉及一种借助于在助听器中根据实时测定语言清晰度和响度来调节频带增益、从而提高听觉舒适感的方法。
背景技术
一个现代的助听器包括一个和多个话筒、一个信号处理器、控制该信号处理器的某种装置、一个扬声器或电话机,而且在配置了感应线圈系统的场合可能还有一个感应线圈(telecoil)。上述控制信号处理器的装置可能包括用于在不同助听程序之间进行变换的装置,例如,在安静的声音环境下应用第一程序,在噪声较大的声音环境下应用第二程序,在使用感应线圈的时候应用第三程序,等等。
在使用之前,助听器必须被调节以适于各个使用者。调节过程基本包括根据特定的场合,例如使用者听力损失的程度和选择的特定的助听器,来调整声级相关的(level dependent)传递函数或者频率响应,以便最好地补偿使用者的听力损失。选定的调控传递函数的参数设定值存储在助听器内。以后举例来说考虑到听力损失程度的改变,设定值可以通过重复上述调节过程而改变。对于具有多种助听程序的助听器,可以对每种程序完成一个适配步骤,选择专用设定值,以便将特定的声音环境纳入考虑范围。
根据技术条件,助听器以多个频带来处理声音,以便于根据在相应频带中的某些预定的输入/增益曲线,而确定增益级。
输入处理还可以包括某种压缩信号的装置,以便控制助听器输出的动态范围。可以认为,这种压缩是为了改善助听器使用者的听觉舒适感,而对增益级所作的自动调节。压缩可以按照国际专利申请WO 9934642 A1所描述的方式实施。
先进的助听器可以进一步包括防反馈例程用来持续地测量各相应频带中的输入级和输出级,以便在必要的时候通过降低相应频带的增益设定值而持续地控制声反馈(acoustic feedback)啸叫。
然而,在所有这些“预先确定”的增益调节技术中,增益级都是根据函数改变的,而这些函数在助听器的编程/调节期间都已经被预先确定,为的是反映通常情况下的要求。
过去,有不同学者提出了模型,用于预测经过线性系统传输之后的语言的清晰度。这些模型中最为有名的是“清晰度指数(articulationindex)”即AI、语言清晰度指数(speech intelligibility index)即SII、和“语言传输指数(speech transmission index)”即STI,不过还有其他指数。
在贝尔实验室(H.Fletcher和R.H.Galt“语音的理解及其与电话的关系(The perception of speech and its relation to telephony)”J.Acoust.Soc.Am.22,89-151(1950)),语言清晰度的测定值已被用来评价电话线的语音信号的质量。当规划和设计音乐厅、教堂、礼堂和广播(publicaddress,PA)系统时,语言清晰度同样是一个重要的课题。
ANSI S3.5-1969标准(1997年修改)提供了用于计算语言清晰度指数SII的方法。SII使人们能够预测经过传输的语音信息中的清晰成分的量,并由此而预测一个线性传输系统中的语言清晰度。SII是系统传递函数的一个函数,亦即是在系统输出端的语音频谱(speechspectrum)的间接函数。另外,还可以将掩蔽噪声(masking noise)和助听器使用者的听力损失这两者的影响纳入到SII考虑范围内。
根据这个ANSI标准,SII包括一个衡量相关频带的频率,这是因为语音频谱中不同的频率对SII的重要性也不同。而SII是作为多个单一频带的数值之和而计算得出的,所以就表示整个语音频谱的清晰度。
SII经常是一个介于0(语音完全不清晰)和1(语音完全清晰)之间的数。实际上,SII是系统传输单个音素(phoneme)的能力的客观衡量值,且因此而也有希望成为听者理解所说内容的能力的客观衡量值。SII并不将语言、方言或者说话者缺乏演讲天赋考虑在内。
在“由调制传递函数预测室内语言清晰度(Predicting SpeechIntelligibility in Rooms from the Modulation Transfer Function)”(Acoustica Vol 46,1980)一文中,T.Houtgast、H.J.M.Steeneken和R.Plomp提出了一种用于预测室内语言清晰度的技术方案。该方案以调制传递函数(Modulation Transfer Function(MTF))为基础,该函数将室内混响效应、环境的噪声等级和谈话者的声音输出连同其他因素一道考虑在内。MTF可以被转换成一种单一的指数,即语言传输指数(Speech Transmission Index)或称STI。
在The Hearing Journal,April 1999,Vol.52,No.4中,“NAL-NL1一种用于调节非线性助听器的新技术(A new procedure for fittingnon-linear hearing aids)”一文描述了一种调节规则,该规则被选择用来使语言清晰度最大化,同时将整体响度保持在不大于正常听力的人听相同声音所感受到的水平上。其中考虑了一些听力图和一些语音等级(speech level)。
虽然助听器的现代调节方案也将语言清晰度考虑在内,但一个特定的助听器的最终调节方案通常是折衷方案,其基于以理论或者经验方式推导出的固定的估算值。语言清晰度的目前优选的衡量指标是语言清晰度指数或称SII,因为这种方法定义明确而标准化,并且可以给出良好一致的结果。因此,参照ANSI S3.5-1997标准,在下文中这种方法将是唯一考虑的方法。
计算语言清晰度指数的很多应用实例仅使用了一种静态指数值,甚至于推导出该静态指数值的条件可能与将要运用该语言清晰度指数的场合的条件不同。这些条件可能包括混响、消声、现场噪声等级或频谱密度的变化、整个语言传输路径(包括说话者、听者所在房间、听者、及某种电子传输装置)的传递函数的改变、失真、及房间湿度。
另外,助听器内增益的增加通常会导致放大后声音的响度增大,而响度的增大在某些场合会导致令人不快的高声级,进而导致助听器使用者的响度不适。
助听器输出的响度可以根据响度模型来算出,这例如借助于由B.C.J.Moore和B.R.Glasberg发表的论文“Zwicker响度模型的修正(Arevision of Zwicker’s loudness model)”(Acta Acustica Vol.82(1996)335-345)中所描述的方法,该论文提出了一种模型来计算听力正常和听力受损的对象中的响度。该模型是针对稳态声音(steady state sounds)设计的,但该模型的扩展也能够计算较短的瞬态类的声音的响度。请参照关于等响曲线(equal loudness contour)的ISO标准226(ISO 1987)。
通过利用上述这些已知方法中的任何一种,都可以针对助听器的任何特定声音环境和设定值计算出语言清晰度的量值。对应于由助听器所放大的语言和噪声的语言清晰度,其不同的估算值将取决于在听力损失的不同频带中的增益等级。然而,对语言清晰度和/或响度的持续优化,要求对声音环境的持续分析,并因此而涉及大量的的运算,这超出了对助听器内的处理器来说被认为是可行的范围。

发明内容
本发明人意识到这样一个事实可以设计一种增益设定值的专用的、自动的调节方案,该调节方案可以提高助听器在使用时的语言清晰度,且其适于在低功率处理器如助听器内的处理器中实现。
上述这种调节方案要求这样的性能根据现场的声音条件,在不同的频带中独立地增高或降低增益。举例来说,为了提高语言清晰度,对于高噪声级的频带,降低增益可能是有利的,而对于低噪声级的频带,增高增益可能是有利的。然而,这样一种简单的策略通常并不总是最理想的技术方案,这是因为SII也将频带间的相互作用例如相互掩蔽考虑在内。因此,SII的精确计算非常必要。
本发明的目的是,提供一种用以在不同声音环境下提高助听器中的语言清晰度的方法和装置。在实现上述目的同时,本发明的另一个目的是防止助听器产生响度不适感。
本发明的又一个目的是,提供一种用以提高助听器中的语言清晰度的方法和装置,该方法和装置可以在低功耗下实施。
根据本发明,以上目的是通过一种在助听器中处理信号的方法实现的,该助听器具有话筒、处理器和输出换能器,上述方法包括获取声音环境的一个或多个估算值,根据该声音环境的估算值并根据助听器的处理器的传递函数来确定语言清晰度的估算值,以及调节上述传递函数从而提高在该声音环境下的语言清晰度的估算值。
语言清晰度的估算值的提高意味着助听器声音输出中的语言清晰度的提高。上述方法根据本发明实现了处理器传递函数的调节,适合于在特定的声音环境下优化语言清晰度。
声音环境估算值可以按照需要经常性地更新,即间歇性地、周期性地或持续地更新,视诸如数据处理和声音环境变化等需求上的考虑而定。对于数字助听器的情况,处理器将以优选小于3毫秒的短延迟来处理声响信号(acoustic signal),从而不会让使用者觉察到直接听到的声响信号和被助听器处理过的信号之间的延迟,因为这是恼人的而且破坏了声觉上的连贯。传递函数的更新可以按远为更低的速度进行而不令使用者不适,因为更新引起的变化通常不会被注意到。甚至对于快速变化的环境,以例如50毫秒间隔进行的更新通常已经足够。在稳定的声音环境下,更新可以更为缓慢,例如,在要求时才更新。
用于获得声音环境估算值和用于确定语言清晰度的装置可以被集成到助听器处理器中,或者它们也可以全部或者部分地以外部处理装置的方式来实现,该外部处理装置适于通过合适的连接而与助听器处理器交换数据。
假定实时计算语言清晰度指数SII是可能的,那么很多上述问题可以这样克服以某种方式,例如通过在声音传输链上某个方便的位置、优选是在电子处理装置内,重复地改变传递函数,利用上述这些计算的结果,来补偿受损的语言清晰度。
如果进一步假定,以前仅仅在线性系统内才考虑的SII,可以在非线性系统中以可接受的精确度被计算和使用,则SII的应用范围将会相当显著地得到扩展。因而举例来说,SII可以被应用到具有某种非线性传递函数的系统中,例如应用到利用了某种压缩形式的声音信号的助听器中——如果该助听器具有通常使系统更加线性化的长压缩时间常数的话。
为了计算实时SII,在计算时语音级(speech level)和噪声级(noiselevel)的估算值必须是已知的,因为需要这些值用于计算。这些级值的估算值可以通过不同的方式,例如通过使用百分位(percentile)估算器,而以相当的精确度来获得。假定对于给定的一个语音级和一个给定的噪声级,总会存在一个最大的SII。则如果放大增益改变的话,该SII也会改变。
因为以解析方式计算SII和放大增益中一给定变化之间的关系是不可行的,因此需要某种数值优化例程来确定这一关系,以便求得给出最大SII值的特定的放大增益值。在本说明书的具体实施方式
部分会解释一个合适的优化例程的实施。
根据本发明的一个实施例,所述方法还包括作为一个增益向量来确定传递函数,上述增益向量代表助听器处理器内多个特定频带的增益值,该增益向量被选择用来提高语言清晰度。这样就简化了数据处理。
根据本发明的一个实施例,所述方法还包括通过这样的方式来确定增益向量确定适合用于提高语言清晰度的第一部分频带和增益值,并且通过相对于第一部分频带而在增益值之间插值,来确定第二部分频带的各个增益值。这样通过减少频带的数目,便简化了数据处理,其中需要执行更复杂的优化算法。第一部分频带将被选择用来大致覆盖整个频谱,而第二部分频带插在第一部分频带之间,为的是插值可以提供良好结果。
根据本发明的另一实施例,所述方法进一步包括将语言清晰度的估算值传送到一个外部调节系统上,该外部调节系统连接到助听器上。这样,举例来说,就可以在评价助听器的性能和调节值、特定声音环境的详情、或者特定使用者听觉的详情时,给使用者或听力学家(audiologist)提供一条有用的信息。适于和助听器之间进行通信、包括编程装置的外部调节系统描述于WO9008448和WO9422276中。其他合适的调节系统是工业标准系统,例如由助听装置制造商软件协会(Hearing Instrument Manufacturers’Softwre Association,HIMSA)规定的HiPRO或NOAH。
根据本发明的再一个实施例,所述方法还包括由增益向量计算输出信号的响度并将其与一响度极限值比较,其中所述响度极限值代表相对于一定响度的比值,该响度是相对于听力正常者的未经放大的声音响度;并且随后将增益向量调节到合适程度,而不超出响度极限值。这样便通过确保助听器输出信号的响度处于舒适范围之内,提高了使用者的舒适度。
根据本发明的另一个实施例,所述方法进一步包括借助于使增益向量乘以一个比例因子来调节增益向量,通过这种方式,响度就会低于或等于相应的响度极限值。这样就提供了一种简单的响度控制方案。
根据本发明的一个实施例,所述方法还包括以这种方式来调节增益向量中的每一个增益值使得每一个增益值都低于或等于响度向量里对应的响度极限值。
根据本发明的另一个实施例,所述方法进一步包括确定声音环境的语音级估算值、和噪声级估算值。通过对声音信号按时间进行统计分析可以得到这些估算值。一种方法包括通过级值分析来识别语音所处的时帧;在这些时帧内使声级平均,从而产生语音级估算值;并且在剩余的时帧内使声级平均,从而产生噪声级估算值。
从第二方面看,本发明提供了一种助听器,其包括用于计算语言清晰度的装置,上述语言清晰度是作为若干语音级中的至少一个、若干噪声级中的至少一个、和若干单个频带对应的一个听力损失向量的函数来计算的。
上述听力损失向量包括一组值,其代表取自不同频带的听力损失的测量值。根据本发明的这个方面,助听器提供了一条信息,该信息可以被用于助听器中的自适应信号处理,以便提高语言清晰度,或者举例来说,该信息可以通过视觉装置或听觉装置而被提供给使用者或调节者。
根据本发明的一个实施例,所述助听器包括通过对助听器中的若干单个频带的若干增益级施加合适的调节来提高语言清晰度的装置。
根据本发明的另一个实施例,所述助听器进一步包括将助听器中单个频带调节后的增益级所对应的响度与对应的响度极限值加以比较的装置,所述响度极限值代表相对未经放大的声音响度的一个比值;以及用来按适当程度调节各相应增益值而使其不至超过响度极限值的装置。
从第三个方面看,本发明提供了一种针对声音环境来调节助听器的方法,包括根据一般调节规则,选择一个初始助听器传递函数;获取声音环境的一个估算值;根据上述声音环境的估算值和初始传递函数,确定语言清晰度的一个估算值;以及调节初始的传递函数,从而提供一个经过修改的适于提高语言清晰度的估算值的传递函数。
通过这种方法,助听器就会适合于特定的环境,上述方法允许在该环境下进行旨在获得较好语言清晰度的调节。


现在将参考附图来更详细地描述本发明,附图中图1所示为一种助听器的示意性方框图,该助听器具有根据本发明的语音优化装置;图2是一种优选的优化算法的流程图,该算法运用了“最陡梯度(steepest gradient)”算法的一种变型;图3是利用语言清晰度指数(SII)方法计算语言清晰度的流程图;图4是一个曲线图,示出在图2的迭代算法的各个步骤中的不同的增益值;而图5是一种编程装置的示意图,该装置与根据本发明的助听器进行通信。
具体实施例方式
图1中的助听器22包括话筒1,其连接到区段分解(block splitting)装置2上,该分解装置进一步连接到滤波单元3。区段分解装置2可以应用一个寻常的、时间的、可选择是加权的窗口函数,而且滤波单元3可以优选包括一组预定的低通、带通和高通滤波器来限定助听器22的不同频带。
出自滤波单元3的总输出被馈送到乘法点10,而出自滤波单元3内的单独频带1,2,…M的输出则被馈送到语音和噪声估算器4的相应输入端。来自单个滤波频带的多个输出在图1中用单独一根粗体的信号线来表示。语音级和噪声级的估算器可以按照一种百分位估算器来实施,如同国际申请WO 98 27787 A1所描述的那样。
乘法点10的输出被进一步通过区段重叠(block overlap)装置11连接到扬声器12。通过载送两个不同的信号部分即S(信号)和N(噪声)的两个多频带信号路径,语音和噪声估算器4被连接到响度模型装置7,上述两个信号部分也被馈送到语音优化单元8。响度模型装置7的输出被进一步连接到语音优化单元8的输出。
响度模型装置7以一个现有的响度模型来利用S和N信号部分以便确保来自语音优化单元8的随后得到计算的增益值不会使助听器22的输出信号的响度超出预定响度L0,该预定响度为相对于听力正常对象的未经放大的声音响度。
听力损失模型装置6可以有利地表示为已经储存在正在工作的助听器22内的听力损失补偿曲线,其适于特定的使用者,而不必再考虑语言清晰度。
语音和噪声估算器4被进一步连接到自动增益控制(AGC)装置5的输入,该装置又连接到加法点9的一个输入端,而将初始增益值g0馈送给它。AGC装置5优选作为一种多频带压缩器来实施,例如像WO 99 36462所描述的那种。
语音优化单元8包括以迭代方式计算一组新的优化增益值变化的装置,其利用了图2流程图所描述的算法。语音优化单元8的输出ΔG被馈送到加法点9的其中一个输入端。加法点9的输出g′被馈送到乘法点10的输入端并被馈送给语音优化单元8。加法点9、响度模型装置7和语音优化单元8组成了根据本发明的助听器的优化部分。语音优化单元8也包含一个响度模型。
在图1所示的助听器22中,语音信号和噪声信号是由话筒1采集的,并被区段分解装置2分解成多个时间区段或帧。每一个时间区段或帧优选长度大约为50ms,是分别受到处理的。这样,每个区段都被滤波单元3分为多个单独的频带。
上述分频的信号区段随后被分解到两条分开的信号路径内,其中一条路径通到语音和噪声估算器4,而另一条则通到乘法点10。语音和噪声估算器4产生两个单独的向量,即“假定噪声”N和“假定语音”S。这些向量被响度模型装置6和语音优化单元8用来在“假定噪声级”和“假定语音级”之间做出区分。
语音和噪声估算器4可以作为百分位估算器来实施。根据定义,百分位是这样的数值对它来说,累积分布(cumulative distribution)就是等于或低于该百分位。来自百分位估算器的输出值各自对应于一个级值的估算,低于该级值的信号级占据一定百分比的时间,该信号级是在该段时间内估算的。上述向量优选分别对应于百分位10%(噪声N)和百分位90%(语音S),但也可以使用其他百分位数值。
实际上,这就意味着噪声级向量N包括若干信号级,低于这些信号级的频带的信号级占据10%的时间,而语音级向量是这样的信号级低于该信号级的频带的信号级占据90%的时间。另外,语音和噪声估算器4给自动增益控制(AGC)装置5提供控制信号用于不同频带的增益调节。语音和噪声估算器4对每个区段的噪声频带级和语音频带级都实现了高效的估算。
来自AGC装置5的增益值g0随后在加法点9与增益变化ΔG相加,并作为增益向量g′而被提供给乘法点10和提供给语音优化单元8。来自语音和噪声估算器4的语音信号向量S和噪声信号向量N被提供至语音优化单元8的语音输入端和噪声输入端,以及响度模型装置7的相应输入端。
响度模型装置7包含响度模型,其计算输入信号相对于正常听力听者L0的响度。来自听力损失模型装置6的听力损失模型向量H被提供至语音优化单元8的输入端。
在优化语言清晰度之后,语音优化单元8优选利用图2所示的迭代算法,而将一个新的增益变化ΔG提供到加法点9的输入,并将一个改变的增益值g’提供给乘法点10。加法点9使输出向量ΔG与输入向量g0相加,从而对乘法点10和语音优化单元8的输入形成一个新的、经过修改的向量g’。乘法点10使增益向量g’乘以来自滤波单元3的信号,并将所得到的增益调节信号提供至区段重叠装置11的输入端。
区段重叠装置可以具有频带交错功能和再生功能,以再生出适于复制的优化信号。区段重叠装置11形成最终的、语音优化的信号区段并将其通过合适的输出装置(未示出)提供给扬声器或助听器电话12。
图2是一种优选的语音优化算法的流程图,该算法包括开始点程序块100,其连接到下一个程序块101,在此设定初始的频带数M=1。在接下来的步骤102中,设定初始的增益值g0。在步骤103,将一个新的增益值g定义为g0加一个增益值增量ΔG,接着在步骤104计算建议的语言清晰度值SI。在步骤104之后,在步骤105将语言清晰度值SI与一初始值SI0进行比较。
如果新的SI值大于初始值S0,例程继续到步骤109,在此步骤中计算响度L。在步骤110中将这一新响度L与响度L0比较。如果响度L大于响度L0,便在步骤111中将新增益值g0设定为g0减去增益值增量ΔG。否则,例程继续进行到步骤106,在此步骤将新增益值g设为g0加增益值增量ΔG。此后例程继续进行到步骤113,通过检查频带数M来确定是否已达到最大频带数Mmax。
然而,如果在步骤104计算出的新SI值小于初始值SI0,则在步骤107将新增益值g0设为g0减去增益值增量ΔG。在步骤108再次为新增益值g而计算出建议的语言清晰度值SI。
在步骤112,建议的语言清晰度值SI再次与初始值SI0比较。如果新值SI大于初始值SI0,例程继续进行到步骤111,在此步骤将新增益值g0定义为g0减去ΔG。
如果无论给增益值加上ΔG或给增益值减去ΔG都不会引起SI增加,便将初始值g0保留给频带M。例程继续进行到步骤113,通过检查频带数M来确定是否已经达到最大频带数Mmax。如果没有达到,例程经由步骤115继续进行,为了优化而使此频带数递增。否则的话,例程继续进行到步骤114,通过将新向量SI与原有的向量SI0加以比较来确定两者之差是否小于一个容差值ε。
如果在步骤102或步骤108算出的每个频带SI的M个值中,每一个都实质上不同于SI0,即,各向量之差大于容差值ε,则例程继续进行到步骤117,在此步骤将循环次数k与一个最大循环次数kmax加以比较。
如果k小于kmax,例程继续进行到步骤116,通过将当前的增益值增量乘以一个因子1/d来定义一个新的增益值增量ΔG,其中d是一个比1大的正数,而且使循环次数k递增。例程此后在步骤101,通过从第一个频带M=1开始,再次迭代计算所有的Mmax个频带,而继续进行。如果k大于kmax,在步骤118,新的各个增益值将被转换成信号处理器的传递函数,并在步骤119结束优化例程。如果(步骤114)SI在任一频带的增加都不大于ε,情况仍然是这样。因此便不再有进一步优化的必要,在步骤118,所得到的语音优化的增益值向量被转换成信号处理器的传递函数,优化例程在步骤119结束。
实质上,所示算法迭代遍历Mmax维向量空间的Mmax个频带增益值,相对于最大SI值,优化了每个频带的增益值。在本例子中,变量ε和d的实用值为ε=0.005和d=2。最大频带数Mmax可设为12或15个频带。对于ΔG而言,一个方便的起始点为10dB。模拟试验显示该算法通常会在四到六次迭代以后收敛,即达到这样一个计算点在该处终止的原有向量SI0与新向量SI之差变得可以忽略,因此随后的迭代步骤可以终止。因此,从处理要求和迭代速度角度考虑,这一算法是非常有效的。
图3的流程图说明图2中的算法所需的SII值是如何获得的。根据图3的SI算法执行图2所示步骤104和步骤108中的每一个步骤,且其假定语音清晰度指数SII被选作语言清晰度SI的测量值。SI算法开始于步骤301,并且在步骤302和步骤303,SI算法确定频带数Mmax、每个频带的频率f0m、等效语音频谱级S、每个频带的内部噪声级N和阈值T。
为了利用SII的计算,在任何计算开始之间,必须确定单个频带的总数,这是因为计算几个相关参数的算法取决于这些频带的数目和带宽。
在步骤304,等效语音频谱级S是这样计算的(1)--S=Eb(f)-10log(Δ(f)Δ0(f)),]]>其中Eb是在带通滤波器的输出端处的语音信号的声压级(SPL),该带通滤波器具有中心频率f,Δ(f)是该带通滤波器的带宽,而Δ0(f)是1Hz的参考带宽。参考内部噪声频谱(reference internal noise spectrum)Ni是在步骤305获得的,且其被用来计算等效内部噪声频谱N′i,以及随后计算等效掩蔽频谱级Zi。后者可以表示为(2)---Zi=10log(100.1N′i+Σki-1100.1[Bk+3.32Cklog(Fihk)]),]]>其中是N′i等效内部噪声频谱级,Bk是N′i和自身语音掩蔽频谱级(self-speech masking spectrum level)Vi之中较大的值,Vi表示如下(3)Vi=S-24,Fi是临界带中心频率,而hk是临界带k的上限频带极限值。掩蔽分布的每倍频程的斜率Ci被表示为(4)Ci=-80+0.6[Bi+10log(hi-li)],其中li是临界带i的下限频带极限值。
在步骤306按下式计算等效内部噪声频谱级X′i(5)X′i=Xi+T′i,其中Xi等于噪声级N,而Ti是所处理的频带的听阈(hearingthreshold)。
在步骤307,将等效掩蔽频谱级Zi与等效内部噪声频谱级N′i比较,并且如果等效掩蔽频谱级Zi是最大的,便在步骤308令等效干扰频谱级(equivalent disturbance spectrum level)Di等于等效掩蔽频谱级Zi,而否则的话,便在步骤309令其等于等效内部噪声频谱级N′I。
正常语声效果下的标准语音频谱级Ui是在步骤310获得的,并且按下式借助于该参考值计算出级值失真系数(level distortion factor)Li(6)---Li=1-(S-Ui-10)160]]>在步骤312,按下式计算出频带清晰度(band audibility)Ai(7)---Ai=Li·[(S-Di+15)30],]]>而最后在步骤313,按下式计算出整体的语言清晰度指数SII(8)---SII=Σi=1nIi·Ai,]]>其中Ii是频带价值函数(band importance function),用来衡量相关语音频率的清晰度,而语言清晰度指数是对每个频带的值求和的结果。所述算法在步骤314结束,在该步骤计算出的SII值被返回给进行调用的算法(未示出)。
SII代表了一个系统精确地连贯地复制语音中各音素的能力的度量值,从而也传达了通过该系统所传送的语言中的信息。
图4所示为根据本发明的SII优化算法中的6次迭代。在图4的图示中,每一步都用若干中空的圆圈显示出对应于15个频带的最优SII的最终增益值43,并且SII优化算法调节一个给定的传递函数42,从而达到最优增益值43的增益,传递函数42在图4中是用连线来表示的。在所有频带中的迭代都从0dB的额外增益开始,然后在迭代步骤I中,所有的增益值都作步长±ΔG的变化,接着在步骤II、III、IV、V和VI继续通过迭代增益值42,而将增益值42调节到最优SII值43。
在计算之前,最优增益值43对于所示算法并不是已知的,但如图4中的单个迭代步骤I到VI所示,仅仅在六次迭代之后,示例中的增益值就收敛。
图5是一个示意图,表示一种助听器22,包括话筒1、换能器或扬声器12和信号处理器53,处理器53通过合适的通信链路电缆55连接到助听器调节盒56,该调节盒包括显示装置57和操作面板58,助听器51和调节盒56之间的通信可以通过利用标准的助听器工业的通信协议以及本领域技术人员所能利用的信令级别来实施。该助听器调节盒包括编程装置,其适于接收操作者的输入,如有关使用者听力损失的数据,还适于从助听器读取数据、显示各种信息,以及通过将合适的编程参数写入助听器内的存储器来给助听器编程。本领域技术人员可以建议采用不同类型的编程装置。例如,某些编程装置适于通过无线链路与合理配置的助听器进行通信。关于合适的编程装置的更多细节可以在WO 9008448和WO 9422276里找到。
通过利用本发明的方法,助听器22中的信号处理器53的传递函数适于提高语言清晰度,并且本发明进一步包括一种装置,该装置通过链路电缆55而将得到的SII值传送到调节盒56,以便由显示装置57来显示。
通过经由链路电缆55向助听器处理器53传送合适的控制信号,调节盒56能够将从助听器22读出的SII值显示在显示装置57上。这些控制信号指示助听器处理器53经由同一个链路电缆55将算出的SII值传送到调节盒56。
对调节者和助听器使用者来说,这样读出的特定声音环境下的SII值会是非常有用的,因为SII值给出了助听器使用者所感受到的语言清晰度的一个客观指示,并且因此而可以对助听器处理器的操作进行合适的调整。通过对于是否较差的语言清晰度是因为助听器没有调节好或是出于某种其他原因而提供线索,对调节者来说,SII的读出值也是有用的。
在大多数情况下,作为声音传输系统的传递函数的一个函数,SII具有相对好的、平滑的形状,没有陡谷和尖峰。假定这是通常的情况,就可以应用优化例程的变型,即所谓最陡梯度算法。
如果语音频谱被分解成若干不同的频带,例如通过使用一组合适的带通滤波器,则各频带便可以彼此独立地受到处理,并且可以调节每个频带的放大增益,从而最大化特定频带的SII。这样就可以根据ANSI标准,将不同语音频谱频带的不同的重要性考虑在内。
在另一个实施例中,所述调节盒包括数据处理装置,用于接收来自助听器的信号输入;根据声音输入信号,来提供声音环境的估算值;根据声音环境估算值并根据助听器的传递函数,来确定语言清晰度的估算值;调节传递函数,以便提高语言清晰度的估算值;并且将有关调节后的传递函数的数据传送到助听器,以便改变助听器程序。
下面将描述用于迭代计算最优SII的一般原理。给定一个具有已知传递函数的声音传输系统,可以在该传递函数中为每个频带I设定初始值gi(k),其中k是迭代优化的步数。
选择初始增益值增量ΔGi,并且对每个频带用±ΔGi量来改变增益值gi。然后确定SII得到的变化,如果通过上述操作被处理频带的SII增加,频带i的增益值gi也会相应改变。所有的频带都被这样独立地处理。然后,通过将初始值乘以一个因子1/d来减小增益值增量ΔGi,其中d是一个大于1的正数。如果某个特定频带中的增益值的改变再也不能导致那个频带的SII有任何显著的增加,或者是如果已经执行了k次迭代而SII没有任何增加,则例程就使那个特定频带的增益值gi保持不变。
上述迭代优化例程可以表示如下(9)---gi(k+1)=gi(k)+sign(|∂SII(g→)∂gi|)·ΔGi(k),∀i]]>因此,相对于标准的最陡梯度优化算法,仅用梯度的正负号就可以确定gi的变化。增益值增量ΔGi可以按下式表示的来预定(10)ΔGS,D(k)=max(1,round(S·e-D·(k-1))),k=1,2,3…而不是由梯度来确定。这样就节省了计算时间。
这种步长大小规则和最合适参数S和D的选择是开发以低计算载荷快速收敛的迭代搜索程序的结果。
可能用于判断迭代程序的收敛的标准是(11)SIImax(k)≥SIImax(k-1),(12)|SIImax(K)-SIImax(k-2)|<ε和,(13)k≤5;kmax。
因此,通过在两个相邻增益向量之间交替地逼近值SIImax来确定的SII,必须比一个固定的最小值更接近于SIImax,而且在达到kmax后,迭代停止,即使并没有得到最优的SII值。
这仅仅是一个例子。本发明包括很多其他实施方式,使得语言清晰度可以实时提高。
权利要求
1.一种处理助听器中信号的方法,该助听器具有一话筒、一处理器和一输出换能器,所述方法包括获取声音环境的估算值;根据所述声音环境的估算值,以及所述助听器的处理器的传递函数,确定语言清晰度的估算值;和调节所述传递函数,以提高所述语言清晰度的估算值。
2.如权利要求1所述的方法,其包括将所述传递函数作为一个增益向量来确定,该增益向量代表所述助听器处理器内多个单个频带中的增益值,所述增益向量是被选择用来提高语言清晰度的。
3.如权利要求2所述的方法,其包括通过确定适于提高语言清晰度的第一部分频带的相应的所述语言清晰度的增益值,并且通过相对于所述第一部分频带在各增益值之间插值而确定第二部分频带,来确定所述增益向量。
4.如权利要求1或权利要求2所述的方法,其包括将所述语言清晰度的估算值传送到一外部调节系统,该外部调节系统与所述助听器连接。
5.如权利要求2所述的方法,其包括根据所述增益向量来计算输出信号的响度并将该响度与一响度极限值比较,所述响度极限值代表相对于一定响度的比值,该一定响度是相对于听力正常者的未经放大的声音响度;而且将所述增益向量调节到合适程度,而不超出所述响度极限值。
6.如权利要求2所述的方法,其包括通过使所述增益向量乘以一比例因子来调节所述增益向量,其方式使得所述增益值对应的响度低于或等于相应的响度极限值。
7.如权利要求2所述的方法,其包括调节所述增益向量里的每一个增益值,其方式使得所述增益值对应的响度低于或等于相应的响度极限值。
8.如以上权利要求其中一项所述的方法,其包括将所述语言清晰度的估算值作为清晰度指数来确定。
9.如以上权利要求其中一项所述的方法,其包括将所述语言清晰度的估算值作为调制传输指数来确定。
10.如以上权利要求其中一项所述的方法,其包括将所述语言清晰度的估算值作为语言清晰度指数来确定。
11.如以上权利要求其中一项所述的方法,其包括将所述语言清晰度的估算值作为语言传输指数来确定。
12.如权利要求2所述的方法,其包括确定所述声音环境的语音级估算值和噪声级估算值。
13.如权利要求2所述的方法,其包括将语音级估算值和噪声级估算值作为所述声音环境的相应百分位数值来确定。
14.如以上任一权利要求所述的方法,其包括实时处理语音信号,同时间歇更新所述传递函数。
15.如以上任一权利要求所述的方法,其包括实时处理语音信号,同时按使用者要求更新所述传递函数。
16.如权利要求13所述的方法,其包括将所述语言清晰度指数作为所述的语音级值、噪声级值和一个听力损失向量的函数来确定。
17.一种助听器,其包括用于计算语言清晰度的估算值的装置,该语言清晰度是作为若干语音级中的至少一个、若干噪声级中的至少一个、和若干单个频带对应的一个听力损失向量的函数来计算的。
18.如权利要求17所述的助听器,其包括通过对所述助听器中的若干单个频带的若干增益级施加合适的调节来提高语言清晰度的装置。
19.如权利要求17或18所述的助听器,其包括将所述助听器中单个所述频带的调节后的增益级所对应的响度与一响度极限值加以比较的装置,所述响度极限值代表相对未经放大的声音响度的一个比值;和用于按适当程度调节各相应增益值而使其不至超过所述响度极限值的装置。
20.一种针对声音环境来调节助听器的方法,其包括根据一般调节规则,选择初始助听器传递函数的设定值;获取所述声音环境的估算值;根据所述声音环境的估算值和所述初始传递函数,确定语言清晰度的估算值;和调节所述初始设定值,以提供经过修改后的适于提高所述语言清晰度的估算值的传递函数。
21.如权利要求20所述的方法,其包括在连接到所述助听器上的一外部调节系统中,执行调节所述初始传递函数的步骤;和将调节后的设定值传送到所述助听器内的程序存储器。
22.如权利要求20所述的方法,其包括将所述传递函数作为一个增益向量来确定,该增益向量代表所述助听器处理器内多个单个频带的增益值,所述增益向量是被选择用来提高语言清晰度的。
23.如权利要求22所述的方法,其包括通过确定适于提高语言清晰度的第一部分频带的相应的所述语言清晰度的估算值,并且通过相对于所述第一部分频带在各增益值之间插值而确定第二部分频带,来确定所述增益向量。
24.如权利要求21所述的方法,其包括根据所述增益向量来计算输出信号的响度并将该响度与一响度极限值比较,所述响度极限值向量代表相对于一定响度的比值,该响度是未经放大的声音响度;和将所述增益向量调节到合适程度,而不超出所述响度极限值。
25.如权利要求24所述的方法,其包括通过使所述增益向量乘以一比例因子来调节所述增益向量,其方式使得最大增益值低于或等于相应的所述响度极限值。
26.如权利要求24所述的方法,其包括调节所述增益向量里的每一个增益值,其方式使得所述增益值对应的响度低于或等于所述响度极限值。
27.如权利要求20所述的方法,其包括将所述语言清晰度的估算值作为清晰度指数来确定。
28.如权利要求20所述的方法,其包括将所述语言清晰度的估算值作为语言清晰度指数来确定。
29.如权利要求20所述的方法,其包括将所述语言清晰度的估算值作为语言传输指数来确定。
30.如权利要求20所述的方法,其包括确定所述声音环境的语音级估算值和噪声级估算值。
31.如权利要求24所述的方法,其包括将所述响度作为所述的语音级值和噪声级值的函数来确定。
全文摘要
一种助听器(22),具有话筒(1)、处理器(53)和输出换能器(12),该助听器适于获取声音环境的估算值、根据所述声音环境的估算值确定语言清晰度的估算值、和调节所述助听器处理器的传递函数从而提高语言清晰度的估算值。根据本发明的方法取得所述处理器传递函数的调节,该调节适于在特定的声音环境下优化语言清晰度。用于获得声音环境估算值和确定语言清晰度的装置可被结合到所述助听器处理器中,或者它们可以全部或者部分通过外部处理装置(56)运行,该外部处理装置适于经合适的链路和所述助听器处理器进行数据通信。
文档编号G10L21/0208GK1640191SQ02829303
公开日2005年7月13日 申请日期2002年7月12日 优先权日2002年7月12日
发明者M·汉森 申请人:唯听助听器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1