使用改编精细结构处理的基于双耳间相干的耳蜗刺激的制作方法

文档序号:18086673发布日期:2019-07-06 10:33阅读:289来源:国知局
使用改编精细结构处理的基于双耳间相干的耳蜗刺激的制作方法

本发明涉及用于耳蜗植入物的信号处理设备,且更具体地涉及用于耳蜗植入物的刺激编码策略的选择。



背景技术:

正常的人耳如在图1中所示将声音通过外耳101传送到鼓膜102,鼓膜102移动中耳103的骨骼,所述骨骼使得耳蜗104的卵圆窗和圆窗开口振动。耳蜗104是围绕耳蜗的轴线盘绕大致两圈半的长窄通道。耳蜗包括被称为前庭阶的上部通道和被称为鼓阶的下部通道,所述上部和下部通道通过耳蜗管连接。耳蜗104形成螺旋上升的锥形,带有称为蜗轴的中心,听神经113的螺旋神经节细胞居于此处。响应于通过中耳103传送的接收到的声音,以流体填充的耳蜗104作为变换器起作用,以生成电脉冲,所述电脉冲被传送到听神经113,且最终被传送到大脑。

当在将外部声音变换为沿耳蜗104的神经基质的有意义的动作电位的能力方面存在问题时,发生听力受损。为改进受损的听力,已开发了听力假体。例如,在受损涉及中耳103的运转时,常规的助听器可用于向听觉系统提供具有放大的声音的形式的声音-机械刺激。或当受损与耳蜗104相关时,带有植入的电极的耳蜗植入物可对于听神经组织以小电流进行电刺激,所述小电流通过沿电极分布的多个电极触点输送。虽然下文论述特定于耳蜗植入物,但在刺激电极植入到其他解剖结构内时,一些听力受损的人员更好地受益。因此,听力植入物系统包括脑干植入物、中脑植入物等,每个所述植入物刺激听觉系统内的特定的听觉目标。

图1还示出了典型的耳蜗植入物系统的一些部件,其中外部麦克风将音频信号输入提供到外部植入物处理器111,其中可实现多种信号处理方案。例如,在本领域中已公知在耳蜗104内的不同位置处的电刺激产生不同的频率感受。其机理在正常声学听力被称为声调原理。在耳蜗植入物使用者中,耳蜗的声调组织已被广泛研究;例如,见vermeire等人的neuraltonotopyincochlearimplants:anevaluationinunilateralcochlearimplantpatientswithunilateraldeafnessandtinnitus,hearres,245(1-2),2008sep12p.98-106;和schatzer等人的electric-acousticpitchcomparisonsinsingle-sided-deafcochlearimplantusers:frequency-placefunctionsandratepitch,hearres,309,2014mar,p.26-35(二者在此通过引用完整合并)。在耳蜗植入物领域中的电流信号处理方法的示例包括连续交织采样(cis)数字信号处理,通道特定采样序列(csss)数字信号处理(如在美国专利no.6,348,070中描述,在此通过引用合并),高级组合编码器(ace)处理,谱峰值(speak)数字信号处理,精细结构处理(fsp)和压缩模拟(ca)信号处理。

因此,在外部植入物处理器111内被处理的音频信号被转化为数字数据格式以用于通过外部传送器线圈107传送到植入物刺激器108内。除接收被处理的音频信息外,植入物刺激器108也执行另外的信号处理,例如误差校正、脉冲形成等,且(基于提取的音频信息)产生刺激信号,所述刺激信号通过电极引线109被发送到植入的电极阵列110。典型地,这个电极阵列110在其表面上包括多个电极触点112,所述电极触点112提供耳蜗104的选择性刺激。

在现有的耳蜗植入物系统中,电极触点112以刺激帧的重复的时间序列被刺激。如果每个刺激帧使用所有电极触点112,则刺激率需要相对低,以容许实现患者特定的足够的响度感受所要求的脉冲长度。在给定的刺激帧内刺激所有电极触点112的另一个缺点是由于重叠的电场、神经膜处的残余电荷、更高阶次的处理所导致的不同通道之间的干涉。存在数个不同的解决方法以降低这些副作用,所述方法使用减少的电极触点112的子集。然后基于例如带通信号幅值的瞬时信号特性逐帧执行通道选择。

对于正常听力主体,包络和精细时间结构对于噪声和混响条件下的定位和语音理解都是重要的(zeng,fan-gang等人"auditoryperceptionwithslowly-varyingamplitudeandfrequencymodulations."auditorysignalprocessing.springernewyork,2005.282-290;drennan,wardr.,等人"effectsoftemporalfinestructureonthelateralizationofspeechandonspeechunderstandinginnoise."journaloftheassociationforresearchinotolaryngology8.3(2007):373-383;和hopkins,kathryn,和brianmoore."thecontributionoftemporalfinestructureinformationtotheintelligibilityofspeechinnoise."thejournaloftheacousticalsocietyofamerica123.5(2008):3710-3710;且所有前述文献通过引用在此完整合并)。

较早的语音编码策略主要将慢变信号包络信息编码,且不传送信号的精细时间结构。一个应用广泛的方案使用被称为m选n(n-of-m)的解决方法,其中仅一定数量n的电极通道在给定的刺激帧内以最大幅值被刺激。此解决方法例如通过cochlearcorporation使用在ace和speak策略中。如果对于给定的时间帧,特定电极通道的幅值保持比其他通道的幅值更高,则将所述通道选择为用于整个时间帧。因此,可利用于编码信息的电极通道的数量减少一个,这导致刺激脉冲的聚集。

在cis信号处理策略中,信号处理器仅使用带通信号包络以用于进一步的处理,即所述包络包含完整的激励信息。对于每个电极通道,信号包络表示为具有恒定的重复率的双相脉冲的序列。cis的典型的特征是刺激率对于所有电极通道相等,且与单独通道的中心频率无关。意图在于使得脉冲重复率不是用于患者的时间线索(即,脉冲重复率足够高而使得患者不感受到带有等于脉冲重复率的频率的声调)。脉冲重复率通常选择为比包络信号的带宽高两倍以上(基于奈奎斯特定理)。刺激脉冲以严格的非重叠序列施加。因此,作为典型的cis特征,每次仅一个电极通道工作,且总刺激率相对高。例如,假定总刺激率为18kpps且对于12通道滤波器组,每通道的刺激率为1.5kpps。这样的每通道刺激率通常足以在时间上表示包络信号。最大总刺激率受到每脉冲最小相位宽度的限制。相位宽度不能任意短,因为脉冲越短则电流幅值必须越高以诱导神经元中的动作电位,而电流幅值由于多种实际原因受到限制。对于18kpps的总刺激率,相位宽度为27微秒,这接近下限。

med-el给出的精细结构处理(fsp)策略使用更高频率通道内的cis,且使用在较低频率、较顶部电极通道内的带通信号内存在的精细结构信息。在fsp中,低频通道的精细时间结构通过通道特定采样序列(csss)被传送,所述通道特定采样序列在各带通滤波器输出的负到正过零时开始(见美国专利6,594,525,其在此通过引用合并)。fsp的基本构思是施加刺激模式,其中保存与滤波器通道的中心频率的特定关系,即在刺激模式的时间波形中表示了中心频率,且并非完全地移除中心频率,如在cis中的情况。每个刺激通道与特定的csss相关,所述csss是超高率双相脉冲的序列(典型地5-10kpps)。每个csss具有独特的长度(脉冲数量)和独特的幅值分布。csss的长度可例如从相关的带通滤波器的中心频率导出。与较低滤波器通道相关的csss比与较高滤波器通道相关的csss更长。例如,可以是中心频率的周期的一半。幅值分布可根据患者特定的要求被调整。典型地,csss序列施加到直至3个最顶部电极通道上,从而覆盖了直至200hz或330hz的频率范围。fsp设计进一步在hochmairi,noppp,jollyc,schmidtm,h,garnhamc,andersoni,med-elcochlearimplants:stateoftheartandaglimpseintothefuture,trendsinamplification,vol.10,201-219,2006中描述,在此通过引用将其合并。

为说明,图2a至图2b示出了用于6通道系统的csss的两个示例。在图2a中,csss通过将正弦信号的周期的一半进行采样导出,所述正弦信号的频率等于带通滤波器的中心频率(中心频率在440hz、696hz、1103hz、1745hz、2762hz和4372hz处)。采样通过具有10kpps的刺激率和25微秒的相位宽度的双相脉冲实现。对于通道5和6,中心频率的周期的一半太短而不能给出超过一个刺激脉冲的空间,即分别为包括仅一个脉冲的“序列”。其他幅值分布可被利用。例如,在图2b中,通过对于带有等于带通滤波器的中心频率的一半的频率的正弦信号的四分之一进行采样导出了序列。这些csss分别具有大约与图2a中的csss相同的持续时间,但幅值分布单调增加。此单调分布可能是有利的,因为序列的每个脉冲可在理论上刺激如下位置处的神经元,即所述位置不能被刺激的前序刺激到达。

图3图示了fsp编码策略的典型的信号处理实现。预处理器滤波器组301处理输入声音信号,以生成带通信号,所述带通信号每个代表了通过音频频率的相关的频带限定的带通通道。预处理器滤波器组301的输出通向包络检测器302,所述包络检测器302提取反映带通信号的时变幅度的带通包络信号,所述带通信号包括未解析的谐波且以谐波的差异音调被调制,主要是基频f0,且所述预处理器滤波器组301的输出通向刺激定时模块303,所述刺激定时模块303产生反映带通信号的时间精细结构特征的刺激定时信号。对于fsp,刺激定时模块303检测每个带通信号的负到正过零,且作为响应,开始csss以作为刺激定时信号。脉冲生成器304使用带通包络信号和刺激定时信号来产生用于植入物305中的电极触点的电极刺激信号。

fs4编码策略与fsp的不同在于,直至4个顶部通道可使其精细结构信息被使用。在fs4-p中,刺激脉冲序列可并行地输送到4个fs4-p电极通道的任意2个上。使用fsp和fs4编码策略,精细结构信息是给定的电极通道的瞬时频率信息,这可为使用者提供改进的听力感觉,更好的语音理解和增进的感受音频质量。例如,见美国专利7,561,709;lorens等人"finestructureprocessingimprovesspeechperceptionaswellasobjectiveandsubjectivebenefitsinpediatricmed-elcombi40+users."internationaljournalofpediatricotorhinolaryngology74.12(2010):1372-1378;和vermeire等人,"betterspeechrecognitioninnoisewiththefinestructureprocessingcodingstrategy."orl72.6(2010):305-311;所有文献在此通过引用完整合并。

fsp和fs4是将时间精细结构信息进行编码的唯一商业上可利用的编码策略。虽然fsp和fs4已被证明在许多听力情况中性能比例如cis明显更好,但存在一些其他听力情况,迄今为止未发现优于cis等仅包络编码策略的明显益处,特别是相对于在噪声和混响条件下的定位和语音理解。

时间精细结构可能比包络噪声更多地受到噪声的影响。可能有益的是例如取决于信噪比或取决于动态混响比使用精细结构刺激。在现有的编码策略中,时间精细结构的使用在手术后装配过程中被改编,且不对于信噪比自适应。

除以上所述的特定的处理和编码解决方法外,不同的特定的刺激模式可输送带有电极的刺激脉冲,即单极、双极、三极、多极和相控阵列刺激。也存在不同的刺激脉冲形状,即双相脉冲、对称三相脉冲、非对称三相脉冲或非对称脉冲形状。这些不同的脉冲刺激模式和脉冲形状每个提供了不同的益处,例如更高的声调选择性、更小的电阈值、更高的电动态范围、更少的有害副作用,例如面部神经刺激等。

双耳间刺激已长期使用在助听器中,但近期在听力植入物中变得常见,例如耳蜗植入物(ci)。对于耳蜗植入物,双耳刺激要求在每个耳内带有植入电极阵列的双侧植入物系统。左右侧进入的声学信号类似于助听器内的情况,且可简单地是分别位于左耳和右耳附近的麦克风的输出信号。

双侧耳蜗植入物提供了双侧听力的益处,这可允许听者在水平面内定位声源。这要求来自双耳的信息,例如双耳间声级差(ild)和双耳间时间差(itd)。这例如在macpherson,e.aandmiddlebrooks,j.c.,listenerweightingofcuesforlateralangle:theduplextheoryofsoundlocalizationrevisited,j.acoust.soc.am.111,2219-3622,2002中进一步描述,其在此通过引用完整合并。itd是到达左耳和右耳的信号之间的相对时移,所述相对时移由于当声源不处于中间平面内时信号达到每个耳部的不同时间所导致。ild是进入耳部的信号的声级的类似的差异。也已知双侧听力使得语音在噪声中更容易被理解,且在此itd又起到关键作用。这例如在bronkhorst,a.w.,andplomp,r.,theeffectofhead-inducedinterauraltimeandleveldifferencesonspeechintelligibilityinnoise,j.acoust.soc.am.83,1508-1516,1988中更完整地解释,在此通过引用将其完整合并。

复杂的室内声音情况(例如回声)影响双侧耳蜗植入物系统的声音定位性能。到达听者双耳的室内声学信号通过双耳间相干的改变表征(例如,faller等人,"sourcelocalizationincomplexlisteningsituations:selectionofbinauralcuesbasedoninterauralcoherence,"thejournaloftheacousticalsocietyofamerica116.5(2004):3075-3089;在此通过引用将其完整合并)。从附近声源发射的声音的开端可能具有高的双耳间相干,而随后的声音成分可能被来自不同方向的回声重叠,且可能具有很小的或不具有双耳间相关。

基本的心理声学实验(monaghanetal.,"factorsaffectingtheuseofenvelopeinterauraltimedifferencesinreverberation,"thejournaloftheacousticalsocietyofamerica133.4(2013):2288-2300;在此通过引用将其完整合并)已显示对于带有高双耳间相关的信号成分的获得可有益于正常听力中的流隔离。但现有的双侧耳蜗植入物系统未实现促进声音定位性能的方法。

美国专利公开20080319509描述了改进itd感受的方法,此方法降低了信号的周期性特征。如果itd存在于对应的带通信号中,则单独编码策略构思,例如fs4策略,可将itd编码(见美国专利8,798,758和美国专利7,283,876,在此通过引用将二者完整合并)。其他的刺激构思也已表明例如使用峰值导出的定时来传送itd,如在美国专利7,310,558中描述,在此通过引用将其完整合并。然而,所述已知的实施方法都不考虑itd可能由于回声或其他干扰性次级声源的存在而被污染,且因此所述已知的实施方法将有效的和无效的itd以等权重编码。



技术实现要素:

本发明的实施例涉及一种在具有左侧和右侧听力植入物的双侧听力植入物系统内进行信号处理的系统和方法。用于每个听力植入物的至少一个感测麦克风构造为用于感测此听力植入物的声音环境,以建立对应的麦克风信号输出。用于每个听力植入物的滤波器组构造为处理麦克风信号以生成用于此听力植入物的多个带通信号,其中,每个带通信号代表音频频率的相关的频带,且其中,每个带通信号具有特征性的时间精细结构特征和反映带通信号的时变幅值的特征性的带通包络。至少一个双耳间相干分析模块构造为从每个听力植入物接收包括麦克风信号和带通信号的输入信号,且构造为分析输入信号以产生表征了输入信号的与混响相关的相似性的双耳间相干信号输出。用于每个听力植入物的刺激定时和编码模块构造为处理带通信号,以建立刺激定时信号。对于一个或多个所选择的带通信号,处理包括:i.根据双耳间相干信号从多个不同的刺激编码策略中选择刺激编码策略,所述多个不同的刺激编码策略包括基于带通包络的基于包络的刺激编码策略和基于时间精细结构特征的基于事件的刺激编码策略,ii.使用所选择的刺激编码策略产生刺激定时信号,和iii.根据双耳间相干信号的改变在不同的所选择的刺激编码策略之间进行切换。用于每个听力植入物的脉冲生成模块构造为处理刺激定时信号,以建立用于听力植入物的电极刺激信号以作为声音被感知。

在另外的特定的实施例中,刺激定时和编码模块可构造为在双耳间相干信号高时选择基于事件的刺激编码策略,且可构造为当双耳间相干信号低时选择基于包络的刺激编码策略。且至少一个双耳间相干性分析模块可使用互相关函数来产生双耳间相干信号。

可存在单一的双耳间相干性分析模块,所述双耳间相干性分析模块构造为产生用于两个听力植入物的耳间相干信号。或可存在用于每个听力植入物的双耳间相干性分析模块。

刺激编码策略之一包括连续交织采样(cis)和/或通道特定采样序列(csss)。至少一个双耳间相干性分析模块可构造为选择一个或多个输入信号,以使用根据听觉场景分析(asa)被控制的切换设备来进行分析,或基于在使用者装配过程期间设置的可配置输入开关来进行分析。

附图说明

图1示出了人耳的解剖结构和典型的耳蜗植入物系统的一些部件。

图2a和图2b示出了利用10kpps和25微秒的相位宽度的双相脉冲的用于两个6通道系统的通道特定采样序列(csss)。

图3示出了根据现有技术设备的用于听力植入物的信号处理设备的多种功能块。

图4示出了根据本发明的实施例的建立电极刺激信号中的多种逻辑步骤。

图5示出了根据本发明的实施例的用于听力植入物的信号处理设备内的多种功能块。

图6示出了来自麦克风的音频语音信号的短时段的示例。

图7示出了通过由滤波器组对一组带通信号进行带通滤波而分解的声学麦克风信号。

图8示出了音节“bet”的宽带波形信号。

图9示出了图8的波形的带通滤波信号和包络信号。

图10示出了图9中的波形的包络信号和平滑的包络信号。

图11示出了来自图9的波形信号的带有包络线的上升沿的部分。

图12示出了来自图11的包络信号和升起的包络信号的部分。

图13示出了经处理的带通信号和用于添加有高斯噪声且snr=10db的元音的作为结果的csss脉冲序列。

图14示出了与图13中相同的信号,其中snr=5db。

图15示出了与图13中相同的信号,其中snr=0db。

图16示出了根据本发明实施例的经处理的带通信号和snr适应的脉冲时间间隔的示例。

图17示出了用于双侧耳蜗植入物系统的信号处理设备的多种功能块,所述信号处理设备使用根据本发明实施例的双耳间相干分析模块。

图18示出了如在图17中所示的双侧耳蜗植入系统的一侧的更多的功能细节。

图19示出了如在图17中所示的双侧耳蜗植入系统中的信号处理方法中的多种逻辑步骤。

图20示出了在双耳间相干等于1时根据本发明的信号处理的示例波形。

图21示出了在双耳间相干等于0.5时根据本发明的信号处理的示例波形。

图22示出了在双耳间相干等于0时根据本发明的信号处理的示例波形。

具体实施方式

给定的耳蜗植入物刺激编码策略的参数可能对于所有收听条件并非都是最优的。例如,在噪声情况下,一些编码策略可能比另一些性能更好,因为时间精细结构典型地比带通信号包络更大地受到噪声的影响。有益的是基于收听情况从一个编码策略切换到另一个编码策略。取决于所有特定的情形,切换可以以小增量执行,使得发生传送从一个编码策略到另一个编码策略的平滑渐变。替代地,在其他情形中,可能有益的是在不同的刺激编码策略之间直接切换而无过渡时间段。无论何种方式,音频输入信号或带通信号被监测和分析,以估计存在的一个或多个关键特征。基于关键特征(或多个关键特征),刺激编码策略被自动修改。

图5示出了用于耳蜗植入物的信号处理设备中的多种功能块,而图4是示出了根据本发明实施例的在植入的耳蜗植入物阵列中向电极触点产生电极刺激信号的多种逻辑步骤的流程图。此方法的伪代码示例可以表述为:

此设计的细节在如下的论述中表述。

在图5所示的设计中,输入声音信号由一个或多个感测麦克风产生,所述麦克风可以是全方向的和/或定方向的麦克风。预处理器滤波器组501以多个并行带通滤波器的组处理此输入声音信号,步骤401,所述带通滤波器的每个与特定的音频频带相关;例如,使用带有12个6阶无限冲激响应(iir)型数字巴特沃斯带通滤波器,使得输入声音信号被滤波成一些k波段通过信号,即u1到uk,其中每个信号对应于带通滤波器之一的频带。预处理器滤波器组501的每个输出可大致被视为带通滤波器的中心频率处的正弦波,所述正弦波被幅度包络信号调制。这是由于滤波器的品质因数(q≈3)。在浊音语音段的情况下,带通包络近似是周期性的,且重复率等于基音频率。替代地而非限制性地,可基于快速傅里叶变换(fft)或短时傅里叶变换(stft)的使用来实现预处理器滤波器组501。基于耳蜗的声调组织,鼓阶中的每个电极触点通常与预处理器滤波器组501的特定带通通道相关。预处理器滤波器组501也可执行其他初始信号处理功能,例如自动增益控制(agc)和/或降噪。

图6示出了来自感测麦克风的输入语音信号的短时间周期的示例,且图7示出了通过滤波器组进行带通滤波分解的麦克风信号。基于直接形式ii转置结构的无限冲激响应(iir)滤波器组的伪代码的示例由fontaine等人,brianhears:onlineauditoryprocessingusingvectorizationoverchannels,frontiersinneuroinformatics,2011;在此通过引用将其完整合并:

带通信号u1至uk(也可以被认为是电极通道)输出到包络检测器502和刺激定时模块503。包络检测器502提取代表了通道特定的带通包络的包络信号输出y1,…,yk,步骤402。包络提取可通过yk=lp(|uk|)代表,其中|.|表示绝对值,且lp(.)是低通滤波器;例如使用12个整流器和12个二阶iir型数字巴特沃斯低通滤波器。合适地选择的低通滤波器可有利地平滑提取的包络,以去除不希望的波动。替代地,如果带通信号u1,…,uk由正交滤波器生成,则包络检测器502可以提取希尔伯特包络。在一些实施例中,包络检测器502也可构造为确定带通包络的一个或多个有用特征,例如包络斜率(例如,基于包络随时间的一阶导数),包络峰值(上升斜率/正一阶导数,接着是下降斜率/负一阶导数),和/或带通包络的包络幅值。

刺激定时模块503处理一个或多个带通信号u1,…,uk(典型地,对于最顶端的一个或多个,最低频率通道)的所选时间精细结构特征,例如负到正过零,以产生刺激定时信号x1,…,xk。在如下讨论中,假定带通信号u1,…,uk是实值信号,因此在分析正交滤波器组的特定情况中,刺激定时模块503仅考虑uk的实值部分。对于所选择的带通信号,刺激定时模块303产生反映时间精细结构特征的刺激定时信号,步骤403。在一些实施例中,刺激定时模块303可将瞬时带通频率f0限制到相应滤波器频带的频率上下边界fl1和fu1。例如,给定的带通信号可具有500hz的频率下边界fl1和fu1=750hz的频率上边界。

关键特征监测器506监测输入声音信号或带通信号中存在的一个或多个关键特征,步骤404。例如,被关键特征监测器506监测的关键特征可以是输入声音信号的信噪比(snr),输入声音信号的直接混响比(drr)。

刺激编码模块507耦合到关键特征监测器506,且基于关键特征值为一个或多个所选的带通信号选择刺激编码策略,步骤405。刺激编码策略包括:(1)基于带通包络信号的基于包络的刺激编码策略(例如使用带有恒定刺激率的刺激脉冲的cis或hd-cis),和(2)基于刺激定时信号传送时间精细结构信息的基于事件的刺激编码策略(例如根据时间精细结构信息使用自适应刺激率的fsp或fs4)。基于事件的刺激编码策略被认为在相对安静的收听条件下是最佳的,而基于包络的刺激编码策略被认为在噪声较大的条件下更好。刺激编码模块507根据由关键特征监测器506监测到的关键特征值的变化自动地在不同的所选的刺激编码策略之间切换。刺激编码模块507可构造为在不同的情况下直接在不同的所选的刺激编码策略之间切换,而无过渡时间段,或可通过在过渡时间段内自适应地改变所选择的刺激编码策略以变成不同的刺激编码策略来在不同的所选的刺激编码策略之间进行切换;例如,在关键特征值从初始值变为编码变化值之后或之时。

脉冲生成器504使用由刺激编码模块507选择的刺激编码策略来产生用于植入物505内的电极触点的电极刺激信号,步骤406。例如,脉冲生成器504可构造为在一个或多个所选的带通信号中的每一个的负到正过零的开始处创建csss输出定时请求脉冲,且然后以来自包络检测器502的带通包络对csss刺激脉冲进行加权(幅度调制)。

脉冲生成器504也将典型地基于反映了来自装配过程的患者特定的缩放的非线性映射来进一步调整输出电极刺激信号。类似地,可通过调整刺激参数,例如脉冲幅值,脉冲持续时间,脉冲形状或csss序列的形状(例如,带有短的脉冲间隔),来处理在基于事件的刺激编码和基于包络的刺激编码中的感知响度的变化。且这可基于患者特定的装配参数进行,所述装配参数在语音信号存在期间被调整,直至语音被最自然地感知。此外,在从一种特定刺激编码策略切换到另一种特定刺激编码策略时,mcl和thr值可能变化,因此也应调整患者特定的缩放函数的mcl和thr值(除csss序列外),以促进不同的刺激编码策略之间的响度平衡的过渡。

在正常听力主体中的一些研究(例如,dietz,mathias等人"emphasisofspatialcuesinthetemporalfinestructureduringtherisingsegmentsofamplitude-modulatedsounds."proceedingsofthenationalacademyofsciences110.37(2013):15151-15156;在此通过引用将其完整合并)表明,精细结构信息在带通包络线的上升斜率期间可能是最有效的。因此,一些实施例可使用带通包络线的上升斜率作为关键特征或包络的一些其他特性。如果关键特征是包络峰值,则可在峰值周围或之后定义的间隔期间应用基于事件的刺激编码,其长度可与峰值的长度和幅度相关。特定的此设置可进一步构造为仅当关键特征高于某个最小阈值时,即当包络的上升斜率足够大时,使用反应精细结构信息的基于事件的刺激编码。否则,可使用基于包络的刺激编码。可对包络斜率进行平均或对近期的过去值进行低通滤波,以提供平滑值。

例如,图8示出了音节“bet”的宽带波形信号。图9示出了此信号的带通滤波形式,其具有200hz的频率下边界和325hz的频率上边界以及带通包络。图10示出了带通包络和通过100hz低通滤波得到的此包络的平滑形式。在图11中,刺激脉冲通过此平滑的包络控制:如果包络的斜率超过一定的阈值(在此为0.001),则在带通信号的过零处使用单个脉冲施加精细结构刺激。以相应的带通包络将过零处的这些脉冲加权。在包络斜率不超过最小阈值时,可使用规则的时间网格对刺激脉冲施加仅包络刺激,其中以相应的包络信号将脉冲加权。

如上所述,在一些特定实施例中,刺激编码模块507可构造为通过适应地修改刺激定时信号(例如,通道特定采样序列(csss))的长度和形状,在过渡时间段内基于输入声音信号的snr在不同刺激编码策略之间自动地进行平滑过渡。对于来自刺激定时模块503的每个刺激定时信号,刺激编码模块507确定csss脉冲序列的事件特定的长度(“fl间隔”)。脉冲生成器504将csss脉冲序列整形,以遵从来自包络检测器502的带通包络的幅值,即实际上以csss序列对带通包络进行采样。

在来自关键特征监测器506的snr信号相对较高(安静的声音环境)时,刺激编码模块507将fl间隔调整得足够短,使得csss脉冲序列可由少至单一的脉冲组成。随着来自关键特征监测器506的snr信号减小(环境变得更嘈杂),刺激编码模块507增加fl间隔且向csss序列添加更多脉冲,直到在对于低snr(高噪声)的某一点处csss序列的最后的脉冲无缝地被下一个csss序列的第一个脉冲跟随,从而导致来自包络检测器502的带通包络的连续(恒定率)采样。如果fl间隔的长度变得长于两个相继的触发事件(即,两个过零点)之间的时间,则刺激编码模块507可在下一个触发事件发生时终止现有的csss序列,且随后的触发事件的fl间隔否决先前的fl间隔。或刺激编码模块507可以以由第一触发事件初始的csss脉冲序列继续,且忽略后续的触发事件,使得在现有fl间隔的结束处确定新的fl间隔。一旦来自关键特征监测器506的snr信号再次增加,则刺激编码模块507适应地调整fs间隔,以使其再次变得短于触发事件之间的时间。

图13示出了经处理的带通信号的示例和用于添加有高斯噪声且snr=10db的元音的作为结果的csss脉冲序列。带通信号是绿色的高频全正弦波信号,希尔伯特带通包络是以蓝色显示的较慢变化的半正弦波轨迹,且垂直的黑线代表了序列长度为1的所施加的csss序列。图14示出了与图13中相同的信号,图中示出了当snr信号降低到5db(更多噪声)且fl间隔增加时的情况,使得csss序列每个包含三个脉冲。图15示出了与图13中相同的信号,其中snr=0db(噪声仍更大),其中fl间隔太长以至于csss序列执行类似于hd-cis编码战略的带通包络的连续采样。

在一些实施例中,刺激编码模块507可构造为根据通过关键特征监测器506监测的关键特征值的改变且进一步根据来自包络检测器502的带通包络的多个特征在不同的选择的刺激编码策略之间切换;例如,包络幅值,包络斜率和/或包络峰值。因此,在所述关键特征值是snr的情况中,对于高snr,刺激编码模块507可在带通信号的每个过零时触发csss序列,而对于较低的snr值,刺激编码模块507可仅对于具有特定阈值最小包络值的过零(例如,来自希尔伯特包络)触发csss序列。此包络阈值功能可在噪声环境中(低snr)中是有利的,以区分仅通过噪声导致的过零事件和实际由于语音或音乐信号导致的过零事件。阈值最小包络在一些实施例中可以是通道特定的,而在其他实施例中不是。当然,可使用一些其他关键特征,例如,直接使用混响比(drr)。

作为自适应改变csss间隔的长度的补充或替代,其他特定的实施例可自适应地控制其他信号变量。例如,与在特定事件(例如,过零事件)处应用csss脉冲相结合,可确定随后的时间间隔,即精细结构fs间隔,其中已经施加脉冲。此fs间隔的长度可由施加脉冲时的snr信号的值确定:如果snr高,则fs间隔可选择为长,而如果snr低,则fs间隔可以选择为短。为将刺激率限制到反应听神经纤维的不应期的最大值,可限定对应于最大刺激率的最短可能的fs间隔。存在数种不同的特定的可能性:

·如果在从先前的定时事件确定的fs间隔内发生另一个定时事件,且两个定时事件之间的时间比所述不应期值更长,则脉冲可在第二定时事件处被施加,且否决前一个fs间隔的新的fs间隔开始。

·如果在从先前的定时事件确定的fs间隔内发生另一个定时事件,但两个定时事件之间的时间短于不应期,则可在不应期结束时施加脉冲且否决前一个fs间隔的新的fs间隔开始。

·如果在当前的fs间隔结束之前不出现另外的定时事件且不应期短于fs间隔,则可在fs间隔结束处施加(强制)另一个脉冲。

·如果在当前的fs间隔结束之前不出现另外的定时事件但不应期长于fs间隔,则可在不应期结束处施加(强制)另一个脉冲。

一般地,实施例可能要求仅在最小时段(例如,不应期)结束时可施加随后的脉冲(由于定时事件的发生导致或由于fs间隔的结束导致)。在一些应用中,可能有利的是将比不应期更短的时段作为最小时段。

图16示出了根据本发明实施例的经处理的带通信号和snr适应的脉冲时间间隔的示例。在图9中,假定检测到五个过零定时事件e1-e5(垂直实线),snr随时间t(即从左到右)降低,且不应期如横跨图的底部的标记有“不应期”的相应的水平箭头所示。第一csss脉冲是,但不限于,在过零事件e1处施加。因为snr高,所以因此相应的fs间隔i_1相对较长。下一个过零事件e2发生在i_1fs间隔结束之前,因此下一个csss脉冲在e2处施加,且与i_2和e3的情况相同但同时snr降低,使得i_2比i_1更短。然而在i_3fs间隔结束时发生的事件e3'处,强制产生csss脉冲,因为在过零事件e3之后开始的fs间隔内没有发生进一步的过零事件(也就是不应期(e3之后)仍比i_3更短)。下一个过零事件发生在e4处,但仍然在e3'处最后施加的脉冲之后的不应期内,因此在e4处未施加脉冲也未确定任何相应的fs间隔。类似地,在e5处未施加脉冲,且此外在e4'处snr太低以至于确定相应的i_5fs间隔短于不应期,因此在e5'处未施加脉冲,而是脉冲延迟直至对应于事件e4'之后的不应期结束的e5”处。

当snr随后越来越大地升高时(图9中未示出),fs间隔将再次变得越来越长,直到在不应期结束之后但在fs间隔结束之前检测到过零事件。从此时起,过零事件将再次确定脉冲序列,且编码策略遵循已知的基于事件的编码策略,直到snr再次降低。最大刺激率可被设定为与最小可能间隔(例如不应期)的倒数成比例,使得瞬时刺激率(等于1/(fs间隔))不能超过给定的限定值;例如目前用于cis或hd-cis编码策略的典型的刺激率。通常,snr越低,则根据基于包络的编码策略(例如cis或hd-cis)的作为结果的声音编码序列越多(以规定的方式以限定的最大刺激率对每个通道进行恒定采样)。根据例如fsp的纯基于事件的编码策略,snr越高,则作为结果的声音编码序列将越多。

csss序列的修改也可以以通道方式完成,即基于通道特定的snr值。且虽然前文描述使用snr作为随后的自适应修改的参数,但也可使用表征现有听力情况质量的其他特定信号参数;例如直接混响比(drr)。

两种方法,即csss长度的改变和其中不施加脉冲的时间间隔的确定,产生了类似的总体结果:基于事件(可变率)和基于包络(恒定率)编码策略之间的平滑过渡。本发明的实施例使声音编码策略适应于声音环境的改变,使得每个环境具有最优设置。使用snr调整的采样,在无干扰的情况中提供时间精细结构,而声音编码无缝地渐变为更加噪声稳健的包络编码,以在噪声更大的环境中获得更好的声音感知。

前述论述在如下方面给出,即在一个或多个带通通道上与使用在任何其他带通通道上的刺激编码策略无关地切换刺激编码策略。但本发明的实施例包括多通道变体,所述多通道变体确定多个带通通道的关键特征且协调将其刺激编码策略一起切换。

选择为用于编码时间精细结构的带通通道相对于所选择的关键特征被分析,以识别所有分析通道中的主要关键特征。在m选n(n-of-m)刺激编码设计中,带通通道典型地被划分为同时的时间帧,且典型地选择每个时间帧中带有最大包络幅值的通道用于刺激。或包络斜率可用作关键特征,其中主要通道(多个主要通道)是带有最大斜率(多个最大斜率)的通道。或关键特征可以是包络峰值,其中主要关键特征可以是如下峰值,即所述峰值的幅值与周围的通道内噪声水平之间的差异最大和/或所述峰值具有最小的半峰全宽(表征峰的宽度的或类似的度量)。类似地,如果snr或直接或混响比(drr)是关键特征,则带有最大值的带通通道将被考虑为主要通道。

例如,在包络斜率用于关键特征的多通道设计中,为了增进时间精细结构的传送,仅基于事件的通道(典型地是最顶端的、最低频率的通道)将针对包络斜率即包络的时间一阶导数被分析。非基于事件的通道可以以常规的cis类型的方式被激励,而无需进行进行m选n的选择。将仅选择在其带通包络的时间上具有正的一阶导数的基于事件的通道,且可从这些通道中选择具有最大包络幅值的带通通道的子集用于刺激。

假设刺激帧可包括依照顺序的精细结构和包络通道:ch1,ch2,ch3,ch4,ch5,ch6,其中通道ch1,ch2和ch3是基于事件的精细结构通道,ch4,ch5和ch6是基于包络的通道。对于包络sl1,sl2和sl3的相应斜率,如果sl2>0且sl2>sl1且sl2>sl3,则sl2是主要关键特征,且作为结果的带有一个选定的基于事件的通道的刺激帧是ch2,ch4,ch5,ch6。如果所有包络斜率对于基于事件的通道都是负的(无主要关键特征),则选择非基于事件的通道,且作为结果的帧仅包括基于包络的通道:ch4,ch5,ch6。使用两个选定的基于事件的通道且sl2>0且sl1>0且sl2>sl3且sl1>sl3,则sl1和sl2是主要关键特征,且作为结果的刺激帧是:ch1,ch2,ch4,ch5,ch6。在所有这些示例中,在所选择的基于事件的通道(多个通道)上,然后如上所述建立且施加刺激信号。

确定用于多个带通通道的关键特征且协调切换其刺激编码策略的多通道设计不必须特定为m选n的策略。替代地,可选择单一的主要关键特征,且可在此通道及其相邻通道上施加基于事件的刺激编码(假定所述刺激编码是基于事件的编码通道)。因此,如果包络斜率是关键特征,则带有最大包络斜率的通道如上所述被激励,且并行地一起激励相邻的通道。这些相应的刺激脉冲中的每个的幅值可从相应的带通包络信号导出,类似于美国专利公开2009/0254150(在此通过引用将其完整合并)中描述的基于cfs的编码策略。

在双侧耳蜗植入物系统中对于选择和切换刺激编码策略的可能有益的另一个关键特征是双耳间相干性,所述双耳间相干性是到达主体的双耳的声波的相似性的量度。双耳间相干性与混响有关。源自声源(例如扬声器)的到达耳部的第一波前(wavefront)没有反射,因此所述第一波前提供了高的双耳间相干性。但相继的混响声波降低了双耳间相干性。双耳间相干可用作用于声音定位的双耳间时间差(itd)和双耳间声级差(ild)的指标;见,faller2004)。无反射时段的精确时间编码可实现更稳健的声音定位和语音线索。

ruggles报道了在混响条件下声音信号的包络提供了比时间精细结构更稳健的定位线索(ruggles,dorea,haribharadwaj和barbarag.shinn-cunningham。"whymiddle-agedlistenershavetroublehearingineverydaysettings."currentbiology22.15(2012):1417-1422,在此通过引用将其完整合并),而在无混响的条件下,ci患者对时间精细结构中的itd比对包络中的itd更敏感(majdak,piotr,bernhardlaback和wolf-dieterbaumgartner。"effectsofinterauraltimedifferencesinfinestructureandenvelopeonlateraldiscriminationinelectrichearing,"thejournaloftheacousticalsocietyofamerica120.4(2006):2190-2201,在此通过引用将其完整合并)。不同的耳蜗刺激策略可为混响或干净的输入信号条件提供不同的声音定位性能。

因此,带通精细结构特征只有在其提供稳健的itd提示时才可被给出。在音频输入信号具有高的双耳间相干的时段期间,可有益地选择将精细结构信息编码的基于事件的刺激编码策略。在双耳间相干相对较低时(例如,存在混响),带通精细结构信息关于声音定位信息是模糊的,且带通包络信息对于混响更稳健,因此可选择基于包络的刺激编码策略,从而降低烦扰的和不准确的itd和ild提示。

因此,本发明的实施例涉及基于使用双耳间相干的双侧听力植入物系统中的信号处理的系统和方法。图17示出了用于双侧耳蜗植入物系统的信号处理设备的多种功能块,其使用根据本发明实施例的双耳间相干分析模块。图18示出了如在图17中所示的双侧耳蜗植入物系统的一侧的更多的细节,且图19示出了如在图17中所示的双侧耳蜗植入物系统中的信号处理方法中的多种逻辑步骤。

用于每个听力植入物的至少一个感测麦克风1700和1701构造为用于感测此听力植入物的声音环境,以建立相应的输出麦克风信号。用于每个听力植入物的滤波器组1710和1711构造为处理麦克风信号,以生成此听力植入物的带通信号,步骤1901。每个带通信号通过特征时间精细结构特征和反映带通信号的时变幅度的特征带通包络表示了音频频率的相关的频带。带通信号由滤波器组1710和1711输出到刺激定时和编码模块1720和1721。

至少一个双耳间相干性分析模块1740构造为从每个听力植入物接收包括左/右麦克风信号和左/右带通信号的输入信号。双耳间相干性分析模块1740构造为分析输入信号以输出双耳间相干信号,步骤1902,所述双耳间相干信号表征输入信号的与混响相关的相似性。例如,双耳间相干性分析模块1740可将如在faller2004中描述的双耳间相干信号计算为归一化互相关函数的最大值,然后将其缩放到[0,1]的范围内,其中1表示最大的双耳间相干性。

在特定实施例中,可存在单一的双耳间相干性分析模块1740,所述双耳间相干性分析模块1740构造为产生两个听力植入物的双耳间相干信号。例如,单一的双耳间相干性分析模块1740可位于远程中继装置中,所述远程中继设备通信地耦合到双侧耳蜗植入物系统的左侧和右侧。在此情况下,输入信号被发送到远程中继装置,所述远程中继装置计算双耳间相干信号的值,然后将其传送回刺激定时和编码模块1720和1721。或者,对于每个听力植入物都可存在特定的双耳间相干分析模块1740,在此情况中左侧和右侧是对称的,且每个双耳间相干性分析模块1740可独立地计算耳间相干信号。如果左侧和右侧(直接或通过远程中继站)之间的通信受到损害或停用,则每个侧植入物可以继续独立运行。

关注图18,至少一个双耳间相干性分析模块1740可构造为特别地包括信号开关1810,所述信号开关1810选择输入信号中的一个或多个,即左/右麦克风信号和左/右带通信号,以将所选择的内部输入信号提供到互相关模块1820内,所述互相关模块1820计算输入信号的互相关函数。可动态地控制信号开关1810(例如,基于听觉场景分析(asa)系统的瞬时输出,所述系统构造为将声音环境识别为安静、噪声中的语音、没有语音、音乐等环境…)。或者,可在用户装配过程期间设置信号开关1810。信号开关1810在左右两侧应相同,且应在每一侧选择相同的输入信号。对侧输入信号经由tx/rx块1830到达另一侧。替代地,在一些实施例中可能不存在信号开关1810,且任一个输入信号(多个输入信号)可直接提供到互相关模块1820内(再次使用双侧系统每侧上相同的设计)。

刺激定时和编码模块1720构造为用于使用包络检测器1722(且另一侧为1723)和精细结构检测器1724(且另一侧为1725)处理带通信号,以建立通向脉冲生成器1730的输出刺激定时信号。例如,包络检测器1722可使用带通信号的整流和低通滤波来提取带通包络。且精细结构检测器1724可构造为包括过零检测器1840和脉冲编码模块1850,所述脉冲编码模块1850构造为使用fsp创建刺激定时信号,所述fsp通过通道特定采样序列(csss)传送一个或多个所选的带通通道的精细时间结构,所述通道特定采样序列(csss)在所选的带通信号的负到正过零处开始。用于每个听力植入物的脉冲生成器1730和1731构造为用于处理刺激定时信号,以建立用于听力植入物的电极刺激信号以作为声音被感知。

刺激定时和编码模块1720进一步构造为根据来自至少一个双耳间相干性分析模块1740的双耳间相干信号选择刺激编码策略,步骤1903。也就是,从多个不同的刺激编码策略选择一个特定刺激编码策略,所述不同的刺激编码策略包括基于带通包络的基于包络的刺激编码策略(例如,cis)和基于时间精细结构特征的基于事件的刺激编码策略(例如,csss)。例如,刺激定时和编码模块1720可构造为当双耳间相干信号高时选择基于事件的刺激编码策略,且当双耳间相干信号低时选择基于包络的刺激编码策略。刺激定时和编码模块1720的脉冲执行模块1726(且在另一侧为1727)然后使用所选择的刺激编码策略来产生通向脉冲生成器1730的刺激定时信号输出,步骤1904,脉冲生成器1730产生用于电极触点的电极刺激信号,步骤1905。例如,可根据双耳间相干信号调整csss刺激参数,然后以带通包络来缩放定时序列,且执行患者特定的刺激幅值映射。在来自至少一个双耳间相干性分析模块1740的双耳间相干信号随输入麦克风信号的性质改变而随时间变化时,刺激定时和编码模块1720根据作为结果的双耳间相干信号的改变来切换所选择的刺激编码策略。

以不同的刺激编码策略可强调时间精细结构。例如,csss可在双耳间相干高时构造为带有短脉冲间隔(ipi)双脉冲(如us2016/0101285中所述,在此通过引用将其完整合并),且在双耳间相干低时构造为带有单脉冲或带有具有长脉冲间隔的序列。

在一些实施例中,可存在根据双耳间相干信号的、从基于事件的处理到基于包络的处理过渡的时段。可根据双耳间相干信号来进行平滑过渡(类似于如上所述snr调整的包络采样),而非snr(或包络),双耳间相干的量将控制在带通信号过零时施加的csss序列的长度:在相干高时,过零将以单脉冲或双脉冲编码。随着相干性的降低,csss序列的长度将增加,从而导致从精细结构处理到cis处理的平滑过渡。

图20-22示出了根据双耳间相干信号的从基于事件的fsp编码到基于包络的cis编码的此过渡时段的示例。这些图示出了在200hz至325hz之间的频率范围内元音“a”的带通信号的部分。带通信号是变化的正弦波信号,希尔伯特包络跟随带通信号的峰值,且垂直尖峰条代表施加的csss定时序列。通过双耳间相干信号的值的控制,css序列的长度增加,所述值在1(图20)至0.5(图21)至0(图22)之间。

强调带通信号的相干部分的其他方法也是有可能的,例如刺激幅值的增加、刺激持续时间的增加或刺激极性模式的改变(例如,从双极改变为三极)。

本发明的实施例可部分地以任何传统的计算机编程语言实现,例如vhdl,systemc,verilog,asm等。本发明的替代实施例可实施为预编程的硬件元件,其他相关组件,或者作为组合的硬件和软件组件。

实施例可以部分地实现为与计算机系统一起使用的计算机程序产品。这种实现可包括一系列固定在有形介质上的计算机指令,所述有形介质例如为计算机可读介质(例如,磁盘,cd-rom,rom或固定磁盘),或可通过调制解调器或其他接口设备传输到计算机系统,例如通过经由介质连接到网络的通信适配器。介质可以是有形介质(例如,光学或模拟通信线路)或使用无线技术(例如,微波,红外或其他传送技术)实现的介质。所述计算机指令系列体现了此前关于所述系统描述的全部或部分功能。本领域一般技术人员应该理解的是此计算机指令可以以许多编程语言编写,以与许多计算机体系结构或操作系统一起使用。此外,此指令可存储在任何存储器设备中,例如半导体、磁性、光学或其他存储器设备,且可使用任何通信技术传送,例如光学、红外、微波或其他传送技术。预期此计算机程序产品可作为可移动介质分发,其具有附带的印刷或电子文档(例如,收缩包装的软件),其预装有计算机系统(例如,在系统rom或固定盘上),或从服务器或电子公告板通过网络(例如,因特网或万维网)分发。当然,本发明的一些实施例可实施为软件(例如,计算机程序产品)和硬件的组合。本发明的其他的实施例实现为完全硬件或完全软件(例如,计算机程序产品)。

虽然已公开了本发明的多种示例性实施例,但对于本领域一般技术人员显见的是,在不脱离本发明的真实范围的情况下,可进行将实现本发明的一些优点的各种改变和修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1