用于听力植入物的SNR调整的包络采样的制作方法

文档序号:13740393阅读:296来源:国知局
用于听力植入物的SNR调整的包络采样的制作方法

本申请要求2015年6月11日提交的美国临时专利申请62/174,003以及2015年9月8日提交的美国临时专利申请62/215,187的优先权,所述两个申请通过援引整体并入本文。

本发明涉及用于听力植入物的信号处理装置,更具体地涉及自动转换用于耳蜗植入物的语音编码策略。



背景技术:

如图1中所示,声音由人耳从外耳101传送到鼓膜(耳膜)102,鼓膜102移动中耳103的骨头(锤骨,砧骨和镫骨)使耳蜗104的卵圆形窗口和圆形窗口振动。耳蜗104是绕耳蜗轴螺旋地卷曲约两周半的充满流体的长管道。耳蜗包括通过耳蜗管连接的称为前庭阶的上通道和称为鼓阶的下通道。耳蜗104形成具有称为耳蜗轴的中枢的直立螺旋锥体,听神经113的螺旋神经节细胞位于其中。响应于由中耳103传送的所接收的声音,耳蜗104充当换能器以生成传到蜗神经113并最终传到大脑的电脉冲,大脑将神经信号感知为声音。

当沿耳蜗104的神经基质将外部声音转换成有意义的动作电位的能力有问题时,听力受损。为了改善受损听力,已经开发出听觉假体。在一些情况下,听力障碍可以通过耳蜗植入物(ci),脑干、中脑或皮质植入物来解决,该植入物通过沿着植入电极分布的多个电极触点传递的小电流来电刺激听觉神经组织。对于耳蜗植入物,电极阵列被插入到耳蜗104中。对于脑干、中脑和皮质植入物,电极阵列分别位于听觉脑干、中脑或皮质。

图1示出了典型的耳蜗植入系统的一些部件,其中外部麦克风向实现各种已知信号处理方案之一的外部信号处理器111提供音频信号输入。例如,在耳蜗植入物领域众所周知的信号处理方法包括连续交织采样(cis)数字信号处理、通道特定采样序列(csss)数字信号处理、谱峰(speak)数字信号处理、精细结构处理(fsp)和压缩模拟(ca)信号处理。

经处理的信号被外部信号处理器111转换成数字数据格式,例如数据帧序列,以由外部线圈107发送到接收的刺激处理器108中。除了提取音频信息外,刺激处理器108中的接收处理器可以执行诸如纠错、脉冲形成等附加信号处理,并产生通过电极引线109发送到植入的电极阵列110的刺激模式(基于提取的音频信息)。通常,电极阵列110在其表面上包括提供耳蜗104的选择性电刺激的多个刺激触点112。

诸如语音或音乐之类的音频信号可以被处理成多个频率带通信号,每个信号在包络内具有信号包络和精细时间结构。如wilsonb.s.,finleyc.c.,lawsond.t.,wolfordr.d.,eddingtond.k.,rabinowitzw.m.,"betterspeechrecognitionwithcochlearimplants,"nature,vol.352,236-238(july1991)中所述,一种常见的语音编码策略称为“连续交织采样策略”(cis),该文献在此援引加入。cis语音编码策略以预定的时间间隔对信号包络进行采样,仅通过对语音信号的信号包络进行编码来提供显着的语音理解水平。这可以部分地由听觉神经元锁相到调幅电脉冲序列的事实来解释(参见,例如,middlebrooks,j.c.,“auditorycortexphaselockingtoamplitude-modulatedcochlearimplantpulsetrains,”jneurophysiol,100(1),p.76-912008,2008july,在此援引加入)。

然而,对于正常的听力对象,信号线索、包络线和最终时间结构都是重要的(参见,例如,zengf.,niek.,stickneyg.,kongy.,“auditoryperceptionwithslowly-varyingamplitudeandfrequencymodulations,”in:d.pressnitzer,a.decheveign′e,s.mcadams,andl.collet,“auditorysignalprocessing:physiology,psychoacoustics,andmodels,springerverlag,newyork,pp.237-243,2004,该文献在此通过援引加入本文)。

较老的语音编码策略主要对缓慢变化的信号包络信息进行编码并且不传送信号的精细时间结构。较新的编码策略,例如精细结构处理(fsp),也传输精细的时间结构信息。在fsp中,通过通道特定采样序列(csss)传输低频通道的精细时间结构,通道特定采样序列(csss)开始于相应带通滤波器输出的负到正过零点(参见美国专利6,594,525,援引并入本文)。fsp的基本思想是应用刺激模式,其中保留了与滤波器通道的中心频率的特定关系,即,中心频率在刺激模式的时间波形中被表示出来,不像cis中一样被完全去除。每个刺激通道与一个特定的csss相关联,该csss是一系列超高速双相脉冲(通常为5-10kpps)。每个csss具有不同的长度(脉冲数量)和独特的幅度分布。csss的长度可以例如从相关带通滤波器的中心频率导出。与较低滤波器通道关联的csss比与较高滤波器通道关联的csss要长。例如,它可以是中心频率周期的一半。幅度分布可以根据患者的具体要求进行调整。

为了说明,图2a-2b示出了6通道系统的csss的两个示例。在图2a中,csss是通过对频率等于带通滤波器的中心频率(中心频率为440hz,696hz,1103hz,1745hz,2762hz和4372hz)的正弦曲线的周期的一半采样而导出。通过双相脉冲以10kpps的速率和25μs的相位持续时间实现采样。对于通道5和通道6,中心频率周期的一半太短而不能为多于一个的刺激脉冲提供空间,即,“序列”分别仅由一个脉冲组成。可以利用其他幅度分布。例如,在图2b中,该序列通过对频率为带通滤波器的中心频率的一半的正弦曲线的四分之一进行采样而导出。这些csss的持续时间分别与图2a中的csss大致相同,但幅度分布是单调增大的。这样的单调分布可能是有利的,因为序列中的每个脉冲理论上都可以在前面的脉冲不能达到的位置上刺激神经元。

图3示出了fsp编码策略的典型信号处理实施方式。音频信号首先借助带通滤波器301的滤波器组被分成频谱带。然后这些频谱带中的每一个由过零检测器303进一步处理,过零检测器303检测每个频谱带的负到正过零点。在其各自的带通滤波器输出的负到正过零开始时插入csss305。包络检测器307提供带通时间信号的包络,该带通时间信号包括未分辨的谐波,并且用谐波的差音(主要是基频f0)进行调制。当用这些包络对csss刺激脉冲加权309时,所得到的脉冲主要以f0进行不希望的幅度调制。这也适用于被设计成除幅度线索外还传输精细时间结构的频带。



技术实现要素:

本发明的实施例涉及用于听力植入系统中的信号处理的系统和方法,所述听力植入系统具有植入式电极阵列,所述植入式电极阵列具有用于将电极刺激信号递送到相邻听觉神经组织的多个刺激触点。带通滤波器组配置成用于处理音频输入信号以生成多个带通信号,所述带通信号表征音频输入信号中的相关音频频带。植入物信号处理器配置成用于处理带通信号以生成电极刺激信号。该处理包括:i.监测音频输入信号的关键特征特性,ii.当所述关键特征小于或等于初始值时,使用原始编码策略来生成所述电极刺激信号,以及iii.当关键特征大于或等于编码改变值时,使用不同的新编码策略来生成电极刺激信号。植入物信号处理器配置成在植入物信号处理器自适应地改变原始编码策略以变成新的编码策略的过渡时间段期间自动地从原始编码策略转换到新的编码策略。

在特定实施例中,编码策略之一可以是基于事件的编码策略,而另一编码策略是基于包络的编码策略。附加地或替代地,编码策略之一可以使用自适应刺激脉冲率,而另一编码策略使用恒定刺激率。例如,植入物信号处理器可以配置成使用基于通道特定采样序列(csss)的自适应刺激脉冲率,并自适应地增加csss脉冲序列长度以转变为恒定刺激率编码策略。或者,植入物信号处理器可以配置成使用不施加脉冲的时间间隔来转变为恒定刺激率编码策略。

植入信号处理器具体可以配置成在关键特征从初始值改变到编码改变值的同时或之后自动转换。关键特征可以是音频输入信号的信噪比(snr)或音频输入信号的直接混响比(drr)。

附图说明

图1示出了人耳的解剖结构和典型耳蜗植入系统的一些部件。

图2示出了利用10kpp/s的双相脉冲和25μs的相位持续时间的两个6通道系统的通道特定采样序列(csss):

a.从[0-π]内的正弦曲线导出,

b.从[0-π/2]内的正弦曲线导出,振幅单调增大。

图3示出了现有技术的精细结构处理(fsp)信号处理装置中的各种功能块。

图4示出了根据本发明实施例的编码修改信号处理装置中的各种功能块。

图5示出了使用snr作为csss的关键特征的本发明的特定实施例中的各种功能块。

图6示出了经处理的带通信号和所得到的高斯噪声增加且snr=10db的元音的csss脉冲序列的示例。

图7示出了与图6中相同的信号,其中snr=5db。

图8示出了与图6中相同的信号,其中snr=0db。

图9示出了根据本发明实施例的经处理的带通信号和snr适应的脉冲时间间隔的示例。

具体实施方式

给定的耳蜗植入物信号编码策略的参数可能不是对所有听音条件都最佳。例如,在嘈杂的条件下,一些编码策略可能比其他编码策略更好地执行,因为时间精细结构通常比带通信号包络更受噪声影响。根据听音条件,从一种编码策略切换到另一种编码策略是有益的。切换可以小增量执行,以便从一种编码策略到另一种编码策略的转换平缓发生。音频输入信号被监测和分析以估计所存在的一个或多个关键特征。基于(多个)关键特征,信号编码策略被自动修改。

作为关键特征的示例,可以估计音频输入信号的信噪比(snr)。假设在相对安静的听音条件下传送输入信号的时间精细结构的基于事件的编码策略(例如med-el的fsp)是最佳的,而基于包络的编码策略(如med-el的hd-cis)在嘈杂条件下更好。通过修改用于输出刺激脉冲的通道特定采样序列(csss)的长度和形状,可以基于音频输入信号的snr从fsp到hd-cis自动进行平滑过渡。

图4示出了用于听力植入系统的一般编码修改信号处理布置中的各种功能块,其具有植入式电极阵列,该植入式电极阵列具有用于将电极刺激信号递送至相邻听觉神经组织的多个刺激触点。植入物信号处理器400使用fsp方法并且包括关键特征估计模块401,该关键特征估计模块401监测反映当前听觉环境的音频输入信号中的一个或多个关键特征。常规带通滤波器组402处理音频输入信号以生成多个带通信号,每个带通信号表征音频输入信号中的音频频率的相关频带。

特征提取模块403处理来自带通滤波器组402的带通信号以提取带通包络线和精细结构时间信息,并根据原始编码策略生成用于刺激触点的初始刺激脉冲组。例如,原始编码策略可以是基于事件的编码策略,诸如根据带通信号中的精细结构信息使用自适应刺激速率的fsp。

编码参数模块405监测来自关键特征估计模块401的关键特征,并且只要关键特征的值小于或等于某个给定的初始值,则编码修改块404传递根据原始编码策略由特征提取模块403产生的刺激脉冲。在关键特征大于或等于编码改变值的某点处,编码参数模块405控制编码修改块404开始调整刺激脉冲,以在过渡时间段内自适应地改变初始编码策略,自动地过渡到新的编码策略。例如,新的编码策略可以是以恒定刺激率使用刺激脉冲的基于包络的编码策略,例如cis或hd-cis。植入物信号处理器400可以具体配置成在关键特征从初始值改变到编码改变值的同时或之后自动转变。然后,非线性映射模块406使用提供患者特定缩放和数据流生成的非线性映射来调整输出刺激脉冲的幅度。

图5示出了本发明实施例中的各种功能块,其中植入物信号处理器500使用snr作为csss脉冲序列的关键特征。snr估计模块501监测输入信号中的一个或多个关键特征,而带通滤波器组502处理音频输入信号以生成带通信号。过零检测器506检测每个带通信号的负到正过零点(时间精细结构信息)。通道特定序列模块507在每个带通信号的负到正过零点开始时创建csss输出定时请求脉冲,而特征提取模块503得出带通信号包络。脉冲加权模块504利用带通包络对csss刺激脉冲进行加权(幅度调制),然后由提供患者特定缩放和数据流生成的非线性映射模块505进一步调整。

在来自过零检测器506的每个过零触发事件处,通道特定序列模块507确定csss脉冲序列的事件特定长度(“fl间隔”)。脉冲加权模块504对csss脉冲序列进行整形以符合带通包络幅度,从而使用csss序列对带通包络进行采样。当来自snr估计模块501的snr信号相对较高时(安静的声音环境),通道特定序列模块507调整fl间隔使其非常短,以致csss脉冲序列可以由少至一个单脉冲构成。随着来自snr估计模块501的snr信号下降(环境变得更嘈杂),通道特定序列模块507增大fl间隔并向csss序列增加更多脉冲,直到某一时刻,对于低snr(高噪声),csss序列的最后一个脉冲无缝衔接下一csss序列的第一脉冲,导致对来自特征提取模块503的带通包络连续(恒定速率)采样。如果fl间隔的长度变得比两个连续触发事件(即,两个过零点)之间的时间更长,那么通道特定序列模块507可在下一个触发事件发生时终止现有csss序列,随后的触发事件的fl间隔覆盖前一fl间隔。或者通道特定序列模块507可继续使用由第一触发事件启动的csss脉冲序列并忽略后续触发事件,使得现有fl间隔结束时,确定新的fl间隔。一旦来自snr估计模块501的snr信号再次增大,通道特定序列模块507自适应地调整fs间隔以使其再次变得比触发事件之间的时间更短。

图6示出了经处理的带通信号和高斯噪声增大且snr=10db的元音所得的csss脉冲序列的示例。带通信号是深灰色的频率较高的全正弦波信号,希尔伯特(hilbert)带通包络是浅灰色的较慢变化的半正弦波轨迹,并且垂直黑线表示所施加的序列长度为一的csss序列。图7示出与图6中相同的信号,其中snr信号降低至5db(更大噪声)和fl间隔增大以使得csss序列分别包含三个脉冲。图8示出与图6中相同的信号,其中snr=0db(仍然噪音更大)而fl间隔很长以至于csss序列执行带通包络的连续采样,与hd-cis编码策略类似。

对于自适应地改变csss间隔的长度的附加或替代,其他具体实施例可自适应地控制其他信号变量。例如,结合特定事件(例如过零事件)中csss脉冲的施加,随后的时间间隔——fs间隔——可确定成其中必须施加一个脉冲。该fs间隔的长度可以由已施加信号的当时的snr信号的值确定:如果snr高,则fs间隔可被选择为长,而如果snr低,则fs间隔可被选择为短。为了将刺激率限制为反映听觉神经纤维的不应期的最大值,可以限定响应于最大刺激率的尽可能短的fs间隔。有几种不同的具体可能性:

·如果在从前一定时事件确定的fs间隔内发生另一定时事件,并且两个定时事件之间的时间比不应期长,则可以在第二个定时事件和替代前一fs间隔的新的fs间隔启动时施加一个脉冲。

·如果在从前一定时事件确定的fs间隔内发生另一定时事件,但两个定时事件之间的时间比不应期短,则可以在不应期结束和替代前一fs间隔的新的fs间隔启动时施加一个脉冲。

·如果没有附加定时事件在当前fs间隔结束之前出现,并且不应期比fs间隔短,则可以在fs间隔结束时(强制)施加另一脉冲。

·如果没有附加定时事件在当前fs间隔结束之前出现,但不应期比fs间隔大,则可以在不应期结束时(强制)施加另一脉冲。

通常,一个实施例可要求,只能在最小周期(例如不应期)结束后施加后续脉冲(由发生定时事件引起或者由fs间隔结束引起)。在一些应用中,周期比作为最小周期的不应期更短是有利的。

图9示出了根据本发明的实施例的经处理的带通信号和snr调节的脉冲时间间隔的示例。在图9中,假设检测到五个过零定时事件e1-e5(垂直实线),那么snr随着时间t正在减少(即,从左至右),并且不应期由穿过附图底部的标识为“不应时间”的相应水平箭头示出。第一csss脉冲是,但不限于,在过零点事件e1施加。由于snr较高,相应的fs间隔i_1相对较长。下一个过零点事件e2发生在fs间隔i_1结束之前,所以下一个csss脉冲在e2施加,i_2和e3是相同的情况,尽管snr已同时减小以使得i_2比i_1短。然而,在发生于fs间隔i_3结束时的事件e3'处,强制发生一个csss脉冲,因为过零事件e3之后开始的该fs间隔内没有发生更多过零(以及不应时间(e3之后)仍比i_3短)。下一个过零事件发生在e4,但是这仍然是在e3'的最后施加的脉冲之后的不应期内,所以e4处没有施加脉冲也不确定任何对应的fs间隔。类似地,在e5没有施加脉冲,并且另外,在e4'的snr非常低,从而确定相应的fs间隔i_5比不应期短,使得在e5'不施加脉冲而是将脉冲推迟到对应于事件e4'后不应期结束时的e5"。

当snr后来增加越来越多时(未示于图9),fs间隔将再次越来越长,直至不应时间结束之后但fs间隔结束之前检测到过零事件。从这一点开始,过零事件将再次确定脉冲序列和编码策略符合已知的基于事件的编码策略,直到snr再次降低。最大刺激率可以设定为与可能的最小时间间隔(例如,不应期)的倒数成比例,从而使瞬时刺激率(其等于1/fs间隔)不能超过一个给定的限定值;例如,作为目前用于cis或hd-cis编码策略的典型速率。通常,snr越低,所得到的声音编码序列将越多地根据基于包络的编码策略,例如cis或hd-cis(用限定的最大刺激率以规定的方式对每个通道恒定采样)。snr越高,所得到的声音编码序列将越可能根据纯基于事件的编码策略,例如fsp。

当从一个特定的编码策略切换到另一个特定的编码策略时,mcl和thr值可以变化,因此还应当调整患者特定的缩放函数的mcl和thr值(除了csss序列之外)以促进不同编码策略之间的响度平衡的转换。

csss序列的修改也可以通过通道来完成,即基于通道特定的snr值。虽然以上描述了snr是用于后续自适应修改的参数,但是也可以使用表征现有听力情况的质量的其他特定信号参数;例如直接混响比(drr)。

两种方法——csss的长度变化和确定其中不施加脉冲的时间间隔——产生类似的总体结果:基于事件的(可变速率)编码策略和基于包络(恒定速率)编码策略之间的平滑过渡。本发明的实施例使声音编码策略通过为每种环境提供最佳设置适应声音环境的变化。通过snr调整的采样,在不受干扰的情况下提供时间精细结构,而声音编码无缝地变形为更耐噪声的包络编码,用于在噪声环境中获得更好的声音感知。

本发明的实施例可以部分地以任何常规的计算机编程语言(例如,vhdl、systemc、verilog、asm等)实现。本发明的替代实施例可以实现为预编程的硬件元件、其他相关组件、或硬件和软件组件的组合。

实施例可以部分地实现为用于与计算机系统一起使用的计算机程序产品。这样的实施方式可以包括一系列的计算机指令,其固定在诸如计算机可读介质(例如,软盘、cd-rom、rom、或硬盘)的有形介质上,或者可以经由调制解调器或诸如通过媒介连接到网络的通信适配器的其它接口设备传输到计算机系统。该媒介可以是有形媒介(例如,光学或模拟通信线路)或利用无线技术(例如,微波、红外或其他传输技术)实现的媒介。所述一系列计算机指令关于系统实现这里之前描述的全部或部分功能。本领域技术人员应当理解,这样的计算机指令可以以用于许多计算机架构或操作系统的多种编程语言来编写。此外,这样的指令可以存储在诸如半导体、磁、光或其他存储设备的任何存储设备中,并且可以使用诸如光、红外、微波、或其他传输技术的任何通信技术来传输。预计这样的计算机程序产品可以作为带有印刷或电子文档的可移动媒体分发(例如,塑封软件),通过计算机系统预装载(例如,在系统rom或硬盘上),或者通过网络(例如,互联网或万维网)从服务器或电子布告栏分发。当然,本发明的一些实施例可以实现为软件(例如,计算机程序产品)和硬件二者的组合。本发明的其他实施方式实现为纯硬件,或纯软件(例如,计算机程序产品)。

尽管已经公开了本发明的各种示例性实施例,但是对于本领域技术人员来说显而易见的是,可以做出将实现本发明的一些优点的各种改变和修改而不脱离本发明的真实范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1