人工电子耳蜗以及一种双刺激速率言语处理方法

文档序号:1180946阅读:387来源:国知局
专利名称:人工电子耳蜗以及一种双刺激速率言语处理方法
技术领域
本发明涉及助听设备技术领域,尤其涉及一种人工电子耳蜗、一种言语处理器以
及一种双剌激速率言语处理方法。
背景技术
人的耳蜗毛细胞是接受声音的感觉细胞。当耳蜗毛细胞损伤严重时,就会出现严重的听力损伤。人工耳蜗就是替代已损伤毛细胞,通过电剌激听觉神经重新获得声音信号的一种电子装置。图l显示的是人工耳蜗的工作模式图。人工耳蜗由体外和体内装置两部分组成,体外部分包括麦克风、言语处理器、发射线圈;体内的部分包括接收线圈、处理器、剌激电极及参照电极组成。 如图2所示,麦克风接受声信号,通过言语处理器,将声信号进行数字编码等处理,通过头件跨皮肤传送到植入人体内的接收线圈,再经过剌激器的解码处理后,产生相应频率及电流强度的脉冲信号并传送到各个剌激电极,通过电极剌激听神经,将脉冲信号传到听觉中枢从而产生听觉。 其中,言语处理器是整个系统最重要的一个组成部分。言语处理器会决定声学信号如何转换成电信号。目前言语处理器采用连续间隔采样处理策略(CIS策略;Wilson etal, 1991)或者波谱峰值采样策略(例如SPEAK或者ACE策略)。 连续间隔采样处理策略是目前人工耳蜗系统最常用的言语处理策略之一。使用连续间隔采样处理策略的言语处理器,首先把采集的语音信号通过特定数目的带通滤波器,再使用半波整流以及低通滤波器的方法提取出每个通道的包络幅度;再使用一个非线性函数(例如,对数)将每个通道的包络幅度转换到适合患者电剌激的电流幅度并剌激一个对应的电极。 —般来说,频谱的精度是通过剌激电极的数目来决定的,而时域的精度是通过剌激速率来决定的。越多的剌激电极就可以提供更好的频谱精度,而更快的剌激速率可以提高语音信号的采样率。 使用波谱峰值采样策略的言语处理器,与使用连续间隔采样处理CIS策略的言语处理器一样,使用波谱峰值采样策略的言语处理器,首先把采集的语音信号通过特定数目的带通滤波器(例如SPEAK策略中使用20个),再使用半波整流以及低通滤波器的方法提取出每个通道的包络幅度;再比较所有通道的包络幅度的大小,选择具有最大包络幅度的几个通道(一般6-8个);之后,再把这些选择出的包络幅度用非线性函数转换成适合患者电剌激的电流幅度并剌激相对应的电极。 在人工耳蜗言语处理中,语音包络信号一般是在每一个频段利用半波整流和低通滤波的方法来提取的。在包络提取滤波器的截止频率和剌激速率限制了能传输给植入电极的时间波动信号。许多研究结果表明,缓慢变化的包络信号(小于20赫兹)对人工耳蜗患者以及具有正常听力的听者提供了言语理解最有用的语音信息。最近的研究结果也表明,比较高频(50-500赫兹)的时间波动信号对超音段信息的识别有很重要的作用,特别是讲
4话者性别识别或者声调识别。 许多研究对人工耳蜗患者的言语理解能力与他们检测时域波动能力进行了比较。结果表明,人工耳蜗患者之间调制检测能力有很大的差异。对一些人工耳蜗患者来说,他们检测幅度调制的能力与具有正常听力的人没有太大的差别。然而对其他一些人工耳蜗患者来说,他们检测幅度调制的能力比具有正常听力的人差很多。 研究结果进一步还显示,人工耳蜗患者在不同的响度下平均的幅度调制检测能力与他们的语音识别能力有非常高的相关性。最近的数据还显示,虽然剌激速率在中等或者比较高的剌激响度下对幅度调制检测并没有太多的影响。但是在比较低的响度下,剌激速率对幅度调制检测阈值有很大的影响。但是在比较低的响度下,人工耳蜗患者在低剌激速率下(例如250赫兹)下的幅度调制检测能力比在高剌激速率下(例如2000赫兹)下的幅度调制检测能力好很多。 因而,上述结果表明,具有较高包络幅度的通道使用高剌激速率可以使患者获取最多的信息(高采样率和较好的幅度调制检测能力)。然而,在包络幅度较小的通道,高剌激速率下所引起的较差幅度调制检测能力使人工耳蜗患者并不能有效地感知高频周期信号或者重要的低幅度包络信号。 在这种情况下,在包络幅度较小的通道,具有较好幅度调制检测能力的较低剌激速率更为可取。这种在幅度调制检测能力的优势也可以让人工耳蜗患者在比较嘈杂的背景噪声下更好地提取相对较弱的时域包络信号(大部分的噪声信号被映射到动态范围的较低部分)。
目前使用的CIS策略和ACE策略具有一定的局限性。 图3所示的是目前使用的CIS处理方法的示意图。对CIS策略来说,所有通道的频谱信息可以有效地传送。缺点是如果总的剌激速率有限(例如20千赫兹),每个通道的剌激速率会偏低(以24通道为例,每个通道的剌激速率是833赫兹)。即使总的剌激速率可以提高,包络幅度较低的通道如果使用与高包络幅度的通道同样的高速率剌激也不是很理想,因为高剌激速率下所引起的较差幅度调制检测能力使人工耳蜗患者并不能有效地感知高频周期信号或者重要的低幅度包络信号。 图4所示的是目前使用的ACE处理方法的示意图。对ACE策略来说,即使是总的剌激速率有限,高包络幅度的通道信息也可以有效地传送给人工耳蜗患者(总剌激速率20千赫兹,10个峰值,每个剌激通道的速率可以达到2千赫兹)。但是,ACE策略把有一些重要的低幅度包络信息丢失了 。这可能使人工耳蜗患者在比较嘈杂的背景噪声下并不能有效提取相对较弱的时域包络信号(大部分的噪声信号被映射到动态范围的较低部分)。

发明内容
本发明所要解决的技术问题在于,提供一种人工电子耳蜗、一种双剌激速率言语处理方法以及对应的言语处理器,用于解决现有人工电子耳蜗中言语处理器对高、低剌激频率不能兼顾从而造成患者使用人工电子耳蜗时造成的信息丢失或含混不清等问题。
为解决上述技术问题,本发明提供一种双剌激速率言语处理方法,应用在人工电子耳蜗中 对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅
5度,并将电流幅度调整至工作幅度范围; 选取包络幅度大于或等于阈值的多个通道组成第一部分(高幅度)通道,对第一部分通道采用第一(高)剌激速率的脉冲序列调制; 选取包络幅度小于阈值的多个通道组成第二部分(低幅度)通道,对第二部分通道采用第二(低)剌激速率的脉冲序列调制; 采用调制后的第一、第二部分通道的电脉冲序列剌激对应的剌激电极。 进一步,较佳地,所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由
大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。 较佳地,所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道数,第一剌激速率可以在500赫兹至5000赫兹之间选择。 较佳地,所述第二剌激速率是250赫兹。根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫兹之间选择。 本发明还提供一种人工电子耳蜗,包括言语处理器,所述言语处理器包括预处理模块、带通滤波模块、半波整流模块、低通滤波模块、幅度调整模块、短时包络幅度比较器、脉冲调制模块,其中, 预处理模块对输入语音信号进行预处理后,由带同滤波模块进行带通滤波,再由半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器; 短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道; 脉冲调制模块,用于对第一部分通道采用第一剌激速率的脉冲序列调制,对第二部分通道采用第二剌激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于剌激对应的剌激电极。 所述阈值是固定值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。 所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道数,第一剌激速率可以在500赫兹至5000赫兹之间选择。所述第二剌激速率是250赫兹。根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫兹之间选择。 本发明还提供一种言语处理器,包括预处理模块、带通滤波模块、半波整流模块、
低通滤波模块、幅度调整模块、短时包络幅度比较器、脉冲调制模块,其中, 预处理模块对输入语音信号进行预处理后,由带同滤波模块进行带通滤波,再由
半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道
的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范
围发送至短时包络幅度比较器; 短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道; 脉冲调制模块,用于对第一部分通道采用第一剌激速率的脉冲序列调制,对第二部分通道采用第二剌激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲 序列应用于剌激对应的剌激电极。 所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道 数,第一剌激速率可以在500赫兹至5000赫兹之间选择。所述第二剌激速率是250赫兹。 根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫 兹之间选择。 本发明的人工电子耳蜗、一种双剌激速率言语处理方法以及对应的言语处理器, 采用了具有双剌激速率的连续间隔采样处理策略(DR-CIS, Dual-Rate CIS策略),DR-CIS 策略是一种全新的人工电子耳蜗的言语处理策略。通过应用DR-CIS策略,本发明实现了将 所有通道的包络幅度信息传送给人工电子耳蜗患者的目标,解决了 ACE策略中丢失低幅度 包络信息的问题。同时DR-CIS策略利用在较高包络幅度通道上的高剌激速率把对讲话者 性别识别或者声调识别比较重要的时域波动信号有效地传送给人工电子耳蜗患者。更重要 的是在较低包络幅度通道上使用比较低的剌激速率可以让人工电子耳蜗患者有效地感知 这些低幅包络信息,从而有效地提高人工电子耳蜗的言语识别效果。


图1是人工电子耳蜗的结构示意图; 图2是人工电子耳蜗的工作流程示意图; 图3是人工电子耳蜗使用CIS处理方法的示意图; 图4是人工电子耳蜗使用ACE处理方法的示意图; 图5是本发明采用双剌激速率方法的示意图; 图6是本发明的言语处理器的结构示意图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚,以下结合附图对本发明作进一步 地详细说明。 目前,ACE策略可提供较高剌激速率,但只剌激包络幅度较高的通道,丢失了一些 重要的低幅度包络信息。而CIS策略在总剌激速率有限的情况下只能提供较低的剌激速 率,导致时域信号(特别是对讲话者性别识别或者声调识别比较重要的时域波动信号)不 能有效地传送给人工电子耳蜗患者。 本发明针对目前人工电子耳蜗及人工耳蜗言语处理策略对较弱信号的处理能力 缺陷,采用双剌激速率的方法来克服目前言语处理策略所面临的局限性,优化人工耳蜗患 者的时域检测综合能力(时域采样精度和时域检测敏感度),从而提高人工耳蜗患者在动 态或者比较困难的聆听环境下的言语识别能力。 如图5所示,显示了本发明的一种双剌激速率言语处理方法,应用在人工电子耳 蜗中,该双剌激速率言语处理方法包括如下步骤 对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅 度,并将电流幅度调整至工作幅度范围; 选取包络幅度大于或等于阈值的多个通道组成第一部分(高幅度)通道,对第一部分通道采用第一(高)剌激速率的脉冲序列调制; 选取包络幅度小于阈值的多个通道组成第二部分(低幅度)通道,对第二部分通 道采用第二(低)剌激速率的脉冲序列调制; 采用调制后的第一、第二部分通道的电脉冲序列剌激对应的剌激电极。
其中,所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序 后,对应第一部分通道数目的序号所对应的包络幅度值。例如,在本实施例中,在24个通道 中,可以选取具有最大包络幅度的6个通道,采用高剌激速率(2000赫兹)的脉冲序列调 制,而对剩余的低幅度通道则用低剌激速率(250赫兹)的脉冲序列调。
利用本发明的双剌激言语处理方法,首先把采集的语音信号预处理,再通过特定 数目(24个)的带通滤波器;使用半波整流以及低通滤波器的方法提取出每个通道的包络 幅度;用非线性函数转换成适合患者电剌激的电流幅度,具体可采用压縮幅度的方式实现; 再利用短时包络幅度比较器来比较所有通道的包络幅度的大小,具有最大包络幅度的6个 通道用高剌激速率(2000赫兹)的脉冲序列调制,其他低幅度通道则用低剌激速率(250赫 兹)的脉冲序列调制;最后,再把各个通道调制后的电脉冲序列剌激相对应的电极(低频通 道剌激位于蜗顶的电极而高频通道剌激位于蜗底的电极)。 如图6所示,本发明的一种言语处理器,包括预处理模块601 、带通滤波模块602、 半波整流模块603、低通滤波模块604、幅度调整模块605、短时包络幅度比较器606、脉冲调 制模块607,其中, 预处理模块601对输入语音信号进行预处理后,由带同滤波模块602进行带通滤 波,再由半波整流模块603进行半波整流,由低通滤波模块604对整流后的信号进行低通滤 波后将每个通道的包络幅度发送至幅度调整模块605,幅度调整模块将每个通道的包络幅 度调整至工作幅度范围发送至短时包络幅度比较器606 ; 短时包络幅度比较器606,用于选取包络幅度大于或等于阈值的多个通道组成第 一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道; 脉冲调制模块607,用于对第一部分通道采用第一剌激速率的脉冲序列调制,对第 二部分通道采用第二剌激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉 冲序列应用于剌激对应的剌激电极。 所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道 数,第一剌激速率可以在500赫兹至5000赫兹之间选择。所述第二剌激速率是250赫兹。 根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫 兹之间选择。 基于上述言语处理器及言语处理方法,本发明还提供一种人工电子耳蜗,如图6 所示,包括言语处理器,所述言语处理器包括预处理模块601、带通滤波模块602、半波整 流模块603、低通滤波模块604、幅度调整模块605、短时包络幅度比较器606、脉冲调制模块 607,其中, 预处理模块对输入语音信号进行预处理后,由带通滤波模块进行带通滤波,再由 半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道 的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范 围发送至短时包络幅度比较器;
短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部 分通道,选取包络幅度小于阈值的多个通道组成第二部分通道; 脉冲调制模块,用于对第一部分通道采用第一剌激速率的脉冲序列调制,对第二 部分通道采用第二剌激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲 序列应用于剌激对应的剌激电极。 所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序后,对 应第一部分通道数目的序号所对应的包络幅度值。 所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道 数,第一剌激速率可以在500赫兹至5000赫兹之间选择。所述第二剌激速率是250赫兹。 根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫 兹之间选择。 具体实施时,预处理模块601把采集的语音信号预处理,再通过特定数目(24个) 的带通滤波模块602 ;使用半波整流模块603以及低通滤波模块604提取出每个通道的包 络幅度;幅度调整模块605用非线性函数转换成适合患者电剌激的电流幅度;利用短时包 络幅度比较器606来比较所有通道的包络幅度的大小,选择出具有最大包络幅度的6个通 道,脉冲调制模块607用高剌激速率(2000赫兹)的脉冲序列调制,脉冲调制模块607对其 他低幅度通道则采用低剌激速率(250赫兹)的脉冲序列调制;把各个通道调制后的电脉 冲序列剌激相对应的电极(低频通道剌激位于蜗顶的电极而高频通道剌激位于蜗底的电 极)。 以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人 员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、 等同替换、改进等,均应包含在本发明的权利要求范围之内。
9
权利要求
一种双刺激速率言语处理方法,其特征在于,在人工电子耳蜗中,对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅度,并将电流幅度调整至工作幅度范围;选取包络幅度大于或等于阈值的多个通道组成第一部分通道,对第一部分通道采用第一刺激速率的脉冲序列调制;选取包络幅度小于阈值的多个通道组成第二部分通道,对第二部分通道采用第二刺激速率的脉冲序列调制;采用调制后的第一、第二部分通道的电脉冲序列刺激对应的刺激电极。
2. 如权利要求1所述的双剌激速率言语处理方法,其特征在于,所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。
3. 如权利要求1所述的双剌激速率言语处理方法,其特征在于, 所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道数,第一剌激速率可以在500赫兹至5000赫兹之间选择。
4. 如权利要求1所述的双剌激速率言语处理方法,其特征在于,所述第二剌激速率是250赫兹。根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫兹之间选择。
5. 如权利要求1、3、4中任一项所述的双剌激速率言语处理方法,其特征在于,所述调制后的低频通道的电脉冲序列对应的剌激电极是位于蜗顶的电极。所述调制后的高频通道的电脉冲序列对应的剌激电极是位于蜗底的电极;
6. —种人工电子耳蜗,包括言语处理器,其特征在于,所述言语处理器包括预处理模块、带通滤波模块、半波整流模块、低通滤波模块、幅度调整模块、短时包络幅度比较器、脉冲调制模块,其中,预处理模块对输入语音信号进行预处理后,由带通滤波模块进行带通滤波,再由半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器;短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道;脉冲调制模块,用于对第一部分通道采用第一剌激速率的脉冲序列调制,对第二部分通道采用第二剌激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于剌激对应的剌激电极。
7. 如权利要求6所述的人工电子耳蜗,其特征在于,所述阈值是固定的包络幅度值;或者,所述阈值是对包络幅度由大到小排序后,对应第一部分通道数目的序号所对应的包络幅度值。
8 如权利要求6所述的人工电子耳蜗,其特征在于,所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道数,第一剌激速率可以在500赫兹至5000赫兹之间选择。所述第二剌激速率是250赫兹。根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫兹之间选择。
9. 一种言语处理器,其特征在于,包括预处理模块、带通滤波模块、半波整流模块、低通滤波模块、幅度调整模块、短时包络幅度比较器、脉冲调制模块,其中,预处理模块对输入语音信号进行预处理后,由带同滤波模块进行带通滤波,再由半波整流模块进行半波整流,由低通滤波模块对整流后的信号进行低通滤波后将每个通道的包络幅度发送至幅度调整模块,幅度调整模块将每个通道的包络幅度调整至工作幅度范围发送至短时包络幅度比较器;短时包络幅度比较器,用于选取包络幅度大于或等于阈值的多个通道组成第一部分通道,选取包络幅度小于阈值的多个通道组成第二部分通道;脉冲调制模块,用于对第一部分通道采用第一剌激速率的脉冲序列调制,对第二部分通道采用第二剌激速率的脉冲序列调制,并将调制后的第一、第二部分通道的电脉冲序列应用于剌激对应的剌激电极。
10. 如权利要求9所述的言语处理器,其特征在于,所述第一剌激速率是2000赫兹。根据系统总的速率和使用第一剌激速率的通道数,第一剌激速率可以在500赫兹至5000赫兹之间选择。所述第二剌激速率是250赫兹。根据系统总的速率和使用第二剌激速率的通道数,第二剌激速率可以在200赫兹至500赫兹之间选择。
全文摘要
本发明公开了一种人工电子耳蜗、一种言语处理器以及一种双刺激速率言语处理方法。本发明应用在人工电子耳蜗中,首先对语音信号经预处理、带通滤波、半波整流、低通滤波后获取每个通道的包络幅度,并将电流幅度调整至工作幅度范围;选取包络幅度大于或等于阈值的多个通道组成第一部分(高幅度)通道,对第一部分通道采用第一(高)刺激速率的脉冲序列调制;选取包络幅度小于阈值的多个通道组成第二部分(低幅度)通道,对第二部分通道采用第二(低)刺激速率的脉冲序列调制;采用调制后的第一、第二部分通道的电脉冲序列刺激对应的刺激电极。本发明实现了将所有通道的包络幅度信息传送给人工电子耳蜗患者的目标,有效地提高人工电子耳蜗的言语识别效果。
文档编号A61F11/04GK101773429SQ20101000051
公开日2010年7月14日 申请日期2010年1月11日 优先权日2010年1月11日
发明者傅前杰, 李亚杰, 陈宏斌 申请人:杭州诺尔康神经电子科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1