听力假体声音处理的制作方法

文档序号:14213703阅读:194来源:国知局
听力假体声音处理的制作方法

相关申请的交叉引用

本申请要求于2016年5月26日提交的第15/165,483号美国临时专利申请的优先权,其要求于2015年8月25日提交的第62/209,599号临时专利申请的优先权,每个申请的全部内容以其整体通过引用并入本文。



背景技术:

各种类型的听力假体为具有不同类型的听力损失的人们提供了感知声音的能力。一般而言,听力损失可以是传导性的、感觉神经性的,或者传导性和感觉神经性二者的一些组合。传导性听力损失通常是由于一般通过外耳、耳膜或中耳骨传导声波的任何机制中的功能障碍而导致的。感觉神经性听力损失通常是由于内耳中的功能障碍而导致的,包括将声音振动转换成神经信号的耳蜗,或可以处理神经信号的耳朵、听觉神经或大脑的任何其他部分。

示例性听力假体包括传统助听器、基于振动的听力设备、耳蜗植入物和听觉脑干植入物。作为声学刺激设备的传统助听器通常包括用于检测声音的小型麦克风,用于放大检测到的声音的特定部分的放大器、以及用于将放大的声音传送到人的耳道中的扬声器。

基于振动的听力设备(也是声学刺激设备)通常包括用于检测声音的麦克风、以及用于对应于检测到的声音直接对人施加振动的振动机构,从而引起人的内耳的振动。基于振动的听力设备包括例如骨传导设备、直接的声学耳蜗刺激设备或其他基于振动的设备。骨传导设备经由牙齿和/或头骨传送对应于声音的振动。所谓的中耳设备经由中耳(即,听骨链)传送对应于声音的振动,而不使用牙齿或头骨。直接声学耳蜗刺激设备经由内耳(即,耳蜗)传送对应于声音的振动,而不使用牙齿、头骨或中耳。

耳蜗植入物可以经由植入人耳蜗中的电极阵列来刺激人的听觉神经,从而为人提供感知声音的能力。耦合到耳蜗植入物的麦克风检测声波,该声波被转换成一系列电刺激信号,该电刺激信号经由电极阵列被传递到植入物接受者的耳蜗。听觉脑干植入物可以使用与耳蜗植入物类似的技术,但是听觉脑干植入物不是将电刺激施加到人的耳蜗,而是直接将电刺激施加到人的脑干,整个绕过耳蜗。用耳蜗植入物电刺激耳蜗中的听觉神经或者电刺激脑干可以使有听力损失的人感知到声音。

此外,一些人可以从结合了传统助听器、基于振动的听力设备、耳蜗植入物、或听觉脑干植入物中的两个或更多个特征(例如,两个或更多个刺激模式)的听力假体中获益,使得这个人能够感知声音。这种听力假体可以被称为双模式听力假体。还有其他人从两个听力假体中获益,每个耳朵一个听力假体(例如,针对具有两个耳蜗植入物的人的一般地所谓的双耳系统或双侧系统)。



技术实现要素:

针对听力假体的声音处理策略倾向于集中在语音上,因为对于典型的用户而言,这是最重要的方面。但是,为其他声音(诸如音乐)提供令人满意的表现也很重要。将传统的语音处理策略应用于音乐可能无法产生令人满意的结果。对于语音而言,相对较少的信息被需要,以至少能够达到一定程度的理解。相比之下,音乐可以具有许多同时发生的元素,所有这些元素都可以相互作用来产生调和的整体。音乐的这种复杂性不可以被常规的语音处理策略完全重现,并且将这种方法应用于音乐的结果不可以为用户创造令人满意的感知。因此,通常期望开发一种声音处理策略,其为听力假体的用户提供改善的音乐感知。

本公开涉及至少部分地表示音乐的声音信号的处理。声音信号的处理生成表示声音信号的刺激信号,并且本公开涉及生成刺激信号,当该刺激信号由听力假体系统施加到接受者或用户时会改善对音乐的感知(与使用常规的语音处理策略来处理音乐相比)。

在一个示例中,听力假体系统的一个或多个麦克风接收声音信号。这些接收到的声音信号至少部分地表示来自音乐源(例如,连接到扬声器的立体声系统、连接到扬声器的cd播放器、现场音乐等)的音乐。麦克风然后将声音信号(直接或间接地)提供给听力假体系统的声音处理器。备选地或附加地,听力假体系统的声音处理器可以经由与音乐源的有线或无线耦合来接收声音信号作为直接音频输入。

根据本公开的一个方面,声音处理器标识声音信号的一个或多个分量,诸如音调分量、无调分量、确切音高分量和/或不确切音高分量中的一个或多个分量。声音处理器然后可以基于所标识的分量来生成刺激信号。例如,声音处理器可以基于音调分量和/或确切音高分量来生成第一刺激信号,并且第一刺激信号可以被配置为由第一刺激器施加以提供来自听力假体系统的声学输出。此外,声音处理器可以基于无调分量和/或不确切音高分量生成第二刺激信号,并且第二刺激信号可以被配置为由第二刺激器施加以提供来自听力假体系统的电输出。

前面的段落描述了所谓的实时处理示例。例如,恰在相应的刺激信号用作来自听力假体系统的输出的基础之前发生无调分量的标识。这些分量仅以瞬态方式存储。在另一个示例中,声音处理器可以“预处理”声音信号以标识声音信号的分量并且生成刺激信号。在这个“预处理的”示例中,声音处理器可以存储所标识的分量或以其他方式将这些分量标识为不同的分量或音轨,和/或声音处理器可以将所生成的刺激信号作为mp3文件存储在音乐播放器或其他存储设备上,以供后续通过一个或多个刺激器进行检索和应用。

根据另一方面,声音处理器可以通过将声音信号的(多个)分量或部分换位到不同的频率范围来处理声音信号的一个或多个分量。例如,声音处理器可以通过将(多个)分量高于给定频率的部分换位到低于给定频率的频率范围来处理声音信号的一个或多个分量。在另一个示例中,声音处理器可以将高于给定频率的音调分量或确切音高分量中的一个或多个分量处理到低于给定频率的频率范围。在又一示例中,声音处理器可以将低于给定频率的一个或多个低频打击乐声音处理到高于给定频率的频率范围。

各个方面和示例在本文中被描述为通过方法、系统(诸如听力假体系统和/或单独的声音处理器)、和/或非暂态计算机可读介质形式的编程来实现,用于处理音乐。

附图说明

图1示出了根据本公开的实施例的听力假体系统的框图。

图2是示出用于控制双模式听力假体的方法或算法的流程图。

图3是示出用于控制双模式听力假体的另一种方法或算法的流程图。

图4是示出用于控制双模式听力假体的另一种方法或算法的流程图。

图5图示了示例听力图。

图6图示了另一个示例听力图。

图7是包括具有用于控制双模式听力假体的指令的计算机可读介质的制品的框图。

具体实施方式

以下的具体实施方式参照附图描述了各种特征、功能和属性。在附图中,除非上下文另外指出,否则相似的符号通常标识相似的分量。本文描述的说明性实施例并不意味着限制。本文公开的某些特征、功能和属性可以以各种不同的配置进行布置和组合,所有这些配置在本公开中都是可预期的。

为了说明的目的,本文关于包括电刺激分量和声学刺激分量的双模式电-声听力假体来描述各种示例。所描述的双模式电-声听力假体的示例包括提供电刺激的耳蜗植入物部件、以及提供声学刺激的传统助听器部件。然而,本文公开的各种特征和功能也适用于包括电刺激和声学刺激二者的其他类型的双模式设备以及双侧和双耳系统。

双模式假体的典型接受者具有感觉神经性听力损失,其更严重地影响高频范围,并且可以保留一些有用的低频范围听力。因此,用于语音的声音处理策略可以包括用于通过针对较高频率范围的电刺激信号传递声音的耳蜗植入物部件,以及用于通过针对较低频率范围的声学刺激信号传递声音的传统助听器部件。这对于语音通常是有效的声音处理策略。然而,对于音乐而言,这可能不是完整或有效的声音处理策略(或者至少在音乐的声音处理中可以做出改进),这部分地是因为,电刺激分量可以具有有限的编码音高和其他音乐信息或信号的能力。如将在下文中更详细地讨论的,本公开提供了一种用于针对的声音处理策略,其从接收到的声音信号中标识和/或分离某些音乐分量并且处理这些音乐分量以改善听力假体的接受者对音乐的感知。

现在参考图1,示例听力假体系统20包括双模式听力假体22。在本示例中,双模式听力假体22包括用于施加多种形式的刺激的部件。例如,双模式听力假体22可以包括以下的部件:耳蜗植入物、传统助听器、骨传导设备、直接声学耳蜗刺激设备、听觉脑干植入物、或配置为辅助假体接受者感知声音的任何其它类型的听力假体。

图1所示的听力假体22包括数据接口或控制器24(诸如通用串行总线(usb)控制器)、一个或多个麦克风26、一个或多个处理器28(诸如数字信号处理器(dsp))、第一刺激电子器件30、第二刺激电子器件32、数据存储器34和电源36,所有这些都被示出为经由有线或无线链路38直接或间接地耦合。在一个非限制性示例中,第一刺激电子器件30包括用于向接受者提供声学刺激的声学刺激电子器件(诸如助听器部件),并且第二刺激电子器件32包括用于向接受者提供电刺激的电刺激电子器件(诸如耳蜗植入物部件)。

通常,(多个)麦克风26被配置为接收外部声学或声音信号40。(多个)麦克风26可以包括一个或多个全向或定向麦克风的组合,其被配置为接收背景声音和/或关注来自特定方向的声音,诸如通常在假体接受者的前方。备选地或结合地,听力假体22被配置为接收来自其他源的声音信息,诸如通过控制器24从外部源接收的声音信息。

处理器28被配置为处理、放大、编码或以其他方式将声学信号40转换成提供给声学和电刺激电子器件30、32的刺激数据。声学和电刺激电子器件30、32然后可以将刺激数据作为输出刺激信号42施加到接受者,以允许接受者将原始外部声学信号40感知为声音。更具体地,在本双模式听力假体22的情况下,声学信号40被转换成声学刺激数据和电刺激数据。声学刺激数据被提供给声学刺激电子器件30以将声学输出刺激信号42a施加到接受者。电刺激数据被提供给电刺激电子器件32以将电输出刺激信号42b施加到接受者。

处理器28根据用于假体接受者的配置设置或数据将外部声学信号40转换成刺激数据。一般而言,配置设置允许将听力假体针对特定的接受者来配置或适配。更具体地,在本示例中,双模式听力假体22可以利用以下配置设置来编程,该配置设置包括用于生成声学刺激数据的声学刺激配置设置、以及用于生成电刺激数据的电刺激配置设置。这些配置设置可以存储在数据存储器34中。

说明性地,电刺激配置设置包括由处理器28实现的声音处理策略,以从声学信号40生成电刺激数据。对于施加到耳蜗植入物部件(更具体地,植入在接受者中的耳蜗电极阵列)的电刺激数据,刺激数据可以限定预期电极、刺激模式、刺激幅度和刺激持续时间中的一个或多个。因此,电刺激数据可以用于控制由刺激电子器件32施加到接受者的听觉刺激脉冲的时间和强度。

一般而言,语音算法包括但不限于:连续交错采样(cis)、谱峰值提取(speak)、高级组合编码器(ace)、基本异步刺激定时(fast)、同时模拟刺激、mps、配对的脉冲采样器、四重脉冲采样器、混合模拟脉冲、n-of-m和hires。更具体地,speak是可以在250-500hz范围内工作的低速率策略,ace是cis和speak的组合。其他专有和非专有的语音算法也是可以的。例如,这些算法的操作提供关于刺激模式(例如,单极或双极通道)、(多个)目标电极和(多个)刺激脉冲的幅度的信息。

再次参考声学刺激配置设置,这些设置包括处方规则,用于从听力假体接受者的听力图以及针对声学刺激的跨一定范围频率的最大舒适度水平来限定参数,诸如增益和最大功率输出(mpo)水平或设置。一般而言,听力图是针对一定频率范围的可听阈值的图。在一些情况下,听力图由跨接受者残留听力范围所测量的阈值水平来限定。如果特定于接受者的听力图不可用,则群体平均听力图也可以与处方规则一起使用以适配双模式听力假体22的传统助听器部件。在本示例中,处方规则也可以应用于听力图以设置声学刺激和电刺激之间的交叉频率。

一般而言,处方规则是用于计算最佳增益设置的数学模型或算法,以使得外部声音被听力假体接受者可理解地感知,并且其响度与听力正常的人所感知到的外部声音的响度相似。处方规则通常关注使语音可理解并减少背景噪音。一些处方规则是非线性的,并针对不同的频率或频带应用不同的增益设置,以为接受者提供更精细的听力假体适配。示例处方规则包括但不限于:国家声学实验室(nal)处方规则(包括nal-r、nal-rp、nal-nl2等)、期望感觉水平(dsl)处方规则、以及耳蜗混合处方规则(chp)。其他专有和非专有的处方规则也是可能的。

如以上一般地所讨论的,第一刺激电子器件30可以包括传统的助听器部件(诸如小型扬声器或耳机),并且第二刺激电子器件32可以包括耳蜗植入物部件(诸如电极阵列)。在其他非限制性示例中,刺激电子器件30、32可以包括用于骨传导设备、中耳设备、直接声学耳蜗刺激设备和/或听觉脑干植入物的部件。

返回参考电源36,该电源为听力假体22的各种部件提供功率。电源36可以是任何合适的电源,诸如不可充电电池或可充电电池。在一个示例中,电源36是可以诸如通过感应充电来无线充电的电池。这种无线可充电电池有利于完成假体22的皮下植入,以提供完全或至少部分可植入的假体。完全植入的听力假体具有额外的益处,使得接受者能够进行使接受者暴露于水或高空气湿度的活动(诸如游泳、淋浴、桑拿等),而不需要移除、停用或保护(诸如利用防水/防潮的罩或防护罩)听力假体。完全植入的听力假体还可以避免接受者与假体使用相关联的烙印(想像的或其他方式的)。

再次参考数据存储器34,该部件通常包括任何合适的易失性和/或非易失性存储部件。此外,数据存储器34可以包括计算机可读程序指令和可能的附加数据。在一些实施例中,数据存储器34存储用于执行本文描述的方法和过程的至少一部分和/或本文描述的系统的功能的至少一部分的数据和指令。尽管图1中的数据存储器34被图示为单独的框,但是在一些实施例中,数据存储器可以被并入到假体22的其他部件(诸如处理器28)中。

图1所示的系统20进一步包括计算设备44,其被配置为经由连接或链路46可通信地耦合到听力假体22。链路46可以是任何合适的有线连接,诸如以太网电缆、通用串行总线连接、双绞线、同轴电缆、光纤链路或类似的物理连接,或者任何合适的无线连接(诸如bluetooth、wi-fi、wimax、电感或电磁耦合或链路等)。

一般而言,计算设备44和链路46被用于在各种模式中操作听力假体22。在一个示例中,计算设备44和链路46被用于调整双模式听力假体22的各种参数。计算设备44和链路46还可以用于诸如经由数据接口24将接受者的配置设置加载到听力假体22上。在另一个示例中,计算设备44和链路46被用于将其他程序指令和固件升级上传到听力假体22。在又一些示例中,计算设备44和链路46被用于向听力假体22传递数据(例如,声音信息)和/或功率,以操作其部件和/或给电源36充电。更进一步地,假体22的各种其他操作模式可以通过利用计算设备44和链路46来实现。

计算设备44还可以包括各种附加部件,诸如处理器、存储设备和电源。此外,计算设备44可以包括用户接口或输入/输出设备,诸如按钮、刻度盘、具有图形用户接口的触摸屏等,其用于打开和关闭假体22、调整音量、调整或微调配置数据或参数等。因此,计算设备44可以被接受者或第三方(诸如,年幼接受者的监护人或医疗保健专业人员)用来控制或调整听力假体22。

可以对图1所示的系统20进行各种修改。例如,用户接口或输入/输出设备可并入听力假体22中,而不是与计算设备44的用户接口或输入/输出设备结合。此外,系统20可以包括以任何合适的方式布置的附加或更少的部件。

另外,取决于系统20的类型和设计,所图示的部件可以被封装在单个操作单元内或分布在多个操作单元上,例如,两个或更多个内部单元、两个或更多个外部单元和内部单元等等。通常,内部单元可以被气密密封并且适于至少部分地植入在接受者中。实际上,在一些实施例中,除了计算设备44之外,听力假体系统20的所有部件被植入在接受者中以形成完全植入的听力假体或系统。

现在参考图2,可以由本文描述的系统和设备来实现的示例方法60被图示。通常,方法60可以包括如框62-70中的一个或多个框所示的一个或多个操作、功能或动作。尽管框62-70以特定顺序示出,但是这些框也可以以与所示顺序不同的顺序来执行,并且根据某些实现方式甚至可以省略或添加一些框。

另外,每个框62-70可以表示包括程序代码的模块、段或部分,其包括可以由处理器执行的一个或多个指令,用于在过程中实现特定的逻辑功能或步骤。例如,程序代码可以存储在任何类型的计算机可读介质或存储设备上,包括磁盘或硬盘驱动器。计算机可读介质可以包括非暂态计算机可读介质,诸如短时间存储数据的计算机可读介质(例如,寄存器存储器、处理器高速缓存和随机存取存储器(ram))。计算机可读介质还可以包括非暂态介质,诸如二级或持久的长期存储器(例如,只读存储器(rom)、光盘或磁盘、光盘只读存储器(cd-rom)等)。计算机可读介质还可以包括任何其他易失性或非易失性存储系统。计算机可读介质可以被认为是例如计算机可读存储介质或有形存储设备。另外,框62-70中的一个或多个框可表示有线连接的电路,以执行方法60的特定逻辑功能。

在图2中,在框62处,设备或系统(诸如系统20、听力假体22、计算设备44或一些其他计算设备)接收声音信号。在一个示例中,听力假体系统的一个或多个麦克风可以接收声音信号,并且这些接收到的声音信号可以至少部分地表示来自音乐源(例如,立体声系统、cd播放器、现场音乐等)的音乐。麦克风然后将声音信号(直接或间接地)提供给听力假体系统的声音处理器(例如,处理器28)。备选地或附加地,在框62处,听力假体系统的声音处理器可以接收声音信号作为直接音频输入。

在框64处,声音处理器标识声音信号的一个或多个分量,诸如音调分量、无调分量、确切音高分量、不确切音高分量、谐波分量、非谐波分量、旋律分量、非旋律分量、和/或对应于一个或多个乐器的分量。在框64处,声音处理器还可以分离和/或存储声音信号的所标识的音乐分量。声音处理器可以使用音乐处理领域中已知的音乐处理软件来标识声音信号的不同分量。

一般而言,音调声音涉及乐曲的主音、基调或音调中心。在一个示例中,音调声音通过对应于由主音或基调限定的音阶中的音符而与主音或音调中心有关。无调声音通常缺乏与音调中心或基调的这种关系。音调声音通常被认为具有确切音高,而无调声音通常被认为具有不确切音高。然而,在一些情况下,无调声音被认为具有确切音高(例如,语音声音可以具有由声音的基频表示的确切音高,但是可以仍然是无调的,因为语音声音不一定适配音乐基调)。

此外,音高通常可以指频率相关音阶上的声音的感知排序。特定音高涉及范围或音阶中的单个声音的位置。音高和音调可以是相关的,因为音调代表声音的“质量”,诸如可听见的音高声音有多尖锐或饱满。一个音符是一个命名的音高。例如,西方音乐通常将440hz音高称为“a”(更具体地,a4)。

典型的听力正常的收听者可以或相对容易地标识被认为具有确切音高的声音或音符的音高。诸如声音处理器的计算设备可以被配置为通过标识声音的谐波(或近谐波)特性来用确切音高标识声音。谐波声音特性可以包括多个声音频率,其中较高的声音频率是最低声音频率(或基频)的近似整数倍。在一个示例中,在框64处,声音处理器通过标识声音信号具有大于预定阈值的幅度的基频,来标识声音信号的确切音高分量。

相反,任何收听者可以发现标识被认为具有不确切音高的声音或音符的音高是不可能的或相对困难的。诸如声音处理器的计算设备可以被配置为通过确定声音不具有谐波(或近谐波)特性,来标识具有不确切音高的声音。这样的声音可以被认为具有非谐波的特性,例如因其包括偏离谐波声音的整数倍关系的多个声音频率。

计算设备还可以被配置为通过确定声音缺少具有大于预定阈值的幅度的强基频,来标识具有不确切音高的声音,使得声音不产生音高感。

在示例中,计算设备被配置为通过确定声音确实包括强基频或可识别的音高来标识无调声音,但是该可识别的音高与更大的乐曲不相关。例如,如果声音与乐曲的基调或旋律不相关,则具有可识别音高的声音可以是无调的。

在框64处,声音处理器还可以标识其他音乐分量,诸如与打击乐器相对应的声音。一般而言,打击乐器包括当乐器被击打、震动、刮擦等时发出声音的乐器。一些打击乐器(诸如木琴、定音鼓、或钢琴)被调音,并能产生具有确切音高的声音。其他打击乐器(诸如低音鼓、手鼓、铙钹、响葫芦或响板)不可调音,可以是无调的,并且可以通常具有不确切音高。在一个示例中,声音处理器通过检测诸如快速上升和下降或释放的瞬态信号特性来标识打击乐器。

声音处理器还可以标识对应于其他乐器(诸如吉他、贝司、小提琴、钢琴、人的声音以及众多其他乐器)的音乐分量。人的声音和其他乐器通常可以对应于乐曲的音调或确切音高分量。在一个示例中,计算设备被配置为分析接收到的声音信号的调制频谱和/或声音信号的其他特性,以标识与不同乐器相关联的特性。例如,人类声音通常与基于音节结构的特定调制速率(例如,口头的人声具有约4hz的独特调制频率)相关联。在一个示例中,声音处理器检测大约4hz的调制频率以标识口头的人声,人声对于某些类型的音乐可以是常见的。打击乐器(诸如大多数鼓)可以与不同的调制速率以及快速的突击和释放特性相关联。另一种用于隔开乐器的技术是使用可调整的窄带滤波器来隔离频域中的分量。

在另一示例中,声音处理器标识在所接收的声音信号中表示的空间位置以标识不同的乐器。例如,声音处理器可以将人声标识为在接收到的声音信号的空间中心附近。在另一个示例中,声音处理器将与频谱形状/倾斜/质心有关的信号特性标识为与不同的乐器相关联。

与针对听力假体处理音乐有关的附加细节在于2011年6月17日提交的公开号为2011/0280427的美国专利申请、于2014年7月11日提交的公开号为2015/0016614的美国专利申请中公开,这些专利中每个专利的内容通过引用并入本文。

此外,在框64处,声音处理器还可以标识旋律和/或谐波音乐分量。通常,乐曲的旋律是音调(或音高或音符)的有组织的排列,使用识别的音阶、强调特定的音调、并且使用音调之间的间隔的特定配置。在音乐中,和声通常与同时听到的两个或更多个音符的声音有关。

在本示例中,在框66处,声音处理器将频率换位应用到所标识的音乐分量中的一个或多个分量。更具体地,声音处理器处理声音信号的一个或多个分量,以标识高于给定频率的一个或多个部分,并且将(多个)分量高于给定频率的(多个)部分换位或移位到低于给定频率的频率范围。例如,声音处理器处理音调分量和/或确切音高分量中的一个或多个分量,以将这些分量高于给定频率的部分隔离并换位到低于给定频率的频率范围。

备选地或组合地,声音处理器处理声音信号以标识、隔离和换位与特定乐器(例如,长笛、小提琴、短笛等)相关联的一个或多个音乐分量。例如,如果音乐分量与小提琴相关联并且包括高于给定频率的分量,则声音处理器将整个音乐分量换位或移位到低于给定频率处,以保持音乐分量中的音乐关系。在一个示例中,声音处理器将这些分量的部分低一个或多个整倍频程地换位或移位。

在另一个示例中,在框66处,声音处理器标识对应于打击乐器(例如,定音鼓)的一个或多个音调分量或确切音高分量,并且隔离和移位这些分量的低于给定频率的部分到高于给定频率的频率范围。在这个示例中,声音处理器可以将这些分量的部分高一个或多个整倍频程地换位或移位。

将音乐分量换位一个或多个整倍频程有助于保持乐曲的音调(例如,将保持适当的和声和和弦的相继进行)。一种可能的隔开乐器的方法是通过可调整的窄带滤波器。通过隔离和换位声音信号的某些音乐分量,本公开可以通过利用用于音调感知的声学听觉的相对强度,来改善针对听力假体接受者的音乐收听。

在框66处,给定频率可以是双模式听力假体的声学刺激和电刺激之间的截止频率或交叉频率。通常,截止频率或交叉频率对应于在接受者的听力图上残留听力下降到低于约90dbhl的点。说明性地,在为接受者适配听力假体系统期间建立截止频率或交叉频率。在其他示例中,给定频率是某个其他预定频率。在一些实施例中,响应于接收到听力假体系统的输入(诸如用户输入),给定的频率是可调整的。

在框68和70处,声音处理器基于所标识的(和可选地换位的)分量来生成刺激信号。例如,在框68处,声音处理器可以基于音调分量和/或确切音高分量生成第一刺激信号,包括这些分量的换位和/或非换位部分。在该示例中,第一刺激信号被配置为由第一刺激器施加以提供来自听力假体系统的声学输出。在另一个示例中,声音处理器基于整个接收到的声音信号(例如,音乐的完整排列)来生成第一刺激信号。

在另一示例中,声音处理器基于确切音高分量生成第一刺激信号,这有助于实现开发在听觉听力中更优的音调感知的益处,并且与标识音调分量相比,确切音高分量可以在计算上更高效地被标识。在其他示例中,声音处理器基于以下来生成第一刺激信号:基于旋律乐器分量(例如,小提琴、吉他、木管乐器、语音等),该旋律乐器分量与音乐排列的音调中心具有(或不具有)关系;或基于具有谐波特性和/或基频的任何声音信号,该基频不具有类似于典型的打击乐声音的瞬态特性。

此外,在框70处,声音处理器基于无调分量和/或不确切音高分量生成第二刺激信号,并且第二刺激信号被配置为由第二刺激器施加以提供来自听力假体系统的电输出。在另一示例中,声音处理器基于不确切音高分量来生成第二刺激信号,与标识无调分量相比,不确切音高分量可以在计算上更高效地被标识。在其他示例中,声音处理器基于音高打击乐器(例如,鼓膜)、基于具有谐波特性和瞬态特性二者的声音信号、基于具有确切音高的口头语音或声音信号(该确切音高具有对于大约4hz的语音(其可以被发送到电路径以获得更好的语音理解)的典型的调制频率)、或基于具有瞬态特性(例如,快速的突击和释放特性)的声音信号来生成第二刺激信号。

第二刺激信号也可以是整个接收到的声音信号、或通过从整个接收到的声音信号中提取音调和/或确切音高分量而生成的处理后的声音信号。在框70处,声音处理器根据上述用于双模式听力假体的典型声音处理策略来处理整个接收到的声音信号或处理后的声音信号,以针对高于截止频率或交叉频率的较高频率范围通过电刺激信号来传递声音,并针对低于截止频率或交叉频率的较低频率范围通过声学刺激信号来传递声音。

框68和框70的变型也可以基于诸如用户声音质量偏好之类的因素来进行。例如,听力假体系统的用户或接受者可以更偏好通过电刺激信号来传递打击乐或不确切音高分量,并且通过声学刺激信号来传递残留的音乐声音分量。另一个用户(或者也许是在不同声学环境中或者听不同类型的音乐的相同用户)可以更偏好通过声学刺激信号来传递整个或整体音乐排列。在一个示例中,本文描述的听力假体系统允许用户在通过声学和/或电刺激信号来传递音乐分量的不同变型之间变换或切换。这种变换或切换可以在图2所示的任何框期间来执行。

在框68和框70之后、或者在框68和框70处,第一刺激信号和第二刺激信号可以被存储以备将来使用,和/或可以被实时地应用到相应的第一刺激器和第二刺激器以允许接受者将所标识的分量感知为声音。第一刺激信号和第二刺激信号可以被存储在任何合适的数据存储器中,诸如包括在计算设备44中或以其他方式耦合到计算设备44的数据存储器、和/或听力假体22的数据存储器34。

在方法60中,第一刺激信号或第二刺激信号中的一个或多个刺激信号也可以基于整个或整体声音信号或者基于声音信号的所有音乐分量。备选地,第一刺激信号和第二刺激信号中的一个或多个刺激信号可以基于声音信号的相应的所分离的音乐分量。因此,例如,第一刺激信号可以基于声音信号的整个音调分量,并且第二刺激信号可以基于声音信号的整个无调分量。

声音处理器可以标识声音信号的分量,并在接收到声音信号时实时生成刺激信号。在另一个示例中,音乐声音信号被“预处理”以标识声音信号的不同音乐分量。在这个“预处理的”示例中,处理器可以存储所标识的分量或以其他方式将这些分量标识为不同的分量或音轨,和/或处理器可以存储所生成的刺激信号以供后续通过一个或多个刺激器进行检索和应用。

图3示出了这样的示例方法80,其可以类似于以上描述的图2来实现和修改。在方法80中,在框82处,音乐被预处理(全部或部分地)以标识不同的音乐分量,诸如音调分量、无调分量、确切音高分量、不确切音高分量、不同的乐器分量等,如本文所描述的。在一个示例中,音乐家或音响工程师使用midi控制器或类似物来标识不同的分量,并且存储所标识的分量或以其他方式将分量标识为不同的声音信号或音轨。例如,对于特定的流行歌曲,音乐家或音响工程师将鼓分量与歌曲的原始记录分离,并且用被配置为在单个刺激器(例如,上述的第二刺激器)上感知为鼓的一个或多个命令替换鼓分量。在另一个示例中,音乐家或音响工程师从原始记录中移除鼓分量,并且保留鼓分量以在单个刺激器(例如,第二刺激器)上呈现。

在一个示例中,在框82处,具有内部存储器和适合于声学和电刺激的输出的移动电话或其它设备将预处理后的音乐存储为针对不同乐器的单独乐曲或不同乐曲。这些音轨上的乐器可以在框82处通过以下来分离:经由相位消除和/或均衡,或者通过使用具有真实鼓样本的虚拟乐器来创建完全分离的鼓/打击乐器音轨,或者通过实况记录双鼓音轨。标识和分离不同分量的其他示例也是可能的,诸如关于图2所描述的示例。

在框84处,预处理的音乐声音信号被提供给声音处理器,该声音处理器标识和/或分离声音信号的不同音乐分量。声音处理器可以执行以上关于框64描述的相同过程中的一些过程,然而,在该示例中,在框82处已经执行了对不同音乐分量的大部分标识。

此后,在框86处,类似于上述的框66,声音处理器应用频率换位。此外,在框88和框90处,声音处理器分别生成类似于上述的框68和框70的刺激信号。

现在参考图4,示例方法100被提供用于将频率换位应用于所接收的声音信号的一个或多个分量。图4可以类似于以上描述的图2来实现和修改。在图4中,在框102处,声音处理器接收声音信号,其可以代表音乐,但不一定如此。在框104处,声音处理器处理声音信号以标识和/或隔离其一个或多个部分或分量(例如,第一分量)。在一个示例中,第一分量包括或包含高于给定频率的分量。

在框106处,声音处理器执行第一分量从第一频率范围到第二频率范围的换位、移位或重新分配中的一个或多个。在一个示例中,第一频率范围至少部分地高于给定频率并且包括原始第一分量,并且第二频率范围至少部分地低于给定频率。在另一个示例中,第一频率范围完全高于给定频率,和/或第二频率范围完全低于给定频率。在框106处,给定频率可以是双模式听力假体的声学刺激和电刺激之间的截止频率或交叉频率。通常,截止频率或交叉频率对应于在接受者的听力图上残留听力低于约90dbhl的点。说明性地,在为接受者适配听力假体系统期间建立截止频率或交叉频率。在其他示例中,给定频率是某个其他预定频率。在一些实施例中,响应于接收到听力假体系统的输入(诸如用户输入),给定的频率是可调整的。

在框108处,声音处理器基于第二频率范围中的声音信号的分量来生成第一刺激信号。在一个示例中,声音处理器仅仅基于第二频率范围中的声音信号的分量来生成第一刺激信号。这些分量包括来自框104的第一分量。在一个示例中,在框108处,第一刺激器施加第一刺激信号来提供来自听力假体系统的输出。例如,第一刺激器是声学刺激器。

在框110处,声音处理器基于第一频率范围中的声音信号的分量来生成第二刺激信号。在一个示例中,声音处理器仅仅基于第一频率范围中的声音信号的分量来生成第二刺激信号。在本示例中,在框110处,第二刺激器施加第二刺激信号以提供来自听力假体系统的输出。例如,第二个刺激器是电刺激器。

图5和图6图示了听力假体系统的接受者的示例听力图,其被参考以进一步解释所公开的频率的示例换位。在示例双模式听力假体中,假体在相同的耳朵/耳蜗中包括声学刺激和电刺激二者。经由声音输出对任何残留听力进行声学刺激,并经由耳蜗植入物和电极施加电刺激。声学刺激通常在与残留听力相对应的低频率中占主导,并且电刺激在较高频率中占主导。刺激从声学刺激转换到电刺激的点被称为交叉频率,其由两个截止频率(一个用于声学路径,并且另一个用于电路径)组成,并且通常对应于听力损失超过90dbhl(虽然这个水平可以改变)的点。在交叉频率处,刺激将重叠或不重叠。重叠映射图是耳蜗中存在接收声学刺激和电刺激二者的点的映射图。重叠区域可以根据需要变窄或变宽,并且可以包括完整的声学表示和电表示(完全交叉)。非重叠的映射图是在耳蜗的任何点处不存在电和声学刺激重叠的映射图。这些映射图由诊所的听力学家设置。

图5图示了听力图(例如,人可以听到的最柔和的声音的表示),其中x轴表示频率/音高,并且y轴表示强度/响度。这位接受者的听力阈值在1000hz左右通常变得大于90dbhl。这个90dbhl听力阈值点通常被认为是交叉频率120或在其上提供电刺激、在其下提供声学刺激的点。

图6图示了相同的听力图,但是指示包括声学截止频率120和电截止频率122的另一种配置。在这两个频率之间是重叠区域124,其中听力假体可以同时施加声学刺激和电刺激二者。更具体地,在低于声学截止频率120处提供声学刺激,并且在高于电截止频率122处提供电刺激。

在一个示例中,在图4的框104处,声音处理器标识高于声学截止频率120的分量,并且在框106处,声音处理器将所标识的高于声学截止频率的分量换位到低于截止频率的频率范围。然后,如以上所讨论的,声音处理器执行框108和/或框110的处理。

在另一个示例中,在图4的框104处,声音处理器标识高于电截止频率122的分量,并且在框106处,声音处理器将所标识的高于电截止频率的分量换位到低于截止频率的频率范围。然后,如以上所讨论的,声音处理器执行框108和/或框110的处理。

在又一示例中,在图4的框104处,声音处理器标识低于声学截止频率122的分量,并且在框106处,声音处理器将所标识的低于声学截止频率的分量换位到高于截止频率的频率范围。然后,如以上所讨论的,声音处理器执行框108和/或框110的处理。

在又一示例中,在图4的框104处,声音处理器标识低于电截止频率122的分量,并且在框106处,声音处理器将所标识的低于电截止频率的分量换位到高于截止频率的频率范围。然后,如以上所讨论的,声音处理器执行框108和/或框110的处理。

图7示出了制品120的示例,制品120包括具有用于调整双模式听力假体的参数的指令122的计算机可读介质。在图7中,示例制品120包括用于在计算设备上执行计算机处理的计算机程序指令122,其根据本文描述的至少一些实施例(诸如图2-图4的方法)来布置。

在一些示例中,制品120包括计算机可读介质124,诸如但不限于:硬盘驱动器、光盘(cd)、数字视频盘(dvd)、数字磁带、闪存等。在一些实现中,制品120包括计算机可记录介质126,诸如但不限于:硬盘驱动器、光盘(cd)、数字视频盘(dvd)、数字磁带、闪存等。一个或多个编程指令122包括例如计算机可执行指令和/或逻辑实现指令。在一些实施例中,诸如处理器28和/或计算设备44的计算设备(单独或者与一个或多个附加的处理器或计算设备结合)可以被配置为至少部分地基于编程指令122来执行某些操作、功能或动作来实现所公开的系统和方法的特征以及功能。

以下条款被提供作为对示例实施例的进一步描述。条款1-一种方法,包括:接收至少部分地表示音乐的声音信号;标识声音信号的音乐分量,其中所标识的音乐分量由确切音高来表征;从声音信号中提取音乐分量;以及基于所提取的音乐分量来生成刺激信号,其中刺激信号被配置为由刺激器施加以向听力假体系统的接受者提供声学输出。

条款2-根据条款1的方法,其中由确切音高表征的音乐分量是第一音乐分量,基于所提取的第一音乐分量的刺激信号是第一刺激信号,并且可以用于施加第一刺激信号的刺激器是第一刺激器,其中该方法还包括:标识声音信号的第二音乐分量,其中所标识的第二音乐分量由不确切音高表征;从声音信号中提取第二音乐分量;以及基于所提取的第二音乐分量来生成第二刺激信号,其中第二刺激信号被配置为由第二刺激器施加以提供来自听力假体系统的电输出。

条款3-根据条款1的方法,其中基于所提取的音乐分量的刺激信号是第一刺激信号,并且可以用于施加第一刺激信号的刺激器是第一刺激器,其中该方法还包括:基于整个声音信号来生成第二刺激信号,其中第二刺激信号被配置为由第二刺激器施加以提供来自听力假体系统的电输出。

条款4-根据条款1的方法,其中基于所提取的音乐分量的刺激信号是第一刺激信号,并且可以用于施加第一刺激信号的刺激器是第一刺激器,并且其中从声音信号提取音乐分量生成处理后的声音信号,其不具有所提取的音乐分量,还包括:标识处理后的声音信号低于第一频率的第一部分;标识处理后的声音信号高于第一频率的第二部分;以及基于处理后的信号的第二部分来生成第二刺激信号,其中第二刺激信号被配置为由第二刺激器施加以提供来自听力假体系统的电输出;其中第一刺激信号也基于处理后的声音信号的第一部分。

条款5-根据条款1的方法,其中标识声音信号的音乐分量包括标识声音信号的基频,其中基频具有大于预定阈值的幅度。

条款6-根据条款5的方法,其中标识声音信号的音乐分量包括标识基频的一个或多个谐波频率,其中一个或多个谐波频率是基频的整数倍。

条款7-根据条款1的方法,还包括:标识所提取的音乐分量高于第一频率的部分;以及将所提取的音乐分量的标识部分移位到低于第一频率的频率范围;其中刺激信号也基于所提取的音乐分量的所偏移的标识部分。

条款8-根据条款7的方法,其中将所提取的音乐分量的标识部分移位到低于第一频率的频率范围包括:将标识部分移位一个或多个整倍频程到低于第一频率的频率范围。

虽然本文已经公开了各个方面和实施例,但是其他方面和实施例对于本领域技术人员将是清楚的。本文公开的各个方面和实施例是出于说明的目的,而不是限制性的,真实的范围由所附权利要求表示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1