基于用户当前认知负荷的估计运行听力仪器的方法及助听器系统与流程

文档序号:12731112阅读:203来源:国知局
基于用户当前认知负荷的估计运行听力仪器的方法及助听器系统与流程

技术领域

本发明涉及助听器尤其涉及针对用户具体需要定制助听器。本发明具体涉及运行听力仪器处理输入声音及根据用户特定需要提供输出刺激的方法。

本发明还涉及用于处理输入声音及根据用户特定需要提供输出刺激的助听器系统。

此外,本发明涉及储存计算机程序的有形计算机可读介质及数据处理系统。

例如,本发明可用于听力受损用户当前的智力资源受到挑战的应用中。



背景技术:

本发明的背景技术按两部分描述:

1、考察困难听音情形下工作记忆和认知负荷的效果

2、考察可改善/改进认知负荷的助听器信号处理

1、困难听音情形下工作记忆和认知负荷的效果

在最佳听音情形下,语音信号被容易且自动地处理。这意味着,所涉及的认知处理很大程度上是无意识和内隐处理。然而,听音条件经常欠佳,这意味着,内隐认知过程可能不足以解锁语音流中的含意。在对话中解决先前语音元素之间的歧义及构建前瞻交换的预期是可能出现的复杂过程的例子。这些过程是需要努力及有意识的过程,因而涉及外显认知处理。

工作记忆(WM)容量相对恒定,但个体之间存在差异(Engle et al.,1999)。在执行使工作记忆负重担的双任务时,在对两个任务分配认知资源的能力方面有很大的个体差异(Li et al.,2001)。然而,必须研究具有HI的人对语言理解过程的不同方面怎样分配其认知资源及保留多少认知备用容量(CSC)以在已成功完成听音时投入其它任务。

ELU(2003;Rudner,Foo&Lunner,2008)依赖于长期记忆中的音位表示的质量、词汇访问速度、及工作记忆中的外显储存和处理容量。当从语音信号提取的音位信息在工作记忆中可快速和平稳匹配到长期记忆中的音位表示时,认知处理为内隐处理及ELU高。ELU框架预测在畅谈情形下何时出现失配,这不仅引出可测量的生理反应,而且还导致外显认知过程的参与,如进行比较、操纵和推断。这些过程涉及工作记忆中的外显处理和短期储存容量,其可称为复合工作记忆容量。因此,个体的复合工作记忆容量对补偿失配至关重要。

具有各种背景噪声或混响的听音情形使(语音)信号欠佳并不同程度地影响正常听力人员和听力受损人员的语音识别。

Lunner和Sundewall-Thorén(2007)的结果表明,在伴随慢速压缩和未调制噪声的受助情况下,测试对象的认知容量能起作用,但未超出大多数听力受损个体听者的容量限制。因而,个体外围听力损失抑制性能及该性能可由可听性说明。拥有较大的认知容量赋予相对小的好处。然而,在伴随快速压缩和变化的背景噪声的复杂情形下,为成功听音需要多得多的认知容量。因而,个体认知容量抑制性能及噪声下语音性能至少部分可从个体工作记忆容量说明。

此外,Sarampralis等(2008)已说明,定向传声器(相较于全向传声器)的约4dB的SNR改善(空间上分开的干扰源的衰减)意味着记忆(回忆)改善及较快的反应时间。Sarampralis等(2008)还说明了关于降噪系统的记忆(回忆)和反应时间的积极结果。

相较于正常听力的人,由于耳蜗损伤的知觉后果如时间和频率分辨力降低、利用时域细微结构困难、分组声音流的能力更差及隔离声音流的能力更差,听力受损将限制传给大脑的信息量及信号信息质量更差。因而,对于听力受损人员,更多的情形将引起需要努力的外显处理。例如,相较正常听力人员,听力受损人员更易受混响、背景噪声尤其是起伏噪声或其它讲话者的影响,及具有更差的空间分离能力。

2、可改善/改进认知负荷的助听器信号处理

助听器具有几个目的:首先,它们通过使用(具有快或慢时间常量的)多通道压缩放大系统补偿降低的弱音敏感性及响度的异常增大(快速压缩在某些情况下实际上可看作降噪系统,例如参见Naylor等(2006))。此外,有可减少认知负荷的“帮助系统”,其在某些情形下用于改善噪声中的语音识别及在其它情形下当不存在语音时用于增加舒适度。Edwards等(2007)已说明,定向传声器及降噪系统相比于未处理情形增加记忆并减少反应时间,即表明认知负荷较小。这些帮助系统的主要组成为定向传声器和降噪系统。帮助系统通常基于来自检测器的信息自动调用,前述检测器如语音/无语音检测器、信噪比检测器、前/后检测器及能级检测器。暗含的假设为检测器可帮助区分“较容易的”听音情形和更“困难”/苛求的情形。该信息用于使帮助系统的接通和断开自动化以帮助用户在不存在语音时具有舒适的监视声音处理及在处于苛求的畅谈情形时具有更强烈的定向传声器配置和降噪系统。

“帮助系统”仅在某些听音情形下使用,因为它们仅在这些情形下具有好处;而在其它情形下,它们实际上可能无益,例如,调用定向传声器将衰减来自不同于正面方向的其它方向的声音,在只有少许背景噪声和/或来自后面的信息很重要的情形下,定向传声器实际上可能恶化定位及可能相较全向传声器需要更多的努力。因而,定向系统可能负面影响自然性、定向能力及目标信息、定位能力。

降噪系统存在类似的缺陷。

US 6,330,339描述了助听器,包括用于检测佩戴者的条件(生物信息、运动)的装置及用于基于预定算法确定助听器的工作模式的装置。条件检测装置分别使用脉冲传感器、脑波传感器、传导率传感器和加速度传感器的输出。藉此可改变助听器的特性从而适应佩戴者的条件。



技术实现要素:

调用这些帮助系统的决定可取决于助听器用户的认知状态。例如,用户认知状态或认知负荷的估计可基于用户工作记忆容量的估计。例如,如Lunner(2003)和Foo等(2007)中所示,工作记忆(WM)性能和噪声下语音识别阈(SRT)之间的相干性表明具有高WM容量的人相较具有低WM容量的人对噪声更耐受。这表明,当定向传声器系统或降噪系统在使用中时,具有高WM的人或许将不具有相同的(SNR)阈值。

此外,对一人为苛求的情形在对另一人时可能为“容易的”情形,取决于它们的工作记忆容量。

及,这是这里的要点,当该情形高度依赖于(个体)外显处理时,可能需要切换到帮助系统以能够管理该情形。

此外,在将来,我们将看到甚至更强烈的降噪系统如时频掩蔽(Wang et al.,2008)或语音增强系统(如Hendriks et al.,2005)及在某些情形下非常有帮助但在其它情形下无益的强烈的定向系统。因此,将需要个别地确定何时及在哪些情形下转换到帮助系统。

本发明的目标在于提供改进的听力仪器定制。

本发明的目标由所附权利要求中限定的及下面描述的发明实现。

方法

本发明的目标由运行听力仪器处理输入声音并根据用户的特定需要提供输出刺激的方法实现。该方法包括:

a)估计用户的当前认知负荷;

b)根据用户的特定需要处理源自输入声音的输入信号;

c)根据用户的当前认知负荷的估计调整所述处理。

这具有助听器系统的功能性与用户的当前智力状态相适应的优点。

本发明通过利用认知负荷的直接测量或来自助听器中的在线认知模型的认知负荷估计解决上述问题,其中助听器的参数已进行调节以适配个体用户。当认知负荷的直接测量表明高负荷或认知模型预测已超出当前用户的认知极限时,激活帮助系统如定向传声器、降噪方案、时频掩蔽方案以降低认知负荷。根据直接认知测量或来自认知模型的估计操纵帮助系统中的参数以将认知负荷降低到给定剩余认知备用容量。

在实施例中,估计用户的工作记忆容量。在实施例中,在听力仪器的任何使用或正常运行之前估计用户的工作记忆容量。在实施例中,用户的工作记忆容量的估计用于估计用户的当前认知负荷。在实施例中,估计用户在不同情形下的当前工作记忆跨度,例如在听力仪器的任何使用或正常运行之前。在实施例中,用户的当前认知负荷的估计与用户的当前工作记忆跨度的估计有关。

术语用户的“当前认知负荷的估计”在本说明书中意为用户的当前智力状态的估计,该估计至少能够在两个智力状态之间区分:智力资源使用程度(认知负荷)高和低。低认知负荷意为用户暴露于其中的当前情形/信息的内隐处理状态(即例行情形,不需要有意识的智力活动)。高认知负荷意为用户暴露于其中的当前情形/信息由大脑外显处理的状态(即需要智力活动的非例行情形)。要求用户外显处理的声情形可与不利信噪比(例如由于嘈杂环境或“派对”情形)或混响有关。在实施例中,当前认知负荷的估计包括多个负荷水平,如3、4、5或5以上水平。在实施例中,当前认知负荷的估计实时提供,即当前认知负荷的估计适于在几秒内响应于用户的认知负荷的变化,例如少于10秒,如少于5秒,如少于1秒。在实施例中,当前认知水平的估计按一时间段的时间求平均过程的结果提供,所述时间段小于5分钟,如小于1分钟,如小于20秒。

在实施例中,本发明方法包括提供人类听觉系统的认知模型,该模型基于来自可定制参数的输入提供用户的当前认知负荷的测量,及根据所述认知模型提供用户的所述当前认知负荷的估计。

在实施例中,建议在助听器中使用在线个别化认知模型,其确定应何时使用信号处理以降低认知负荷。

在实施例中,本发明方法包括针对特定用户的状态个别化认知模型的至少一可定制参数。

可使用的一个认知模型为语言理解容易模型(2003;et al.,2008),其可预测认知负荷何时从内隐(容易)的情形切换到外显(需要努力)的情形。因而,在对于个体为外显/需要努力的情形下,所提出的实时ELU模型的使用将操纵帮助系统对个体的强烈性。然而,根据特定应用的需要,也可使用其它认知模型,例如TRACE模型(McClelland&Elman,1986)、Cohort模型(Marslen-Wilson,1987)、NAM模型(Luce&Pisoni,1998)、SOAR模型(Laird et al.,1987)、CLARION模型(Sun,2002;Sun,2003;Sun et al.,2001;Sun et al.,2005;Sun et al.,2006)、CHREST模型(Gobet et al.,2000;Gobet et al.,2001;Jones et al.,2007)和ACT-R模型(Reder et al.,2000;Stewart et al.,2007)、及根据Baddeley(Baddeley,2000)的工作记忆模型。

在实施例中,根据用户的特定需要处理源自输入声音的输入信号包括提供多个分开的功能帮助选项,根据输入信号和/或源自输入信号的信号参数的值及根据用户的当前认知负荷的估计在根据个体化方案的处理中选择和包括所述分开的功能选项中的一个或多个。

在实施例中,分开的功能帮助选项选自下组(例如参见Dillon,2001;或Kates,2008):

-定向信息方案

-压缩方案

-语音检测方案

-降噪方案

-语音增强方案

-时频掩蔽方案

及其组合。

这具有个体帮助选项可根据用户的认知负荷的估计进行使用或增强的优点,从而增加用户的舒适性和/或所处理声音的可懂度。

是否调用定向传声器的选择在全向和定向好处之间权衡。在特定实施例中,助听器自动从全向转换到定向传声器时的SNR(信噪比)阈值根据用户的工作记忆容量针对特定用户进行设定。

在特定实施例中,在特定听音情形下对特定用户的降噪度根据用户的工作记忆容量进行设定。在给定听音情形下,相较于具有相对低WM容量的人,具有相对高WM容量的人预期能够忍受更多的失真因而能够忍受更强烈的降噪。

在特定实施例中,在特定听音情形下对特定用户的压缩率根据用户的工作记忆容量进行设定。有能力在负SNR的噪声下(参见图6)获得语音识别阈(SRT)的、具有相对高WM容量的人在该情形下将从相对快的压缩受益,而其噪声下SRT在正SNR的、具有相对低WM容量的人将由于快速压缩而不利。

在实施例中,从输入信号提取的性质或信号参数包括下述之一或多个:

-混响的量

-背景声音的起伏量

-能量对信息掩蔽

-声源的空间信息

-信噪比

-环境变化的丰富性和/或听觉生态测量(例如参见Gatehouse et al.2006a,b)。

涉及“环境变化的丰富性”的较后性质或信号参数包括如输入信号的性质或信号参数的变化所反映的声环境短时变化。在实施例中,输入信号的性质或信号参数用多个传感器测量或从该信号导出。在实施例中,声剂量用剂量计在预定时间如几秒内测量,例如5或10秒或更多(例如参见Gatehouse et al.,2006a,b;Gatehouse et al.,2003)。

在实施例中,认知模型的可定制参数与用户的一个或多个下述性质有关:

-长期记忆容量及访问速度

-包括操纵词、音节、押韵和音素的音位单元的外显能力的音位意识

-音位工作记忆容量

-执行功能,包括三个主要活动:转换、更新和抑制容量(例如参见Miyake&Shah,1999)

-注意性能(例如参见Awh,Vogel&Oh,2006)

-非言辞工作记忆性能

-含意提取性能(例如参见Hannon&Daneman,2001)

-包括音素辨别、音素分割和押韵性能的音位表示

-词汇访问速度

-工作记忆中的外显储存和处理容量

-纯音听觉阈值对频率

-时域细微结构分辨力(例如参见Hopkins&Moore,2007);及

-助听器用户的个体外围性质,包括听觉阈值和不舒适听音的阈值、感觉神经听力损失中的频域-时域和掩蔽异常(例如参见Gatehouse,2006(a)和Gatehouse,2006(b))。

在实施例中,用户的当前认知负荷的估计由所涉及用户的认知负荷的至少一直接测量确定或影响。在实施例中,用户的当前认知负荷的估计仅基于所涉及用户的认知负荷的至少一直接测量进行确定。或者,用户的当前认知负荷的估计由来自认知模型的输入和来自用户的认知负荷的一个或多个直接测量的输入的组合确定或影响。在实施例中,当前认知负荷的直接测量用作认知模型的输入。

当前认知负荷的任何直接测量可作为输入用于估计当前认知负荷。然而,在特定实施例中,认知负荷的直接测量通过流动的脑电图(EEG)获得。

在实施例中,认知负荷的直接测量通过监视体温获得。

在实施例中,认知负荷的直接测量通过瞳孔测量获得。

在实施例中,认知负荷的直接测量通过按钮获得,当认知负荷高时助听器用户按压该按钮。

在实施例中,认知负荷的直接测量的获得与计时信息有关,如与一天的时间有关。优选地,计时信息与开始时间有关,如用户从睡眠或休息醒来的时间或用户开始工作有关的任务的时间(如工作周期的开始时间)。在实施例中,本发明方法包括用户设定开始时间的可能性。

助听器系统

此外,本发明提供用于处理输入声音及根据用户的特定需要提供输出刺激的助听器系统。该系统包括:

-估计用户的当前认知负荷的估计单元;

-用于根据用户的特定需要处理源自输入声音的输入信号的信号处理单元;

-该系统适于根据用户的当前认知负荷的估计影响所述处理。

在实施例中,助听器系统包括适于由用户佩戴在耳朵处或耳内的听力仪器。在实施例中,听力仪器包括至少一特别适于从用户拾取与认知负荷的直接测量有关的电信号的电端子。在实施例中,听力仪器包括适于位于用户耳朵后面的耳后(BTE)部件,其中至少一电端子位于BTE部件中。在实施例中,听力仪器包括适于完全或部分位于用户耳道中的耳内(ITE)部件,其中至少一电端子位于ITE部件中。在实施例中,作为备选或另外,本发明系统包括一个或多个不位于听力仪器中但对当前认知负荷的直接测量起作用的电端子或传感器。在实施例中,这些另外的传感器或电端子适于通过有线或无线连接方式连接到听力仪器。

在实施例中,听力仪器包括用于将输入声音转换为电输入信号的输入变换器(如传声器)、用于根据用户的需要处理输入信号并提供处理后输出信号的信号处理单元、及用于将处理后输出信号转换为输出声音的输出变换器(如接收器)。在实施例中,估计用户的当前认知负荷的功能由信号处理单元执行。在实施例中,认知模型的功能和/或与认知负荷的直接测量有关的处理由信号处理单元执行。在实施例中,听力仪器包括可根据认知负荷的估计进行控制的定向传声器系统。在实施例中,听力仪器包括可根据认知负荷的估计进行控制的降噪系统。在实施例中,听力仪器包括可根据认知负荷的估计进行控制的压缩系统。听力仪器为包括其自己的能源(通常为电池)的低功率便携装置。在优选实施例中,听力仪器可包括无线接口,该无线接口适于使能建立到另一设备的无线链路,另一设备如拾取与用户的认知负荷的直接测量有关的数据的设备,前述数据如身体神经元组织上测量的电压。在实施例中,用户的当前认知负荷的估计完全或部分在物理上分开(与听力仪器分开,优选在另一体戴设备中)的设备中进行,及结果经有线或无线连接传给听力仪器。在实施例中,助听器系统包括双耳验配的两个听力仪器。在实施例中,两个听力仪器能够交换数据,如经无线连接,如经第三中间设备。这具有下述优点:信号有关的数据可更好地提取(由于两个助听器拾取的输入信号的空间差异),及给认知负荷的直接测量的输入可更好地拾取(通过空间上分布的传感器和/或电端子)。

在实施例中,助听器系统包括关于用户的工作记忆容量的信息保存于其中的储存器。在实施例中,估计单元适于基于用户的工作记忆容量估计用户的当前认知负荷。

在实施例中,助听器系统适于估计用户的当前工作记忆跨度。在实施例中,估计单元适于基于用户的当前工作记忆跨度的估计实现用户的当前认知负荷的估计。

可以预计,上面描述的、“具体实施方式”中详细描述的、及权利要求限定的方法的过程特征当由相应的结构特征适当代替时可与助听器系统结合,反之亦然。助听器系统的实施例具有与相应方法一样的优点。

计算机可读介质

此外,本发明提供储存计算机程序的有形计算机可读介质,计算机程序包括程序代码,当所述计算机程序在数据处理系统上运行时,其使数据处理系统执行如上所述的、“具体实施方式”中详细描述的及权利要求书限定的方法。

数据处理系统

此外,本发明提供数据处理系统,该数据处理系统包括处理器及使处理器执行如上所述的、“具体实施方式”中详细描述的及权利要求书限定的方法的程序代码。

本发明的进一步的目标通过从属权利要求和本发明的详细描述中限定的实施方式实现。

除非明确指出,在此所用的单数形式的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解,在说明书中使用的术语“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为“连接到”另一元件时,可以是直接连接或耦合到其他元件,也可以存在介于中间的元件。此外,如在此使用的“连接”或“耦合”可包括无线连接或耦合。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非明确指出,在此公开的任何方法的步骤不必须精确按所公开的顺序执行。

附图说明

下面将结合优选实施例和参考附图对本发明进行更充分地说明,其中:

图1为根据本发明第一实施例的助听器系统。

图2为根据本发明第二实施例的助听器系统,其中使用认知模型估计认知负荷。

图3为与听觉感知有关的人类认知系统的简化略图。

图4为根据本发明的助听器系统的各种实施例。

图5a示意性地示出了两个个体A和B之间的工作记忆容量的个体间差异;及图5b示意性地示出了个体A在三个不同的听音环境中的工作记忆跨度(WMS)的个体内差异,其中Q=安静,N=噪声,N+=更大噪声。

图6示意性地示出了实验结果,其中具有类似纯音听力图的临床听力受损受试验者被帮助以确保目标信号的可听性,及测试噪声下语音识别阈(SRT)(Lunner,2003)。

图7示出了散落图和回归线,其表明在快-慢压缩的调制噪声中认知性能得分和语音识别差量效益之间的Pearson相关性(Lunner&Sundewall-Thorén,2007)。

为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。

通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出,因为,对于本领域的技术人员来说,通过这些详细说明在本发明精神和范围内做出各种变化和修改是显而易见的。

具体实施方式

最近的数据已公布,这些数据暗示个体认知能力与不同的听音条件有关(Craik,2007;Gatehouse et al.,2003,2006b;Lunner,2003;Humes et al.,2003,Foo et al.,2007;Zekveld et al.,2007)。

工作记忆(WM)和个体差异

相较于输入信号清晰和未失真的情形,当听音由于许多声源干扰目标信号或由于因听力受损欠佳确定的输入信号而变得困难时,听音必须更多地依赖于知识和语境。随着听音更需要努力,出现从主要自底向上(基于信号)处理到主要自顶向下(基于知识)处理的转换。

在容易的自底向上处理和需要努力的自顶向下处理之间的权衡及在需要努力的听音期间向感知分配认知资源可依照工作记忆概念化(Jarrold&Towse,2006;Baddeley&Hitch,1974;Baddeley,2000;Daneman&Carpenter,1980)。WM的模型假定只有有限的资源容量,其限制可处理和保存的信息量(Just&Carpenter,1992)。

然而,WM容量的概念定义并不直接了当。根据Feldman Barrett等(2004),没有经过普遍协议的WM容量定义。WM有几个方面或组成,及WM功能的个体差异可源自这些方面或组成中的每一方面或组成。实际上,研究人员已研究了多个对WM个体差异起作用的性质(例如resource allocation,Just&Carpenter,1992;buffer size,Cowan,2001;processing capacity,Halford et al.,1998)。

然而,在下面假定,在容量约束内,资源可分配给处理或储存或同时分配给二者。当用于激活的储存需求或处理需求超出时,可导致特定任务所需要的总激活容量不足。结果可以是任务差错、暂时储存的信息损失(暂时记忆衰退、遗忘)或处理更慢。

对于大多数复杂任务包括语言理解的性能,WM的储存和处理功能均必要。例如,在嘈杂背景中会话时,信息必须储存在WM中以搞清随后的信息的意思。同时,作为听力损失和干扰噪声的结果,可能错过一些词或片断,因而,有限的认知处理资源中的部分需要分配给所说的推断。

对于特定个体,使工作记忆的处理功能负重担的许多因素将导致较少的资源分配给其储存功能。Pichora-Fuller(2007)考察了增加处理需求因而储存可能随之减少的情况的例子。它们包括增加辅助机动任务如手指轻敲(如Kemper et al.,2003)或在障碍上行走(如Li et al.,2001),及使信号失真或降低信噪比(SNR)或支持性上下文提示的可用性(如Pichora-Fuller et al.,1995)。相较更富挑战性的背景,即从安静发展为单一讲话人、两个讲话人、多个讲话人喋喋不休,当目标语音存在于不太富挑战性的背景中时言词或句子的回忆更好(Rabbitt,1968;Tun&Wingfield 1999;Wingfield&Tun 2001;Pichora-Fuller et al.,1995)。

个体间及个体内差异

Pichora-Fuller(2007)在工作记忆容量的个体间差异和个体内差异之间进行了非常有用的区别。当年龄调整时,在个体WM容量之间仍然有明显的差异(如Daneman&Carpenter,1980;Engle et al.,1992),即工作记忆容量存在个体间差异。假定容量有限,个体的WM容量花在处理信息上越多,则留给储存的越少,使得回忆方面的个体内差异可用于推断在变化情况下的处理需求的个体差异(Pichora-Fuller,2003,2007)。因而,如果储存需求超出(剩余的)储存容量,对于需要大的处理需求的情况如差SNR,回忆任务方面的个体内性能将受影响。

复杂的工作记忆任务同时具有储存(保持信息处于有效状态以供随后回忆)和处理(操纵信息用于当前计算)成分(Daneman&Carpenter,1980)。在使用句子的典型WM跨度任务中,测试对象读或听句子并完成需要尝试理解整个句子的任务(通过大声朗读、重复、或判断一些性质如句子是否有意义)。在表达一组句子之后,测试对象被要求回忆一组句子中的每一句子的目标字(通常为句子的结束字或句子的起始字)。递增回忆句组中的句子数量,跨度得分通常反映正确回忆的目标字的最大数量。具有较大跨度的个体被认为(Daneman&Carpenter,1980)相较具有较小跨度的个体具有更好的语言处理能力。图5a示意性地示出了两个个人A和B的工作记忆容量,A具有相对较小的工作记忆容量,及B具有相对较大的工作记忆容量。于是这代表“个体间差异”。对于特定个体,相较在其中测得较小跨度的情形,在其中测得较大跨度的情形被认为需求较少的处理。图5b示意性地示出了同一个体A在三种不同听音环境中的工作记忆跨度(WMS)的个体内差异,其中Q=安静,N=噪声,N+=更大噪声,这表明越困难的听音情形导致越小的WMS的关系。图5中所示的概念取自Pichora-Fuller,2007。

个体内差异可用于评估助听器干预后工作记忆跨度增加所引起的结果,其表明前述干预已导致较少的处理资源分配给听音,因为听音已变得更容易(Pichora-Fuller,2007)。换言之,助听器干预后WM跨度的增加(即WM储存的个体内改善)表明干预已导致听音变得更容易,因而所需要分配的WM处理资源更少。

在给定情形下,个体间差异可用于指导谁将受益于特定助听器信号处理方案,使得信号处理的好处和不利对照可用个体WM容量进行权衡。也就是说,在给定听音情形下,个体工作记忆容量可确定使用某一信号处理方案何时有利或何时不利。

因此,当前认知负荷的估计有利于确定具体听音情形下(对于特定个体)适当的助听器处理方案。参考图5,个体的总WM容量可在助听器使用之前(如在验配情形下)进行估计。个体在不同听音情形下的WMS(当前认知负荷的指示)可通过人类听觉系统的模型和/或通过直接测量如EEG测量和/或从当前听觉环境的检测器进行估计,参见下面的描述。

工作记忆和听力损失

对于具有听力损失的人,在富挑战性的信噪比(SNR)下听音变得需要努力,及对于听力受损人员,即使在相对有利的SNR情形下语音识别性能也会受影响(如Plomp,1988,McCoy et al.,2005;van Boxtel et al.,2000;Larsby et al.,2005)。由于增加的听音努力对应于有限的WM资源不相称地分配给感知处理,从而给储存留下较少的资源,可以预见,耳背的听者对复杂听觉任务相较正常听力听者更差。实际上,Rabbitt(1990)的结果表明,对于耳背的听者,信息处理容量资源更大程度上分配给初始感知语音输入的任务,对随后的回忆留下较少的资源。

包括听力损失的个体内差异的例子。噪声中的受助语音识别:

Lunner(2003)报告了一个实验,其中具有相似纯音听力图的72位临床听力受损受试验者被帮助以确保目标信号的可听性及对噪声中的语音识别阈进行测试。纯音听觉阈值不说明语音识别阈的(高达10dB SNR)的跨受试验者变化。然而,如通过读跨度测试所测量的(Daneman&Carpenter,1980;1990),个体工作记忆容量说明个体间变化的约40%,表明更大的工作记忆容量与更大的抗干扰噪声相关联。实验结果的该趋势在图6中示意性地示出。因而,假定工作记忆容量在语音识别阈处受到挑战是合理的。

助听器信号处理和个体WM差异

助听器处理本身可向听音挑战,使得认知处理资源的个体差异与使用特殊类型的技术成功听音有关。

目前,有几种可用在助听器中的“帮助”系统,这些系统用于帮助听力受损人员挑战听音情形。通常,目标在于通过一些手段除去被认为不太重要的信号和/或强调或增强被认为更重要的信号。在商用助听器中很普遍的这类系统包括定向传声器、降噪方案、及快速宽动态范围压缩方案。所有这些系统在不同情形下的适用性方面均具有其益处和不利。在下面,这些系统及将来可能的系统的几个例子按照个体WM差异进行考察。争论点在于改善语音识别的信号处理同时具有肯定和否定结果,但针对个体的这些结果可取决于个体WM容量。因而,在给定情形下使用信号处理系统的明智行为可取决于助听器用户的个体WM容量。这些系统分开进行讨论,尽管在具有更多结果的这些系统之间可能有交互。

在不太富挑战性的听音情形下的助听器信号处理

几个研究表明,纯音听觉阈值提高是安静背景条件下语音识别性能的主要决定因子,前述安静背景如与一人会话或在未受到干扰的条件下听电视(例如参见Dubno et al,1984;Schum et al,1991;Magnusson et al,2001)。因而,在不太富挑战性的情形下,工作记忆的个体差异可能是第二重要的方面;个体外围听力损失限制性能,及该性能很大程度上可由可听性说明。拥有较大的工作记忆容量换得相对小的益处。在这些情形下,调用额外的“帮助”系统可能多余甚或反而不利。

在富挑战性的听音情形下的定向传声器

定向传声器的功能

现代助听器通常具有在全向和定向传声器之间切换的选项。定向传声器系统设计成利用语音和噪声之间的空间差别。相较来自后面和两侧的声音,定向传声器对来自正面的声音更敏感。假设正面信号最重要,而来自其它方向的声音不太重要。已开发几个算法来最大地衰减来自后半球的移动或固定噪声源(例如参见van den Bogaert et al.2008)。

通常有在估计对特定类型的传声器有利的情形下在定向传声器和全向传声器之间自动切换的算法。调用定向传声器的决定通常基于所估计的SNR低于给定阈值,及通过估计目标信号是否来自正面位置进行。

定向传声器的益处

在Ricketts(2005)的考察中,在某些与现实世界中所遭受相类似的嘈杂环境中,定向传声器相比于全向传声器的益处即SNR改善高达6-7dB,通常为3-4dB;也就是说,如果(a)只是出现适度混响,(b)听者面向感兴趣的声源,及(c)距该声源的距离相当短。噪声下SRT表明与SNR改善一致的改善(Ricketts,2005)。因而,在某些给定情形下,定向传声器具有清晰且备有证明文件的益处。

定向传声器的缺点

如果目标不在正面或如果有多个目标,定向传声器对来自其它方向的声源相较正面声源进行衰减可能干涉听觉场景(Shinn-Cunningham,2008a,b)。在自然通信中,为监视目的,关注切换到不同的位置。因此,在需要转换关注的情形下,首选全向传声器。

Van den Bogaert等(2008)已表明,定向传声器算法对目标和噪声源的定位具有很大影响。

定向和全向传声器之间的意外或动机不明的自动切换可能干扰认知,如果该切换干涉听音情形的话(Shinn-Cunningham,2008b)。

WM的个体内差异与定向传声器

Sarampalis等(2009)已通过在-2dB和+2dB之间变化SNR研究个体内差异,通过定向传声器与全向传声器比较模拟SNR改善。WM测试为双任务,其中(a)所涉及的听音任务重复耳机上呈现的句子的最后单词,及(b)第二任务基于Pichora-Fuller等(1995)使用的记忆任务,其中,在每8句之后,参与者被要求回忆其已报告的最后8个单词。结论是,在+2dB SNR下,第二记忆回忆任务的性能明显增加。

这表明,在某些嘈杂情形下,定向传声器干预具有释放工作记忆资源以保留储存容量的益处。

个体WM差异与定向传声器

如上面所注意的,在非正面位置具有冲突/多个目标的情形下,首选全向传声器。另一方面,定向传声器干预可释放工作记忆资源。因此,使用定向传声器的决定可取决于个体WM容量。例如,考虑图6及假定具有0dB SNR(虚线)的情形。WM容量的个体间和个体内差异在给定情形下确定定向传声器对给定个体的益处方面也可扮演重要角色。例如,考虑图6及假定具有0dB SNR(虚线)的情形。如果假定噪声下个体SRT反映WM容量受到严重挑战时的SNR,图6表明,对于高WM容量的人,WM容量极限在约-5dB时受到挑战。在0dB SNR,具有高WM容量的人可能拥有使用全向传声器的WM容量,而在-5dB时,该人需要牺牲全向益处并使用定向传声器以释放WM资源。然而,对于具有低WM容量的人,即使0dB情形也可能挑战WM容量极限。因此,该人可通过在0dB时选择定向传声器以释放WM资源而得到最好的帮助,从而牺牲全向益处。因而,在其时调用定向传声器的SNR选择应在全向和定向益处与个体WM容量之间权衡,及WM性能的个体间差异可用于个别地设定在其时助听器自动从全向转换到定向传声器的SNR阈值。

因而,调用定向传声器的选择在全向和定向益处之间权衡并取决于个体WM容量。这暗示WM性能的个体间差异可用于个别地设定在其时助听器自动从全向转换到定向传声器的SNR阈值。

在富挑战性的听音情形下的降噪系统

降噪系统,或更具体地,单传声器降噪系统试图通过一些仅对一个传声器输入起作用的分离算法使目标语音与干扰噪声分离,其中对分离的语音和噪声估计应用不同的放大,从而增强语音和/或衰减噪声。

商用助听器中的降噪系统

有几种方法可获得分离的语音和噪声信号估计。目前助听器中的一种方法是使用调制指数作为估计的基础。基本原理是语音相较噪声包括更大程度的调制(例如参见Plomp,1994)。计算调制指数的算法通常对几个频带起作用,及如果频带包括高调制指数,则该频带被分类为包括语音因而给予更大的放大,而具有较小调制的频带则分类为噪声因而被衰减(例如参见Holube et al.,1999)。其它降噪方法包括使用针对语音的水平分布功能(EP 0 732 036)或通过同步检测进行的话音活动检测(Schum,2003)。然而,短时基础(毫秒)上的语音和噪声成分的估计非常困难,及可能出现误分类。因此,助听器中的商用降噪系统通常在语音和噪声成分的估计方面非常保守,因而仅进行相当长期的噪声或语音估计。这样的系统在噪声中的语音识别方面尚未表现出改善(Bentler&Chiou,2006)。然而,典型商用降噪系统确实降低了噪声的总响度,这因而被认为相较没有该系统的情形更舒适(Schum,2003),因而与使用助听器相关联的烦恼和疲劳减少。

短时降噪方法

更强烈形式的降噪系统在包括“频谱减法”或加权算法的文献中发现,其中按目标信号的简短暂停或通过对语音和噪声的统计性质建模而估计噪声(如Ephraim&Malah,1984;Martin,2001;Martin&Breithaupt,2003;Lotter&Vary 2003;for a review see Hamacher et al.,2005)。语音和噪声的估计在多个频带中在短时基础上相减或加权,这给出较少嘈杂信号的印象。然而,其代价是出现通常称为“音乐噪声”的新类型的失真。该“外来”人为信号可能增加认知负荷,其可耗用工作记忆资源。因此,在优化这些算法时,要在降噪量和失真量之间进行权衡。

WM的个体内差异与短时降噪

Sarampalis等(2006,2008,2009)基于Ephraim&Malah(1984)算法研究了正常听力听者和具有轻微到中度感觉神经听力损失的听者在有降噪方案和没有降噪方案时的表现。测试为双任务范例,主要任务为立即重复所听到的句子,次要任务是随后在8个句子之后回忆。句子材料为具有高和低语境的句子(Pichora-Fuller et al.,1995)。对于正常听力受试验者,在无语境句子时降噪对回忆有一些改善。因而,该算法通过减少认知努力及改善回忆任务的性能而减轻了噪声的一些有害影响。此外,听音努力使用双任务方法进行评估,听者同时执行可视反应时间(RT)任务。结果表明,RT任务的性能因存在噪声而受到负面影响。然而,对听力受损受试验者的性能的作用很大程度上未受降噪处理开或关的影响。因此,Sarampalis等(2008)辩论说,对于听力损失的情况,当在噪声中听语音时更大程度地依赖于自顶向下处理。

用于降噪的二进制掩模方法

从语音-噪声混合声分离语音的另一新近方法是使用二进制时频掩模(如Wang,2005;Wang,2008;Wang et al.,2009)。该方法的目标在于从语音/噪声混合声产生二进制时频式样。每一局部时频单元根据局部SNR被赋值1或0。如果局部SNR有利于语音信号,则该单元被赋值1,否则被赋值0。之后,该二进制掩模被直接应用于原始语音/噪声混合声,从而衰减噪声片断。该方法的难题在于找到局部SNR的正确估计量。

然而,理想的二进制掩模(IBM)已用于研究该技术用于听力受损受试验者的可能性(Anzalone et al.,2006;Wang,2008;Wang et al.,2009)。在IBM处理中,局部SNR预先已知,其不处于具有非理想语音和噪声信号检测器的现实情形。因而,IBM不可直接用于助听器。Wang等(2009)通过评估噪声下SRT估计了IBM处理对听力受损听者的语音可懂度的影响。对于自助餐厅背景,Wang等(2009)观察到听力受损听者有15.6dB的SRT降低(改善)。

然而,IBM可能对目标语音信号产生认知负荷畸变,在语音和噪声不可分开利用但必须进行估计的现实二进制掩模应用中甚至更甚。因而,在现实降噪系统中必须在降噪和失真之间进行权衡。

WM的个体内差异与理想的二进制掩模

在Wang等(2009)中,在自助餐厅噪声下平均SRT用IBM从-3.8dB改善到-19.4dB。如果假定个体SRT反映WM容量受到严重挑战的情形,这表明在困难听音情形下应用IBM处理将释放工作记忆资源以保留储存容量及恢复信息处理速度。

个体间WM差异与现实降噪方案

在听者的认知系统未受挑战的情形下,使用降噪系统可能多余甚或反而不利。因此,降噪系统的任何益处将仅可能在工作记忆系统受到挑战的情形下才明显。

然而,由于现实短时降噪方案(包括现实二进制掩模处理)将依赖于降噪量和处理失真最小化之间的权衡,调用这样的系统可能取决于个体WM差异,暗示在给定听音情形下具有高WM容量的人相较具有低WM容量的人可能容忍更大的失真因而容忍更强烈的降噪。

在富挑战性的听音情形下的快速宽动态范围压缩

快速宽动态范围压缩(WDRC)系统通常称为快速压缩或音节压缩,如果其足够快地适于对具有不同短时频谱的相邻语声提供不同的增益-频率响应的话。

慢速WDRC系统通常称为慢速压缩或自动增益控制。这些系统在给定语音/噪声听音情形下保持其增益-频率响应接近常数,因而保持语音信号中的短时频谱之间的差。助听器压缩器通常具有随频率变化的压缩比,因为听力损失随频率变化。增益-频率响应的压缩变化通常由几个频带中的输入信号水平控制。然而,信号处理的实施细节趋于在两个研究之间不同,及WDRC可以许多方式按不同目的进行配置(Dillon,1996;Moore,1998)。总的来说,可因至少三个不同的目标在助听器中应用压缩(如Leijon&Stadler,2008):

1、以舒适响度水平呈现语音,补偿话音特征和讲话者距离的变化。

2、如果用对话语音所需要的增益-频率响应放大,保护听者免遭不舒适高声的瞬时声音。

3、通过使非常弱的语音片断也听得见而改善语音理解,同时依然以舒适的水平呈现更大声的语音片断。

快速压缩器一定程度上可满足所有三个目的,而慢速压缩器独自仅可实现第一目标。

快速压缩在语音识别方面可能具有两个相反的效果:(a)其对弱语音成分提供另外的放大,否则该成分可能听不见;及(b)其降低语声之间的频谱对比。

快速压缩的相反效果中的哪一效果对个体在噪声中的语音识别最重要尚未进行大量研究,包括个体WM容量可怎样影响结果。通过改变压缩速度系统研究个体差异的第一研究是Gatehouse等(2003,2006a,2006b)。这些研究表明,认知容量和听觉生态学领域对解释噪声中的语音识别和主观评估的听音舒适度的个体结果很重要。在重复Gatehouse等的研究的认知发现的研究中(Lunner&Sundewall-Thorén,2007),在调制噪声的情况下,听者的认知测试得分与快速压缩对慢速压缩的特异优点明显相关(参见图7)。图7提供了散落图和回归线,其表明在快-慢压缩的调制噪声中认知性能得分和语音识别差量效益之间的Pearson相关性。在快减慢效益(dB)轴上的正值意味着快速压缩相较慢速压缩获得更好的噪声下SRT(Lunner&Sundewall-Thorén,2007)。然而,有其它研究展现稍微不同图案的、关于认知性能和快及慢压缩的结果(Foo et al.,2007,Rudner et al.,2008)。

个体WM差异与快速压缩

Naylor&Johannesson(2009)已表明,根据实际长期输入SNR、混合的信号和噪声的调制特征、及所测试系统的振幅压缩特征之间的交互作用,在包括振幅压缩的放大系统的输出处的长期SNR可高于或低于输入处的长期SNR。具体地,在某些情形下,调制噪声的快速压缩在负SNR时可增加输出SNR及在正SNR时可降低输出SNR。这样的SNR变化可能影响压缩助听器用户的感知性能。源自快速压缩的SNR变化还以与SNR变化一样的方向影响感知性能(G.Naylor,R.B.Johannessen&F.M.personal communication,December 2008),即在低(负)SNR表演的人在某些情形下可从快速压缩获得益处,而在高(正)SNR表演的人可能获得不利。因而,是发生听音时的SNR确定快速压缩是否有利。因此,在负SNR时有能力获得噪声下语音识别阈(SRT)的、具有高WM容量的人(例如参见图6)在该情形下可受益于快速压缩,而其噪声下SRT在正SNR的具有低WM容量的人则因快速压缩而不利。

认知助听器

从上面的例子可以看出,当开发助听器信号处理算法时及当针对个体助听器用户进行调节时,应虑及个体间和个体内WM差异。调用定向传声器的选择可能是全向和定向益处之间的权衡及依赖于个体WM容量。现实短时降噪方案将依赖于降噪量和处理失真最小化之间的权衡及可能依赖于个体WM容量。快速压缩益处和不利之间的权衡可能取决于个体WM容量。

上面的信号处理系统描述为“用于困难情形的帮助系统”。它们仅应在有利于释放认知资源时使用;在不太富挑战性的情形下,留给大脑解决这些情形可能是聪明的做法,仅以慢速压缩实现声音的可听性。

需要实时监视个体认知负荷以能够确定听音情形何时那样困难以致于工作记忆资源受到挑战。因此,需要开发用于估计认知负荷的监视方法。两条不同的路线出现:间接估计认知负荷及直接估计认知负荷。

间接估计认知负荷将使用某些形式的认知模型,其用监视听音环境的环境检测器(如水平检测器、SNR检测器、语音活动检测器、混响检测器)持续更新。认知模型还需要用个体认知容量(如工作记忆容量、口头信息处理速度)进行校准,及在听音环境监视器、助听器处理系统和认知容量之间必须建立连接。灵感可能从等(2008)的语言理解容易(ELU)模型找到,其具有暗示听者的工作记忆系统何时从容易的内隐处理切换到需要努力的外显处理的框架(尚未发展)。

使用认知负荷的直接估计可用作认知模型的备选或逾期结合。环境特征、信号处理特征和/或认知减缓之间的关系优选包括在认知负荷的估计中。直接了当但技术上富有挑战性的直接估计认知负荷可通过监视流动的脑电图(EEG,Gevins et al.,1997)获得。这样的系统已由Lan等(2007)提出,其基于EEG测量按照非固定的认知状态分类系统评估受试验者的智力负荷。

图1示出了根据本发明第一实施例的助听器系统。

图1a实施例中的听力仪器包括用于将输入声音(声音入)转换为电输入信号的输入变换器(在此为传声器)、用于根据用户需要处理输入信号并提供处理后输出信号的信号处理单元(DSP)、及用于将处理后输出信号转换为输出声音(声音出)的输出变换器(在此为接收器)。在图1(和图2)的实施例中,输入信号通过模数转换器单元(AD)从模拟转换为数字形式,及处理后输出通过数模转换器(DA)从数字转换为模拟信号。因此,信号处理单元(DSP)为数字信号处理单元。在实施例中,数字信号处理单元(DSP)适于在多个子频率范围或频带中(如2和64频带或更多频带之间,如128个频带)独立处理听力仪器考虑的输入信号的频率范围(如在20Hz和20kHz之间)。听力仪器还包括估计单元(CL估计器),用于估计用户的认知负荷及提供用户当前认知负荷的输出指示该输出指示馈送给信号处理单元(DSP)并在选择适当的处理措施时使用。估计单元接收与认知负荷有关的一个或多个输入(CL输入)并基于其进行估计(在估计信号中体现)。给估计单元的输入(CL输入)可源自认知负荷的直接测量(参见图1b)和/或源自人类听觉系统的认知模型(参见图2)。

来自估计单元的估计信号用于根据(即当前认知负荷的估计)调整信号处理。

图1b示出了根据本发明的助听器的实施例,其与图1a实施例的不同之处在于其包括用于向用户的当前认知负荷的直接测量提供输入的单元。在图1b的实施例中,测量单元提供当前EEG(单元EEG)、当前体温(单元T)和计时信息(单元t)的直接测量。听力仪器的实施例可包含这些测量单元中的一个或多个或指示用户的当前认知负荷的其它测量单元。测量单元可位于不同于听力仪器部件的分开的物理体内,两个或两个以上物理上分开的部分通过有线或无线彼此接触。给测量单元的输入可通过用于拾取用户身体的电压变化的测量电极产生,这些电极位于听力仪器中和/或位于物理上分开的装置中,参见图4及相应的描述。

认知负荷的直接测量可以不同的方式获得。

在一实施例中,认知负荷的直接测量通过Lan等(2007)提出的流动的脑电图(EEG)获得,其中流动的认知状态分类系统用于基于EEG测量(图1b中的单元EEG)评估受试验者的智力负荷。例如参见Wolpaw et al.(2002)。

这样的流动的EEG可通过在助听器壳的表面中制造两个或两个以上用于该目的的适当电极而在助听器中获得,其中助听器壳接触耳道内或耳道外的皮肤。电极之一为参考电极。此外,另外的EEG通道可通过使用第二助听器(另一只耳朵)并通过EEG信号的无线传输或通过一些其它传输线路(例如通过另一可佩戴处理单元或通过局域网的无线方式,或通过有线)使EEG信号传给另一只耳朵(e2e)而获得。

作为备选,EEG信号也可输入给神经网络以用作具有声参数的培训数据从而基于声输入和认知负荷的直接认知测量获得培训网络。

EEG信号属于低电压信号,约5-100μV。该信号需要高放大以在典型AD转换的范围内(~2-16V到1V,16位转换器)。高放大可通过使用同一AD转换器上的模拟放大器实现,因为转换中的二进制切换利用高增益使尽可能快的从“0”跃迁到“1”。在实施例中,听力仪器(如EEG单元)包括特别适于衰减或去除来自EEG信号的(如与用户运动有关的,与环境噪声有关的,与不相关神经活动有关的)伪迹的校正单元。

在另一实施例中,认知负荷的直接测量可通过监视体温(图1b中的单元T)获得,体温的增加/改变表明认知负荷增加。例如,体温可使用一个或多个热元件进行测量,如位于助听器接触皮肤表面处的热元件。认知负荷和体温之间的关系在Wright等(2002)中讨论。

在另一实施例中,认知负荷的直接测量可通过使用眼睛-摄像机的瞳孔测量学获得。相较较小收缩的瞳孔,更多收缩的瞳孔意味着相对更高的认知负荷。认知(记忆)负荷和瞳孔反应之间的关系在Pascal等(2003)中讨论。

在另一实施例中,认知负荷的直接测量可通过按钮获得,当认知负荷高时助听器用户按压该按钮。

在另一实施例中,认知负荷的直接测量可通过测量一天的时间获得,确认在一天结束时认知疲劳更似是而非(参见图1b中的单元t)

图2示出了根据本发明第二实施例的听力仪器,其中在估计认知负荷时使用认知模型。

图2中所示听力仪器的实施例包括与图1a中所示及结合其描述的元件一样的元件。图2的听力仪器还包括人类听觉系统的认知模型(图2中的CM)。例如,认知模型(CM)实施为具有经指示用户的相应智力技能的输入信号(图2中的CM输入)接收的输入参数的算法,通常针对所涉及用户进行定制,及电输入信号(图2中的SP输入)的相应性质的输入指示。基于输入及模型算法,所涉及人的认知负荷的一个或多个输出信号(图2中的CL输入)指示由认知模型(CM单元)产生。这些输出馈给估计单元(CL估计器)用于估计用户的认知负荷及提供用户的当前认知负荷的输出指示该输出馈给信号处理单元(DSP)并在选择适当的处理措施时使用。用户的当前认知负荷的输出指示使能至少在两个智力状态之间区分:智力资源使用(认知负荷)高和低。优选地,实施两个以上的估计认知负荷水平,如3个水平(低、中和高)。例如,认知模型实施为数字信号处理单元的一部分(如集成在图2的信号处理单元DSP中)。

基于估计单元的信号输出信号处理单元(DSP)调整其处理。电输入的处理随认知负荷及输入信号的特征而变。

给认知模型的用户专有输入(用户的相应智力技能的指示)包括一个或多个参数如用户年龄、用户长期记忆、用户词汇访问速度、工作记忆中的用户外显储存及处理容量、用户听力损失对频率等。用户专有输入通常在“离线”过程中提前确定,例如在给用户验配听力仪器期间确定。

给认知模型的信号专有输入包括一个或多个参数如时间常数、混响量、背景声音中的起伏量、能量对信息掩蔽、声源的空间信息、信噪比等。

根据与用户的认知负荷有关的输入采取的适当处理措施在下述功能帮助选项之间选择:定向信息方案、压缩方案、语音检测方案、降噪方案、时频掩蔽方案、及其组合。

认知模型(CM)将在听力仪器中基于下述内容实时预测此刻从个体需要何种程度的外显/需要努力的处理:(a)可从声输入提取的参数(SP输入,如混响量、背景声音中的起伏量、能量对信息掩蔽、声源的空间信息);及(b)个体的认知状态的先验知识(CM输入,如WM容量、备用资源、长期记忆模板的质量、处理速度)。在实施例中,听力仪器适于为人的认知状态的在线测试提供基础。在实施例中,认知模型基于神经网络。

图3示出了与听觉感知有关的人类认知系统的简化略图。包括语音的输入声音(输入声音)由人类听觉系统(认知系统、感知)处理。在最佳听音情形下,语音信号容易且自动地进行处理(内隐?是=>内隐处理)。这意味着,所涉及的认知处理很大程度上为无意识及内隐处理。然而,听音条件经常欠佳,这意味着内隐认知处理不足以解锁语音流中的含意(内隐?否=>外显处理)。在对话中解决先前语音元素之间的歧义及构建前瞻交换的预期是可能出现的复杂过程的例子。这些过程是需要努力及有意识的过程,因而涉及外显认知处理(外显)。两种情形均传送一些种类的输入声音感知(感知)。本发明的目的在于在关于当前最佳信号处理的决定中包括当前认知负荷的估计(如输入声音的内隐和外显处理之间的区别)以改善用户对输入声音的感知(相较于仅基于输入声音信号的特征及听力仪器的如验配期间的预定设置进行这样的决定的情形)。

图4示出了根据本发明的助听器系统的各个实施例。图4的助听器系统包括适于由用户1佩戴在耳朵处或耳朵中的听力仪器。图4a示出了听力仪器的“耳内”(ITE)部件2。ITE部件适于完全或部分位于用户1的耳道中。ITE部件2包括位于ITE部件表面上(或从其伸出)的两个电端子21。ITE部件包括适合特定用户的耳道的塑模。塑模通常由形态稳定的塑料材料通过注模工艺制成或通过快速原型制作工艺如数控激光切割工艺形成(参见EP 1 295 509及其中的文献)。ITE部件的主要问题在于其与耳道紧配合。因而,接触耳道壁的塑模的表面上(或从表面伸出)的电接点很适于形成对身体的电接点。图4b示出了根据本发明的听力仪器的(一部分的)另一实施例。图4b示出了“耳后式”听力仪器的BTE部件20,其中BTE部件适于位于用户1的耳朵(外耳,图4c和4d中的12)后面。BTE部件包括4个电端子21,其中两个位于BTE部件的面上,其适于由耳朵(外耳)附着到颅骨处的脊支撑,及其中两个位于BTE部件的面上并适于由颅骨支撑。电端子特别适于从用户拾取与用户的认知负荷的直接测量有关的电信号。电端子可全部服务于同一目的(如测量EEG)或服务于不同目的(如三个用于测量EEG及一个用于测量体温)。用于与人体形成良好电接触的电端子(电极)在关于EEG测量的文献中描述(例如参见US 2002/028991或US 6,574,513)。

图4c示出了根据本发明的助听器系统的实施例,其另外包括用于当前认知负荷的直接测量但不位于听力仪器21中的电端子3或传感器。在图4c的实施例中,另外的电端子3适于通过电端子3和一个或两个ITE部件之间的有线连接与听力仪器连接。电端子优选包括用于(从身体)拾取相对低的电压及用于将该电压的值表示传给听力仪器的信号处理器(在此位于ITE部件中)的电子电路。有线连接可沿柔软的支撑件31行进(或形成其部分),支撑件适于将电端子保持在用户头部上的适当位置。另外的电端子中的至少一个(在此为电端子3)优选位于用户头部的对称平面中(由用户鼻子的线11定义,耳朵关于该平面对称地定位)并构成参考端子。

图4d示出了根据本发明的助听器系统的实施例,其另外包括用于当前认知负荷的直接测量的多个电端子或传感器,这些电端子或传感器均不位于(在此为BTE)听力仪器2中。图4d的实施例与图4c的实施例几乎一样,但另外包括体装式装置4,该装置具有2个安装成与身体组织良好电接触的电端子21。在实施例中,装置4包括放大和处理电路以使能处理由电端子拾取的信号。在该情形下,装置4可用作传感器并提供处理后输入给用户的当前认知负荷的估计(如估计本身)。装置4及听力仪器2中的至少一个中的每一个包括无线接口(包括相应的收发器和天线),用于在装置之间建立无线链路5从而用于在体装式装置4和听力仪器2之间交换数据。无线链路可基于近场(电容电感耦合)或远场(辐射场)电磁场。

本发明由独立权利要求的特征限定。从属权利要求限定优选实施例。权利要求中的任何附图标记并非意于限定其范围。

一些优选实施例已经在上述内容中进行了说明,但是应当强调的是本发明不受这些实施例的限制,而是可以权利要求限定的主题内的其它方式实现。

参考文献

·Anzalone,M.C.,Calandruccio,L.,Doherty,K.A.&Carney,L.H.(2006).Determination of the potential benefit of time-frequency gain manipulation.Ear and Hearing,Vol.27,2006,pp.480-492.

·Awh E.,Vogel E.K.&Oh S.H.(2006),Interactions between attention and working memory,Neuroscience,Vol.139,2006,pp.201–208.

·Baddeley,A.D.&Hitch,G.J.(1974).Working memory.In G.H.Bower(ed.),The psychology of learning and motivation,Vol.8,pp.47–89.New York,NY:Academic Press,1974.

·Baddeley A.D.(2000).The episodic buffer:a new component of working memory?Trends Cogn.Science,Vol.4,2000,pp.417-423.

·Cowan,N.(2001).The magical number 4in short-term memory:A reconsideration of mental storage capacity.Behavioral and Brain Sciences,Vol.24,2001,pp.87–185.

·Craik,F.I.M.(2007).Commentary:The role of cognition in age-related hearing loss.Journal of the American Academy of Audiology,Vol.18,2007,pp.539-547.

·Daneman,M.&Carpenter,P.A.(1980).Individual differences in integrating information between and within sentences.Journal of Experimental Psychology:Learning,Memory and Cognition,Vol.9,1980,pp.561-584.

·Dillon,H.(1996).Compression?Yes,but for low or high frequencies,for low or high intensities,and with what response times?Ear and Hearing,Vol.17,1996,pp.287-307.

·Dillon H.(2001),Hearing Aids,Thieme,New York-Stuttgart,2001.

·Dubno,J.R.,Dirks,D.D.&Morgan,D.E.(1984).Effects of age and mild hearing loss on speech recognition in noise.Journal of the Acoustical Society of America,Vol.76(1),1984,pp.87–96.

·Edwards B.(2007),The Future of Hearing Aid Technology,Trends in Amplification,Vol.11,No.1,2007,pp.31-46.

·Engle,R.W.,Cantor,J.&Carullo,J.J.(1992).Individual differences in working memory and comprehension:A test of four hypotheses.Journal of Experimental Psychology:Learning,Memory,and Cognition,Vol.18,1992,pp.972-992.

·Engle W.,Kane J.M.&Tuholski S.W.(1999),Individual differences in working memory capacity and what they tell us about controlled attention,general fluid intelligence,and functions of the prefrontal cortex.In A.Myake&P.Shah(Eds.),Models of working memory,1999,pp.102-134,Cambridge(CUP).

·EP 0 732 036 B1(TOEPHOLM&WESTERMANN)19-09-1996

·EP 1 295 509(PHONAK)26-03-2003.

·Ephraim,Y.&Malah,D.(1984).Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator,IEEE Transactions on Acoustics,Speech and Signal Processing,Vol.32(6),1984,pp.1109–1121.

·Feldman Barrett,L.,Tugade,M.M.&Engle,R.W.(2004).Individual Differences in Working Memory Capacity and Dual-Process Theories of the Mind.Psychological Bulletin,Vol.130(4),2004,pp.553–573.

·Foo C.,Rudner M.,J.&Lunner T.(2007),Recognition of speech in noise with new hearing instrument compression release settings requires explicit cognitive storage and processing capacity,J.Am.Acad.Audiol.,Vol.18,2007,pp.553-566.

·Gatehouse,S.,Naylor,G.&Elberling,C.(2003),Benefits from hearing aids in relation to the interaction between the user and the environment,Int.J.Audiol.,Vol.42(Suppl 1),2003,pp.S77-S85.

·Gatehouse et al.(2006a),Gatehouse S.,Naylor G.,Elberling C.,Linear and nonlinear hearing aid fittings-1.Patterns of benefit,Int.J.Audiol.Vol.45(3),Mar.2006,pp.130-52.

·Gatehouse et al.(2006b),Gatehouse S.,Naylor G.,Elberling C.,Linear and nonlinear hearing aid fittings-2.Patterns of candidature,Int.J.Audiol.,Vol.45(3),Mar.2006,pp.153-71.

·Gevins,A.,Smith,M.E.,McEvoy,L.&Yu,D.(1997).High resolution EEG mapping of cortical activation related to working memory:effects of task difficulty,type of processing,and practice.Cerebral Cortex,Vol.7(4),1997,pp.374–385.

·Gobet,F.,Lane,P.C.R.,Croker,S.,Cheng,P.C-H.,Jones,G.,Oliver,I.&Pine,J.M.(2001),Chunking mechanisms in human learning,TRENDS in Cognitive Sciences,Vol.5,2001,pp.236-243.

·Gobet,F.&Simon,H.A.(2000),Five seconds or sixty?Presentation time in expert memory,Cognitive Science,Vol.24,2000,pp.651-682.

·Halford,G.S.,Wilson,W.H.&Phillips,S.(1998).Processing capacity defined by relational complexity:Implications for comparative,developmental,and cognitive psychology.Behavioral and Brain Sciences,Vol.21,1998,pp.803–865.

·Hamacher,V.,Chalupper,J.,Eggers.J.,Fischer,E.,Kornagel,U.,Puder,H.&Rass U.(2005).Signal Processing in High-End Hearing Aids:State of the Art,Challenges,and Future Trends.EURASIP Journal on Applied Signal Processing,Vol.18,2005,pp.2915–2929.

·Hannon B.&Daneman M.(2001),A new tool for measuring and understanding individual differences in the component processes of reading comprehension,J.Educ.Psychol.,Vol.93(1),2001,pp.103-128.

·R.C.Hendriks,R.Heusdens,and J.Jensen(2005),.Adaptive time segmentation of noisy speech for improved speech enhancement;in IEEE Int.Conf.Acoust.,Speech,Signal Processing,March 2005,Vol.1,pp.153.156.

·Holube,I.,Hamacher,V.&Wesselkamp,M.(1999).Hearing Instruments:noise reduction strategies,in Proc.18th Danavox Symposium:Auditory Models and Non-linear Hearing Instruments,Kolding,Denmark,September.

·Hopkins&Moore(2007),Moderate cochlear hearing loss leads to a reduced ability to use temporal fine structure information,J Acoust.Soc.Am.,Vol.122(2),2007,pp.1055-1068.

·Humes,L.E.,Wilson,D.L.&Humes,A.C.(2003).Examination of differences between successful and unsuccessful elderly hearing aid candidates matched for age,hearing loss and gender.International Journal of Audiology,Vol.42,2003,pp.432-441.

·Jarrold,C.&Towse,J.N.(2006).Individual differences in working memory.Neuroscience,Vol.139,2006,pp.39-50.

·Jones,G.,Gobet,F.,&Pine,J.M.(2009),Linking working memory and long-term memory:A computational model of the learning of new words.Developmental Science,Vol.10,No.6,Nov.2007,pp.853-73.

·Just,M.A.&Carpenter,P.A.(1992).A capacity theory of comprehension—individual differences in working memory.Psychological Review,Vol.99,1992,pp.122–149.

·Kates J.M.(2008),Digital Heaing Aids,ISBN13:978-1-59756-317-8:Plural Publishing Inc,San Diego,CA.

·Kemper,S.,Herman,R.E.&Lian,C.H.T.(2003).The costs of doing two things at once for young and older adults:Talking,walking,finger tapping,and ignoring speech or noise.Psychology and Aging,Vol.18,2003,pp.181–192.

·Lan et al.(2007),Lan T.,Erdogmus D.,Adami A.,Mathan S.&Pavel M.(2007),Channel Selection and Feature Projection for Cognitive Load Estimation Using Ambulatory EEG,Computational Intelligence and Neuroscience,Volume 2007,Article ID 74895,12 pages.

·Laird,Rosenbloom,Newell,John and Paul,Allen(1987)."Soar:An Architecture for General Intelligence".Artificial Intelligence,Vol.33,1987,pp.1-64.

·Larsby,B.,M.,Lyxell,B.&Arlinger,S.(2005).Cognitive performance and perceived effort in speech processing tasks:Effects of different noise backgrounds in normal-hearing and hearing impaired subjects.International Journal of Audiology,Vol.44(3),2005,pp.131–143.

·Leijon,A&Stadler,S.(2008).Fast amplitude compression in hearing aids improve audibility but degrades speech information transmission.Internal report 2008-11;Sound and Image Processing Lab.,School of Electrical Engineering,KTH,SE-10044,Stockholm,Sweden

·Li K.Z.H.,Lindenberger U.,Freund A.M.&Baltes P.B.(2001),Walking while memorizing:Age-Related differences in compensatory behavior.Psychol.Sci.,Vol.12(3),2001,pp.230–237.

·Lotter,T.&Vary,P.(2003).Noise reduction by maximum a posteriori spectral amplitude estimation with super gaussian speech modeling,”in Proc.International Workshop on Acoustic Echo and Noise Control(IWAENC’03),pp.83–86,Kyoto,Japan,September 2003.

·Luce P.A.&Pisoni D.A.(1998),Recognising spoken words:the neighbourhood activation model,Ear Hear,Vol.19,1998,pp.1-36.

·Lunner T.(2003),Cognitive function in relation to hearing aid use,Int.J.Audiol.,Vol.42(Suppl.1),2003,pp.S49-S58.

·Lunner T.&Sundewall-Thorén E.(2007),Interactions between cognition,compression,and listening conditions:effects on speech-in-noise performance in a two-channel hearing aid,J.Am.Acad.Audiol.,Vol.18,2007,pp.539–552.

·Magnusson,L.,Karlsson,M.&Leijon,A.(2001)Predicted and measured speech recognition performance in noise with linear amplification.Ear and Hearing,Vol.22(1),2001,pp.46-57.

·Marslen-Wilson W.1987.Functional parallelism in spoken word recognition.Cognition,Vol.25,1987,pp.71-103.

·Martin,R.&Breithaupt,C.(2003).Speech enhancement in the DFT domain using Laplacian speech priors,in Proc.InternationalWorkshop on Acoustic Echo and Noise Control(IWAENC’03),pp.87–90,Kyoto,Japan,September 2003.

·Martin,R.(1979).Noise power spectral density estimation based on optimal smoothing and minimum statistics.IEEE Transactions on Speech and Audio Processing,Vol.9(5),1979,pp.504–512.

·McClelland,J.L.&Elman,J.L.1986.The TRACE model of speech perception.Cogn Psychol,Vol.18,1986,pp.695-698.

·McCoy,S.L.,Tun,P.A.,Cox,L.C.,Colangelo,M.,Stewart,R.A.&Wingfield,A.(2005).Hearing loss and perceptual effort:downstream effects on older adults’memory for speech.Quarterly Journal of Experimental Psychology A,Vol.58,2005,pp.22-33.

·Miyake A.&Shah P.(1999),Models of Working Memory,Cambridge,UK,Cambridge University Press.

·Moore,B.C.J.(1998).A comparison of four methods of implementing automatic gain control(AGC)in hearing aids.British Journal of Audiology,Vol.22,1998,pp.93-104.

·Naylor G.,Johannesson R.B.&Lunner T.(2006),Fast-acting compressors change the effective signal-to-noise ratio-both upwards and downwards,International Hearing Aid Research Conference(IHCON),Lake Tahoe,CA,August 2006.

·Naylor,G.&Johannesson,R.B.(2009).Long-term Signal-to-Noise Ratio(SNR)at the input and output of amplitude compression systems.Journal of the American Academy of Audiology,Vol.20,No.3,2009,pp.161-171.

·Pascal W.M.Van Gerven,Fred Paas,Jeroen J.G.Vanand Henrik G.Schmidt,Memory load and the cognitive pupillary response in aging,Psychophysiology.Volume 41,Issue 2,Published Online:17 Dec 2003,Pages 167–174.

·Pichora-Fuller,M.K.(2007).Audition and cognition:What audiologists need to know about listening.In C.Palmer&R.Seewald(eds.)Hearing Care for Adults.Switzerland:Phonak,2007,pp.71-85.

·Pichora-Fuller,M.K.,Schneider,B.A.&Daneman,M.(1995).How young and old adults listen to and remember speech in noise.Journal of the Acoustical Society of America,Vol.97,1995,pp.593–608.

·Pichora-Fuller,M.K.(2003).Cognitive aging and auditory information processing.International Journal of Audiology,Vol.42(Supp2),2003,pp.S26–S32.

·Plomp,R.(1988).Auditory handicap of hearing impairment and the limited benefit of hearing aids.Journal of the Acoustical Society of America,Vol.63(2),1988,pp.533–549.

·Plomp,R.(1994).Noise,amplification,and compression:considerations for three main issues in hearing aid design.Ear and Hearing,Vol.15,1994,pp.2-12.

·Rabbitt,P.(1968).Channel-capacity,intelligibility and immediate memory.Quarterly Journal of Experimental Psychology,Vol.20,1968,pp.241–248.

·Rabbitt,P.(1990).Mild hearing loss can cause apparent memory failures which increase with age and reduce with IQ.Acta Oto-laryngologica,Vol.476(Suppl),1990,pp.167-176.

·Reder,L.M.,Nhouyvanisvong,A.,Schunn,C.D.,Avers,M.S.,Angstadt,P.,&Hiraki,K.(2000).A mechnistic account of the mirror effect for word frequency:A computational model of remember-know judgments in a continuous recognition paradigm.Journal of Experimental Psychology:Learning,Memory,and Cognition,Vol.26,2000,pp.294-320.

·Retrieved from

"http://en.wikipedia.org/wiki/CLARION_(cognitive_architecture)"

·Ricketts,T.A.(2005).Directional hearing aids:Then and now.Journal of Rehabilitation Research and Development,Vol.42(4),2005,pp.133-144.

·Rudner,M.,Foo,C.,Sundewall-Thorén,E.,Lunner T.&J.(2008).Phonological mismatch and explicit cognitive processing in a sample of 102 hearing aid users.International Journal of Audiology,Vol.47(Suppl.2),2008,pp.S163-S170.

·J.(1990).Cognitive and communicative function:The effects of chronological age and"handicap age".European Journal of Cognitive Psychology,Vol.2,1990,pp.253-273.

·J.(2003).Cognition in the hearing impaired and deaf as a bridge between signal and dialogue:A framework and a model,Int.J.Audiol.,Vol.42,2003,pp.S68-S76.

·J.,Rudner,M.,Foo,C.&Lunner,T.(2008),Cognition counts:A working memory system for ease of language understanding(ELU),International Journal of Audiology,Vol.47(Suppl.2),2008,pp.S171-S177.

·Sarampalis,A.,Kalluri,S.,Edwards,B.&Hafter,E.(2006).Cognitive effects of noise reduction strategies.International Hearing Aid Research Conference(IHCON),Lake Tahoe,CA,August 2006.

·Sarampalis A.,Kalluri S.,Edwards B.,Hafter E.(2008),Understanding speech in noise with hearing loss:measures of effort,International Hearing Aid Research Conference(IHCON),Lake Tahoe,CA,August 13-17,2008.

·Sarampalis,A.,Kalluri,S.,Edwards,B.&Hafter,E.(1999).Objective measures of listening effort:Effects of background noise and noise reduction.Journal of Speech,Language,and Hearing Research,Vol.52,October 2009,pp.1230-1240.

·Schum,D.J.,Matthews,L.J.&Lee,F.S.(1991)Actual and predicted word-recognition performance of elderly hearing-impaired listeners.Journal of Speech Hearing Research,Vol.34,1991,pp.636-642.

·Schum,D.J.(2003).Noise-reduction circuitry in hearing aids:(2)Goals and current strategies.The Hearing Journal.Vol.56(6),2003,pp.32-40.

·Shinn-Cunningham,B.G.(2008a).Object-based auditory and visual attention.Trends in Cognitive Sciences,Vol.12(5),2008,pp.182-186.

·Shinn-Cunningham BG(2008b).Auditory object formation,selective attention,and hearing impairment.International Hearing Aid Research Conference(IHCON),Lake Tahoe,CA,August 13-17,2008.

·Stewart,T.C.and West,R.L.(2005)Python ACT-R:A New Implementation and a New Syntax.12th Annual ACT-R Workshop

·Sun,R.(2002).Duality of the Mind:A Bottom-up Approach Toward Cognition.Mahwah,NJ:Lawrence Erlbaum Associates.

·Sun,R.(2003).A Tutorial on CLARION 5.0.Technical Report,Cognitive Science Department,Rensselaer Polytechnic Institute.

·Sun,R.,Merrill,E.,&Peterson,T.(2001).From implicit skills to explicit knowledge:A bottom-up model of skill learning.Cognitive Science,25,203-244.http://www.cogsci.rpi.edu/~rsun/

·Sun,R.,Slusarz,P.,&Terry,C.(2005).The interaction of the explicit and the implicit in skill learning:A dual-process approach.Psychological Review,Vol.112,2005,pp.159-192.http://www.cogsci.rpi.edu/~rsun/

·Sun,R.&Zhang,X.(2006).Accounting for a variety of reasoning data within a cognitive architecture.Journal of Experimental and Theoretical Artificial Intelligence,Vol.18,2006,pp.169-191.

·Tun,P.A.&Wingfield,A.(1999).One voice too many:adult age differences in language processing with different types of distracting sounds.Journals of Gerontology Series B:Psychological Sciences and Social Sciences,Vol.54(5),1999,pp.317-327.

·US 2002/028991(MEDTRONIC)07-03-2002

·US 6,574,513(BRAINMASTER TECHNOLOGIES)03-06-2003

·van Boxtel,M.P.,van Beijsterveldt,C.E.,Houx,P.J.,Anteunis,L.J.,Metsemakers,J.F.&Jolles,J.(2000).Mild hearing impairment can reduce verbal memory performance in a healthy adult population.Journal of Clinical Experimental Neuropsychology,Vol.22,2000,pp.147-154.

·van den Bogaert,T.,Doclo,S.,Wouters,J.&Moonen,M.(2008).The effect of multimicrophone noise reduction systems on sound source localization by users of binaural hearing aids.Journal Acoustical Society of America,Vol.124(1),2008,pp.484-97.

·Wang,D.L.(2005).On ideal binary mask as the computational goal of auditory scene analysis.In P.Divenyi(Ed.),Speech separation by humans and machines(pp.181-197).Norwell,MA:Kluwer Academic,2005.

·Wang,D.L.(2008).Time-Frequency Masking for Speech Separation and Its Potential for Hearing Aid Design.Trends in Amplification,Vol.12,2008,pp.332-353.

·Wang D.L.,Kjems U.,Pedersen M.S.,Boldt J.B.&Lunner T.2009.Speech Intelligibility in Background Noise with Ideal Binary Time-frequency Masking,Journal of the Acoustical Society of America,Vol.125,No.4,April 2009,pp.2336-2347.

·Wingfield,A.&Tun,P.A.(2001).Spoken language comprehension in older adults:Interactions between sensory and cognitive change in normal aging.Seminars in Hearing,Vol.22(3),2001,pp.287-301.

·Wolpaw J.R.,Birbaumer N.,McFarland D.J.,Pfurtscheller G.&Vaughan T.M.(2002),Brain–computer interfaces for communication and control,Clinical Neurophysiology,Vol.113,2002,pp.767–791.

·Kenneth P.Wright Jr.,Joseph T.Hull,and Charles A.Czeisler(2002),Relationship between alertness,performance,and body temperature in humans,Am.J.Physiol.Regul.Integr.Comp.Physiol.,Vol.283,August 15,2002,pp.R1370-R1377.

·Zekveld,A.A.,Deijen,J.B.,Goverts,S.T.&Kramer,S.E.(2007).The relationship between nonverbal cognitive functions and hearing loss.Journal of Speech and Language Hearing Research,Vol.50,2007,pp.74-82.

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1