助听器的稳定性改进的制作方法

文档序号:7634665阅读:212来源:国知局
专利名称:助听器的稳定性改进的制作方法
技术领域
本发明涉及助听器的稳定性改进的信号去相关以及在高频下改进语音可听度。
背景技术
通常通过确定信号的时变增益、然后通过增益增大信号来执行助听器中的信号处理。该方法提供了时变系统,即,具有随时间改变的频率响应的滤波器。该系统对于诸如动态范围压缩和噪声抑制的这些处理类型非常有效,其中,所期望的信号处理为时频相关增益。但是由于线性特性,时变滤波器不可用于执行诸如频率降低和相位随机化的非线性处理。可选的方法是使用分析/合成系统。对于分析,输入信号通常划分为片段,并且分析每个片段以确定一组信号属性。对于合成,使用测量的或修正的信号属性生成新的信号。从US 4,885,790、USRE 36,478和US4, 856,068中已知有效的分析/合成程序是正弦建模。在正弦建模中,语音被划分为重叠的片段。分析包括计算每个片段的快速傅里叶变换 (FFT),并然后确定频率、振幅和FET的每个峰值的相位。对于分析,产生一组正弦曲线。每个正弦曲线与FET的峰值匹配;没必要使用所有的峰值。提供规则以将一个片段中的振幅、 相位和峰值的频率与下一片段中的相应峰值、振幅、相位相连接,每个正弦曲线的频率插入在整个输出段上以提供平稳变化信号。由此使用有限数量的调制正弦分量再生语音。正弦建模提供非线性信号修正的结构。例如,该方法可用于数字语音编码,如US 5,054,072中所示。确定语音的信号的振幅和相位,并进行数字编码,然后传输至接收器,它们用于合成正弦曲线以产生输出信号。正弦建模也对信号时间比例和频率修正有效(如McAulay,R. J.,and Quatieri, Τ.F. (1986) “Speech analysis/synthesis based on a sinusoidal representation", IEEE Trans. Acoust. Speech and Signal Processing, VolASSP-34, pp 744-754.中所述)。 对于时标(time-scale)修正,保持FFT峰值的频率,但可减小输出信号的连续片段之间的间隔以加速信号或增加输出信号的连续片段之间的间隔以减速信号。对于频移,保持输出信号段的间隔和每个正弦曲线的振幅信息,但在相对于原始值已移动的频率处产生正弦曲线。另一信号操作通过动态调节合成的正弦曲线的相位减小信号峰值振幅来减小峰值平均比,如 US 4,885,790 和 US 5,054, 072 所示。正弦建模还可用于语音增强。正弦建模用于抑制干扰声音(Quatieri,Τ. F, and Danisewicz, R. G. (1990)的"An approach to co-channel talker interference suppression using a sinusoidal model for speech", IEEE Trans Acoust Speech and Sginal Processing, Vol 38,pp 56-69),Kates也将正弦建模用作噪声抑制的基础 (Kates, J. Μ. (1994), "Speech enhancement based on a sinusoidal model,,,J. Speech Hear Res, Vol. 37, pp 449-464)。在上述Kates的研究中,再生假设为语音的信号的高强度正弦分量,但移除假设为噪声的低强度分量;然而没有发现改善语音清晰度的益处。 Jensen and Hansen (Jensen,J·,and Hansen, J. H. L. (2001),“Speech enhancement usinga constrained iterative sinusoidal model,,,IEEE Trans Speech and Audio Proc, Vol 9,pp 731-740)使用正弦建模以增强被附加的宽带噪声所降低的语音,并发现该方法比诸如维纳滤波的比较模式更有效。正弦建模还可应用于听力损失和助听器。Rutledge and Clements (US5, 274,711) 将正弦建模用作动态范围压缩的处理结构。他们使用正弦再生整个信号带宽,但在观察到听力损失的那些频率处增加合成的分量的振幅。其他人已使用类似的方法以通过移动相对于原始信号较低的合成正弦分量的频率来为听力受损者提供频率降低。移动量是频率相关的,低频率接收小的移动量,较高频率接收逐渐变大的移动。因此,本发明的目的是提供一种在助听器中提供稳定性改进的计算简单方法。

发明内容
根据本发明,上述的以及其他的目的由关于助听器的本发明的第一方面来实现, 该助听器包括输入换能器、高通滤波器、低通滤波器、合成单元、组合器、听力损失处理器以及接收器。输入换能器被配置为提供诸如电子输入信号的输入信号。高通滤波器被配置为提供输入信号的高通滤波部分。高通滤波器可以连接至输入换能器。低通滤波器被配置为提供输入信号的低通滤波部分。低通滤波器可以连接至输入换能器。合成单元被配置为生成合成信号。可通过利用基于周期函数的模型来根据高通滤波部分进行生成。此外,合成信号的相位至少可以一部分是随机的。合成单元可以连接至高通滤波器的输出端。组合器可被配置为将低通滤波部分与合成信号相组合以提供组合后的信号。组合器可以连接至低通滤波器的输出端并连接至合成单元的输出端。听力损失处理器可被配置为对组合信号进行处理以提供处理信号。可替换地,听力损失处理器可被配置为通过在借助于组合器对各个处理结果进行组合之前处理低通滤波部分和合成信号,来提供处理信号。听力损失处理器可以根据助听器的使用者的听力损失来进行处理。接收器被配置为将音频输出信号转换成输出声音信号。音频输出信号可以是处理信号,或音频输出信号可以是从处理信号得到的。通过从输入信号的高频部分产生合成信号并将该合成信号与输入信号的低通部分组合,实现了输入信号的高频部分至少部分与组合器的输出信号是去相关的,从而带来助听器的稳定性增加。通过借助于高通滤波器和低通滤波器将输入信号分割成低频带和高频带,并在需要是只在高频处生成合成信号,因为助听器中的反馈主要是高频现象,这就显著地减小了计算负担。所得助听器因而具有高稳定性并大大减小计算负担的好处。根据本发明的一个或多个实施方式,周期函数可以是诸如正弦函数或正弦函数的线性组合的三角函数。由此实现了模拟语音的简单方式,这是因为语音信号含有高度周期性并因此可以根据傅里叶法则通过正弦曲线被建模(或近似)。这种方式非常精确并且计算上还是简单的模型,因此这种方式尤其对语音信号是有利的。应当理解,术语正弦函数可以指的是正弦或余弦。高通滤波器和低通滤波器可以是互补的,即具有相同的截止频率和交叉频率。根据一个或多个实施方式,合成信号的频率可以以频率向下移动。因此,实现了进一步增大助听器的输入信号和输出信号之间的去相关性的简单方法。可选地或附加地,合成信号的相位可至少部分地被随机化。这例如可以通过用随机相位替代原始(高频)信号的相位来实现。由此,可以实现提供输出和输入信号的去相关的计算简单的可选方法。在根据本发明的助听器的一个或多个实施方式中,合成信号的频移可以与相位的随机化组合。因此,同时提供了由频移实现的去相关和由相位随机化提供的去相关的益处。 特别地,这会实现更高程度的去相关,并且从而进一步提高助听器的稳定性。此外,相位的随机化可以是可调节的。这例如可通过混合原始和随机相位的任何所需部分来实现。由此,可以引入产生所期望的系统(助听器)稳定性所需的最少量的相位随机化,同时为所期望程度的稳定性提高提供最高的可能的语音质量,并且将计算负荷保持为尽可能低。根据一个或多个实施方式的助听器系统包括置于US 2002/0176584所示的构造中的反馈抑制滤波器。由此,实现了助听器的稳定性的进一步增加,从而使得能够在反馈开始之前在所述助听器中使用更高的放大率。本发明的另一方面涉及一种助听器的去相关输入信号和输出信号的方法,该方法包括以下所示的步骤-将输入信号分为高频部分和低频部分,-基于高频部分和模型生成合成信号,所述模型基于周期性函数,以及-将合成信号与低频部分组合。根据一个或多个实施方式的方法可以包括-将高频部分为多个片段,-将多个片段中的每个段窗口化并转换为频域,以及-选择每个片段中N个最高的峰,其中,生成合成信号可以包括用周期性函数来替代各个所选的峰,或可以通过此而被执行。根据一个或多个实施方式的片段重叠,从而可以解决由窗口化引起的信号特征损失。生成合成信号的步骤还可以包括使用N个峰中的每一个的频率、振幅和相位。此外,通过用具有比所选的峰中的每一个的频率更低的频率的周期性函数来替代所述峰中的每一个,所生成的合成信号的频率可以向下移动。在本方法的可选实施方式中, 这可以仅对一些峰来进行,即,在可选实施方式中,仅一些所选的峰的频率被具有比这些峰的频率更低的频率的周期性函数所替代。在根据本发明的方法的一个或多个实施方式中,通过以从(0,2π)弧度上的均勻分布随机或伪随机选出的相位来替代至少一些所选的峰的一些相位,合成信号的相位至少部分地被随机化。
根据本方法的一个或多个实施方式的相位的随机化可以是可调节的。进一步或可选地,相位的随机化可依赖于助听器的稳定性或稳定性要求来执行。在本方法的任何步骤中所指的周期性函数可以是三角函数,诸如正弦曲线或正弦曲线的线性组合。一种特别有利的实施方式涉及一种助听器,包括输入换能器,用于提供输入信号,诸如电输入信号,高通滤波器,被配置用于提供输入信号的高通滤波部分,低通滤波器,被配置用于提供输入信号的低通滤波部分,建模单元,被配置用于应用正弦建模以修正高通滤波部分,从而生成经修正的高频信号,其中经修正的高频信号的相位至少部分地被随机化,组合器,用于将低通滤波部分与经修正的高频信号进行组合,以提供组合信号,听觉损失处理器,被配置用于处理组合信号,该处理是根据助听器的用户的听觉损失,以及接收器,用于将来自听觉损失处理器的音频输出信号转换为输出声音信号。听觉损失处理器可以被配置用于根据助听器的用户的听觉损失来处理音频输入信号。高通滤波器和低通滤波器可连接至输入换能器。建模单元可连接至高通滤波器的输出端。组合器可连接至低通滤波器的输出端和建模单元的输出端。尽管以上描述了本发明几个方面的几个实施方式,但是应当理解,一个方面的一个或多个实施方式中的任何特征可以包括在一个或几个其他方面的一个或多个实施方式中,并且当在本专利说明书中提及“实施方式”或“一个或多个实施方式”的时候,应当理解其可以是根据本发明任一方面的一个或多个方式。


下面,将参照附图更详细地说明本发明的实施方式,其中图1示出了根据本发明一个方面的助听器的实施方式。图2示出了助听器的可选实施方式。图3示出了助听器的另一实施方式。图4示出了助听器的又一实施方式。图5示出了助听器的又一可选实施方式。图6示出了窗口化的语音片段的幅度谱。图7示出了频率降低的实例。图8示出了包括两个句子的测试信号的声谱图,第一个句子由女性讲话者说出, 而第二个句子由男性讲话者说出。图9示出了使用用于整个声谱的正弦建模进行再生的测试句子的声谱图。图10示出了使用^Hz以下的原始语音以及2kHz以上的正弦建模进行再生的测试句子的声谱图。图11示出了使用2kHz以下的原始语音以及2kHz以上的具有2 1频率压缩的正弦建模进行再生的测试句子的声谱图。图12示出了使用^cHz以下的原始语音以及2kHz以上的具有随机相位的正弦建模进行再生的测试句子的声谱图。图13示出了使用2kHz以下的原始语音以及2kHz以上的具有2 1频率压缩和随机相位的正弦建模进行再生的测试句子的声谱图。图14示出了根据本发明的方法的实施方式的流程图。图15示出了根据本发明的方法的可选实施方式的流程图。图16示出了根据本发明的方法的另一实施方式的流程图。图17示出了根据本发明的方法的又一可选实施方式的流程图。图18示出了根据本发明的方法的实施方式的流程图。
具体实施例方式下文中将参照附图更充分地描述本发明,其中示出了本发明的示例性实施方式, 然而,本发明可以用不同形式实施,并且不应当限于这里所列出的实施方式而构造。相反, 提供这些实施方式使得本公开透彻完整,并且将向本领域技术人员充分传达本发明的范围。在全文中,类似的参考标号表示类似的元件。因此,关于每幅附图的描述,不详细描述类似的元件。图1示出了根据本发明的助听器2的实施方式。所示出的助听器2包括输入换能器(input transducer),这里以用于提供电输入信号6的麦克风4作为实例。助听器2还包括听力损失处理器(hearing loss processor) 8,听力损失处理器8被配置为根据助听器 2的使用者的听力损失来处理电输入信号6或者从电输入信号得到的信号。可以理解的是电输入信号6是音频信号。所示出的助听器2还包括接收器10,接收器10用于将音频输出信号12转换为输出声音信号。在所示的实施方式中,音频输出信号12是听力损失处理器8的输出信号。在图1-5的任何一个中示出的听力损失处理器8可以包括所谓的压缩器 (compressor),其适于根据依赖于频率和/或声压水平的听力损失补偿算法来处理输入到听力损失处理器8的输入信号。此外,听力损失处理器8还可以被配置为运行其他标准助听算法,诸如降噪算法。图1还示出了连接至输入换能器(麦克风4)的高通滤波器14和低通滤波器16。 从而使用(可以指定为一对互补滤波器的)滤波器14和16将输入电信号6分为低频带和高频带。在当前的实施方式中,滤波器14和16可以是具有相同截止频率的五极点巴特沃斯(Butterworth)高通和低通设计,并且使用双线性变换将其变换为数字有限脉冲响应 (IIR)滤波器。截止频率可以选择为2kHz,其中,部分地基于输入信号6的合成信号M仅在2kHz以上的频率区域中产生。在又一实施方式中,截止频率是可调整的,例如在1,5kHz 至2,5kHz的范围内。所示出的助听器2还包括连接至高通滤波器14的输出端的合成单元18,合成单元18被配置为基于电输入信号的高通部分(即,高通滤波器14的输出信号)和模型来产生合成信号对,所述模型是基于周期函数的。从而提供了一种提供至少在某种程度上与输入信号6去相关的高频域音频信号的简单方式。组合器20 (在该实施方式中示为简单加法器)连接至低通滤波器16的输出端以及合成单元18的输出端,以将电输入信号6的低通滤波后的部分22与合成单元18的合成信号24 (或合成输出信号)组合。通过例如使用标准助听处理算法(诸如动态范围压缩,也可能是噪声抑制),复合信号沈然后在听力损失处理器8中被处理。高通滤波器14和低通滤波器16、合成单元18、组合器20以及听力损失处理器8 可以以数字信号处理(DSP)单元观来实施,根据需要和可用的电池电力,其可以是定点DSP 或浮点DSP。因此,应理解,根据一个或多个实施方式,助听器2可以包括用于将麦克风信号转换为数字信号6的A/D转换器(未示出),以及将音频输出信号12转换为模拟信号的D/ A转换器(未示出)。模型所基于的周期函数可以是三角函数,诸如正弦函数或正弦函数的线性组合。 为了便于描述,将仅提及正弦建模(例如,根据McAulay,R. J.,和Quatieri, T. F. (1986), “Speech analysis/synthesis based on a sinusoidal representation", IEEE Trans. Acoust. Speech and Signal Processing, Vol ASSP-34,pp 744-754 中所公开的步骤)作为实施方式的以下说明的基本实例,但是关于本专利申请文件所提到的每个实例,应注意, 可以替换地使用基于周期函数的任何其他模型。图2示出了助听器2的另一实施方式。由于图2中示出的实施方式类似于图1中示出的实施方式,因此将仅描述不同之处。在示出的实施方式中,合成单元18被划分成两个处理模块30和32。在第一模块30中执行降频。通过使用高通滤波器14的输出信号的测量的幅度和相位来执行频移(这里降低, 但在一些可选实施方式中,也可以是一些其他类型的频移,诸如频率的变形(warping)或增加),并在移动的频率处产生输出正弦曲线。在模块32中执行正弦曲线的生成。还使用正弦曲线的振幅,从而保留了原始信号的包络特性(envelope behavior)。正弦建模与频移一起将提高助听器2的输入信号和输出信号的去相关性,并将因此带来稳定性的增强。图3示出了提高图2中所示的助听器2的输入信号和输出信号之间的去相关性的可选方式。代替频移,如由处理模块34所表示的,输入到合成单元18的输入信号(incoming signal)的相位被随机化。该随机相位可通过用选自(0,2π)弧度的统一分布的随机相位值代替输入信号(即,高通滤波器14的输出信号)的测量相位来实现。还使用正弦曲线的振幅,因此保留了原始信号的包络特性。图4示出了助听器2的实施方式,其中,如由处理模块30和34所示出的,频移和相位随机化与正弦建模相结合。对于结合处理,在合成单元18中执行的正弦建模使用输入至合成单元18的信号的原始振幅和随机相位,然后产生处于移动后的频率处的输出正弦曲线。可以利用具有2kHz以上的正弦模型来实现频率降低和相位随机化的结合。可以利用十个正弦曲线来再生一个或多个实施方式中的2kHz以上的频率。因此,实现了一种获得助听器2的输入信号和输出信号之间的高度去相关性的非常简单方法。图5示出了根据本发明的实施方式的助听器2的另一实施方式,其中,频移和相位随机化与正弦建模相结合。输入到合成单元18的输入信号是从高通滤波器14输出的信号。如处理模块36所示,此输入信号被划分成多个片段。为了应对在窗口化(windowing) 过程中特征的丢失,这些片段可以交迭。如处理模块38所示,为了降低谱泄漏可对每个片段窗口化,并且计算片段的FFT。可以选择幅度谱的N个最高峰值,并且可将每个峰值的频率、振幅和相位保存在助听器2内的数据存储单元(未示出)中。然后,可通过利用测量的频率、振幅和相位值产生每个所选峰值的一个正弦曲线(由处理模块32示出)来合成输出信号。除了这些处理步骤,可使用如下步骤来平滑正弦曲线的始端和末端如果正弦曲线在频率上接近针对先前片段产生的正弦曲线,则在整个输出片段持续时间插入振幅、相位和瞬时频率以产生振幅和频率调制正弦曲线。与先前片段不匹配的频率分量用上升斜坡 (rising ramp)进行加权以提供平滑的始端转变(“开始”(“birth”)),存在于先前片段中但不存在于当前片段中的频率分量用下降斜坡进行加权以提供至零振幅的平滑转变(“终止,,(“death”))。例如,这些片段可以用von Harm上升的余弦窗来窗口化。能够使用的一个窗口的尺寸为(在22. 05kHz的采样率下为530个采样)。也可以使用其他窗口形状和尺寸。图6中示出了峰值选择,其中用由垂直尖峰42 (为了简化并提高图6的可理解性, 仅两个垂直尖峰用标号42标记)示出的16个最高所选峰值示出了窗口化的语音(男性讲话者)片段40的幅度谱。在此实例中,幅度谱的四个峰值出现在2kHz之下,而剩下的12个峰值出现在2kHz处或其之上。此实例中再现整个谱将需要总共22个峰值。使用更短的片段尺寸会由于减少的频率解而给出更差的元音再现,但是它将给出更准确的信号时间-频率包络特性。由于此专利申请中的重点是高频处的信号再现和修正,并且由于人的听觉系统在高频处具有降低的频率辨别力,所以频率分辨率上的降低将是不能听到的,同时在再现和包络特性上改进的准确性实际上将带来改善的语音质量。图7示出了频率降低的实例。可使用在图2、图4或图5中的任意一个中示出的双频带(由高通滤波器14和低通滤波器16示出)助听器2用2kHz以上的正弦建模来实现频率降低(通常由处理块30示出)。10个正弦曲线可以用于再现高频区域。所使用的示出频移是如图7所示的2 1的频率压缩。这意味着低频带中处于2kHz或之下的频率无修正地被再现。在2kHz之上,降频使得3kHz被再现为在2. 5kHz处的正弦曲线,4kHz被映射到3kHz,以此类推直到11kHz,其被再现为在6. 5kHz处的正弦曲线。科学调查(如将在下面澄清的)显示这种降频策略可带来声音音质上的较少变化,但几乎没有明显失真。图8示出了测试信号的声谱图。该信号包括两个句子,即由女性讲话者所说的第一句子和由男性讲话者所说的第二句子。右边的条带示出了 dB的范围(参考信号峰值水平)。在图8中示出了输入语音的声谱图,并且在图9中示出了使用具有32个正弦曲线的正弦建模再现的句子声谱图。一些分辨率损耗在正弦建模中是可见的。例如,在大约 0. Ssec时,低于IkHz的倾斜谐波在图9中看起来很模糊,并且也不良地再现了在2kHz与 4kHz之间的谐波。可以在1. 2sec与1. 5sec之间观察到相似的效果。在图9中的约0. 2sec 开始的男性讲话者的正弦建模的效果是非常不显著的。在图10中示出了在根据图1中所示的助听器2的实施方式的双频带助听器中的模拟处理的声谱图,其中,在合成单元18中使用了正弦建模。十个正弦曲线被用于高频带, 即,在该实例中被用于高于2kHz的频率。在没有任何修正的情况下已经再现了低于2kHz 的频率,所以现在,该声谱图与低频率下的原始声谱图相匹配。然而,在高于2kHz时,可以观察到由正弦建模引起的残缺信号再现。在图11中示出了频率压缩的声谱图,在高于2kHz的谐波结构中的大多数细节看起来已经丧失,但保留了大多数的包络特性(envelope behavior),高于2kHz的频移是很明显的。在该实例中所用的FFT大小为2%iSec,窗口化片段持续时间为6msec。将FFT大小降低以匹配6mSec(132取样)的片段大小在根据本发明的一个以上实施方式的助听器2 中会更实用。由于决定因素为片段大小,因此FFT大小的降低会给出与本文所呈现的实例的声谱图和语音质量相同的声谱图和语音质量。图12示出了通过使用低于2kHz的原始语音以及2kHz以上的具有2 1频率压缩和随机相位的正弦建模所再现的测试句子。如在具有高于2kHz的正弦建模的图3、 图4或图5的任一个中所示出的,相位随机化在通过使用根据本发明一个以上实施方式的双频带助听器2的模拟所实现的说明性实例中,高于2kHz的频率通过使用十个正弦曲线所再现。正弦曲线的振幅信息被保留,但相位被随机值所取代。由于正弦建模的13可听度指数(reported in Kates, J. Μ. , and Arehart, K. H. (2005), "Coherence and the speech intelligibility index,” J. Acoust. Soc. Am.,Vol. 117,pp 2224-2237)通过使用高于2kHz的原始相位值而为0. 999,并且对于表示会预期完美可听度的随机相位语音仍为0.999,所以该随机相位实质上对语音可听度或质量没有影响。相似地,HASQI质量指数(在 Kates, J.M. and Arehart,K. H. (2009)中 艮告,‘‘The hearing aid speech quality index (HASQI),,,submitted for publication J. Audio Eng. Soc.)值对于使用高于2kHz 的原始相位值为0. 921,而对于随机相位语音为0. 915,所以实质上不存在质量的下降。应当注意,HASQI测量处理后的信号的包络相比于原始信号的包络的变化,所以结果显示出具有随机相位的正弦建模没有明显修正语音包络(speech envelope) 0在图12中示出了在高频率带中具有随机相位的语音的声谱图。与图10上的声谱图中所示出的高于2kHz的正弦建模相比较,将相位随机化引起了的非常小的差别。例如, 在0. 6sec和0. Ssec之间,随机相位信号表现出比使用原始相位值的正弦建模少了 3kHz与 5kHz之间的精确谐波峰值。
图13示出了通过使用低于2kHz的原始语音以及2kHz以上的具有2 1频率压缩和随机相位的正弦建模所再现的测试句子的声谱图。对于结合处理,正弦建模使用原始振幅和随机相位值,然后在偏移频率处输出正弦曲线。频率降低和相位随机化的结合通过高于2kHz的正弦建模而使用图5中所示的双频带助听器的模拟来实现。高于2kHz的频率通过使用十个正弦曲线而被再现。如从声谱图中可以看出的,结合处理和使用原始相位值的频率降低之间的音频差非常小。图14示出了根据本发明实施方式的方法的流程图。该方法包括以下步骤-如方框44所示,将输入信号划分高频部分和低频部分,-如方框46所示,基于输入信号的高频部分和模块而生成合成信号,所述模块是基于周期性函数的,以及-如方框48所示,将合成信号与输入信号的低频部分相结合。可以在助听器中采用图14中所示的方法的流程图,并且根据听力损伤校正算法来大体处理该组合信号,随后,通过所述助听器的接收器将该组合信号转换为声音信号。在图14中通过虚框50 (根据听力损伤校正算法的组合信号的处理)和52 (将听力损伤校正信号转换为声音信号)示出了这两个可选的附加步骤。图15是出了根据本发明的方法的可选实施方式的流程图,其还包括以下步骤
11
-如方框M所示,将输入信号的高频部分划分成多个部分,-如方框56所示,将每个部分窗口化并转换到频域。该步骤(56)在一个或多个实施方式中可以通过利用窗口化的快速傅里叶变换(FFT)来实现,通过Harming窗口被窗口化。-如方框58所示,在每个部分内选择N个最高峰,其中N为合适的自然数,例如1、 2或大于2,诸如大约8-20,例如10,以及-如步骤60所示,通过以周期性函数代替每个选定的峰生成合成信号。有效地,如图14中所示的步骤46被分成了步骤M、56、58和60。如图所示,图15中所示的方法的实施方式还可以包括以上参照图14描述的可选择的附加步骤50和52。在根据图15中所示出的实施方式的方法的一个或多个实施方式中,生成合成信号的步骤46还可以包括利用N 个峰中每个的频率、振幅和相位来生成周期性函数。图16示出了图15所示的方法的可选实施方式的流程图,其还包括步骤62 通过将选定的每个峰替换为频率比每个所述峰的频率低的周期性函数,在频率上向下移动生成的合成信号。图17示出了图15所示的方法的可选实施方式的流程图,其还包括步骤64,其中, 通过将一些所选的峰的至少一些相位替换为从整个(0,2π)弧度上的均勻分布随机或伪随机选择的相位,来至少部分地随机化合成信号的相位。最后,图18也示出了图15中所示的方法的可选实施方式,其中如上所描述的频率降低(步骤6 和如上所描述的相位随机化(步骤64)被组合到了同一实施方式中。根据在图17或图18的任意一个中所示出的方法的一个或多个实施方式,相位的随机化可以是可调整的,根据在图17或图18的任意一个中所示出的方法的一个或多个实施方式,相位的随机化可以根据助听器的稳定性来执行。根据在图14-18的任意一个中所示的任一方法的一个或多个实施方式,周期性函数可以为三角函数,诸如正弦曲线或正弦曲线的线性组合。正弦建模可以被用于图14-18中任一所示的方法的任意实施方式中。用于图 15-18中任一所示的和以上所描述的方法的任意实施方式中的正弦建模过程可以基于 McAulay, R. J.,and Quatieri,Τ. F. (1986),“Speech analysis/synthesis based on a sinusoidal representation,,,IEEE Trans· Acoust· Speech and Signal Processing, Vol ASSP-34,pp 744-7 的步骤,其中,优选地,输入信号被划分为多个重叠片段。每个片段被窗口化,对每个片段进行FFT计算。然后,幅度谱的N个最高峰被选定,每个峰的频率、振幅和相位被保存在数据存储单元中。然后,通过利用测量的频率、振幅以及相位值为每个所选的峰生成一个正弦曲线,输出信号被合成。如果该正弦曲线在频率上接近为先前片段所生成的正弦曲线,则在整个输出片段持续时间插入振幅、相位和瞬时频率以产生振幅和频率调制正弦曲线。与先前片段不相配的频率分量可以用上升斜坡(rising ramp)来加权,以提供平滑的始端转变(onset transition)(“产生”),存在于先前片段中但不存在于当前片段中的频率分量可以用下降斜坡(falling ramp)来加权,以提供至零振幅的平滑转变(“终止”)。在周期性函数为正弦曲线的该实施例中,预期正弦建模(以及通常利用周期性函数的建模)还给出了部分利用随机相位的选择。混合原始和随机相位值提供了连续调整响应于所估计的系统稳定性而施加于信号的随机量的方法。显得稳定的助听器2可以使用原始相位值,当助听器2开始趋于不稳定时,向随机相位逐渐转变。因此,图3、4、5、17或18 的任一个中所示的相位随机性是可调的。此外,在可选实施方式中,图3、4、5、17或18的任一个中所示(由处理方框;34或64)的相位随机性的调整可以根据助听器2的稳定性执行。因此,可见在本发明说明书中提出的关于将输入信号划分为低频带和高频带然后仅在高频应用例如正弦建模的新构思在助听器中是可行的、有益的。在本发明中提出的处理结果表明正弦建模对于频率降低和信号去相关性是有效的步骤。而且,正弦建模还有几点优点其可用于准确地再生语音而无需修补检测(Pitch detection)或语音/非语音判定;在本发明中所提出的实施例中不需执行这些操作。将频率范围限制为高频在移除大部分可听处理假象(audible processing artifact)方面是有效的,高频再生所需要的正弦曲线的数目减少,这大幅降低了与该处理相关联的计算负载。结果是计算高效的非线性信号处理仍提供高语音质量。本发明说明书中提出的实施例旨在说明正弦建模的可行性,而不是编程到助听器中的处理的最终形式。如将被本领域普通技术人员所理解的,本发明可以被具体化为除以上所描述和附图中所示的那些以外的其他特定形式,可以利用多种不同算法中的任意算法而不偏离其精神或实质特征。例如,算法的选择(例如,使用哪种正弦建模)通常是应用特定的,该选择取决于各种因素,包括期望的处理复杂度以及计算负载。因此,本文中的公开和描述旨在说明而不是限制本发明的范围,本发明的范围由所附权利要求来阐述。条目1. 一种助听器,包括输入换能器,用于提供电输入信号,听力损失处理器,被配置为根据该助听器的用户的听力损失来处理电输入信号或由该电输入信号得到的信号,接收器,用于将音频输出信号转换为输出声音信号,连接至该输入换能器的高通滤波器和低通滤波器,连接至高通滤波器的输出端的合成单元,该合成单元被配置为利用基于周期函数的模型生成合成输出信号,其中,该合成信号的相位至少部分地是随机化的,以及连接至该低通滤波器的输出端以及该合成单元的输出端的组合器,该组合器用于将该电输入信号的经低通滤波的部分与该合成单元的合成输出信号组合。2.根据条目1的助听器,其中,该周期函数是诸如正弦曲线或正弦曲线的线性组合的三角函数。3.根据条目1或2的助听器,其中,该高通滤波器和该低通滤波器是互补的。4.根据条目1、2或3的助听器,其中,该合成信号的频率在频率上向下偏移。5.根据之前条目中任一个的助听器,其中,该相位的随机化是可调的。6. 一种对助听器的输入信号和输出信号解关联的方法,该方法包括步骤-将该输入信号划分为高频部分和低频部分,-基于该输入信号的高频部分和模型生成合成信号,该模型基于周期函数,其中, 该合成信号的相位至少部分地是随机化的,以及-将该合成信号与该输入信号的低频部分组合。7.根据条目6的方法,进一步包括步骤
-将该输入信号的高频部划分为多个片段(优选地,为多个重叠的片段),-将每个片段窗口化并转换至频域,-在每个片段中选择N个最高峰,以及-通过以该周期函数替换所选择的峰中的每一个来生成该合成信号。8.根据条目7的方法,其中,生成该合成信号的步骤进一步包括步骤使用该N个峰值中每一个的频率、振幅以及相位。9.根据条目8的方法,其中,通过以周期函数替换所选择的峰中的每一个而将该生成的合成信号在频率上向下移动,该周期函数具有比该峰中的每一个的频率更低的频率。10.根据条目8或9的方法,其中,通过以从在(0.2π)弧度上的均勻分布随机或伪随机选出的相位来替换一些所选择的峰的至少一些相位来至少部分地随机化该合成信号的相位。11.根据条目10的方法,其中,该相位的随机化是可调的。12.根据条目10或11的方法,其中,依赖于该助听器的稳定性来执行该相位的随机化。13.根据条目6-12的方法,其中,该周期函数是诸如正弦曲线或正弦曲线的线性组合的三角函数。14. 一种助听器,包括输入换能器,用于提供电输入信号,听力损失处理器,被配置为根据该助听器的用户的听力损失来处理音频输入信号,接收器,用于将来自该听力损失处理器的音频输出信号转换为输出声音信号,连接至该输入换能器的高通滤波器和低通滤波器,连接至高通滤波器的输出端的模型单元,其中,正弦模型用于修正该高通滤波器的输出信号以生成经修正的高频信号,其中,该经修正的信号的相位至少部分地是随机化的,连接至该低通滤波器的输出端以及该模型单元的输出端的组合器,该组合器用于将该电输入信号的经低通滤波的部分与该经修正的高频信号组合。
权利要求
1.一种助听器,包括输入换能器,用于提供输入信号;高通滤波器,被配置为提供所述输入信号的高通滤波部分; 低通滤波器,被配置为提供所述输入信号的低通滤波部分;合成单元,被配置为使用基于周期函数的模型由所述高通滤波部分生成合成信号,其中,所述合成信号的相位至少部分地是随机化的;以及组合器,被配置为将所述低通滤波部分与所述合成信号组合,用于提供组合信号; 听力损失处理器,被配置为处理所述组合信号以提供经处理的信号,所述处理根据所述助听器的用户的听力损失进行;接收器,用于将音频输出信号转换为输出声音信号,所述音频输出信号可以是所述经处理的信号。
2.根据权利要求1所述的助听器,其中,所述周期函数包括诸如正弦曲线或正弦曲线的线性组合的三角函数。
3.根据权利要求1或2所述的助听器,其中,所述高通滤波器和所述低通滤波器是互补的。
4.根据权利要求1、2或3中任一项所述的助听器,被配置为将所述合成信号的频率在频率上向下移动。
5.根据前述权利要求中任一项所述的助听器,其中,所述相位的随机化是可调的。
6.一种对助听器的输入信号和输出信号去相关的方法,所述方法包括步骤 -将所述输入信号划分为高频部分和低频部分;-基于所述高频部分和模型生成合成信号,所述模型基于周期函数,其中,所述合成信号的相位至少部分地是随机化的;以及-将所述合成信号与所述低频部分组合。
7.根据权利要求6所述的方法,包括-将所述高频部划分为多个片段,所述片段可以是重叠的; -将所述多个片段中的每一个窗口化并转换至频域;以及 -在每个片段中选择N个最高峰,其中,N可以至少为2 ;其中,生成所述合成信号包括或通过以所述周期函数替换所选择的所述峰中的每一个来执行。
8.根据权利要求7所述的方法,其中,生成所述合成信号包括使用所述N个峰中每一个的频率、振幅以及相位。
9.根据权利要求8的方法,其中,通过以周期函数替换所选择的所述峰中的每一个而将生成的所述合成信号在频率上向下移动,所述周期函数具有比所述峰中的每一个的频率更低的频率。
10.根据权利要求8或9所述的方法,其中,通过以从在(0.2π)弧度上的均勻分布随机或伪随机选出的相位来替换一些所选择的所述峰的至少一些相位来至少部分地随机化所述合成信号的相位。
11.根据权利要求10所述的方法,其中,所述相位的随机化是可调的。
12.根据权利要求10或11所述的方法,其中,依赖于所述助听器的稳定性来执行所述相位的随机化。
13.根据权利要求6至12中任一项所述的方法,其中,所述周期函数包括诸如正弦曲线或正弦曲线的线性组合的三角函数。
14.一种助听器,包括输入换能器,用于提供输入信号;高通滤波器,被配置为提供所述输入信号的高通滤波部分; 低通滤波器,被配置为提供所述输入信号的低通滤波部分;建模单元,被配置为应用正弦建模以修正所述高通滤波部分从而生成经修正的高频信号,其中,经修正的所述高频信号的相位至少部分地是随机化的;组合器,用于将所述低通滤波部分与经修正的所述高频信号组合用于提供组合信号; 听力损失处理器,被配置为处理所述组合信号,所述处理根据所述助听器的用户的听力损失进行;以及接收器,用于将来自所述听力损失处理器的音频输出信号转换为输出声音信号。
全文摘要
本发明披露了助听器的稳定性改进。本发明涉及用于助听器中稳定性改进的信号去相关并且涉及改善高频处的谈话可听度。公开了一种助听器以及将助听器的输入信号和输出信号去相关的方法。本发明包括将输入信号划分为高频部分和低频部分,基于输入信号的高频部分和模型来生成合成信号,该模型基于周期函数,其中,合成信号的相位至少部分地为随机化的,以及,将合成信号与输入信号的低频部分组合。
文档编号H04R25/00GK102264022SQ20111008865
公开日2011年11月30日 申请日期2011年4月8日 优先权日2010年4月8日
发明者詹姆斯·米切尔·卡特斯 申请人:Gn瑞声达公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1