提高声音清晰度的系统的制作方法

文档序号：2837046阅读：702来源：国知局

专利名称：提高声音清晰度的系统的制作方法
技术领域：
本发明涉及音频再现应用，其中期望的音频信号以无污染的形式. 获得并且干扰(例如环境噪声)作为声音信号出现。
背景技术：
在声音嘈杂的环境中，收听者难以听到所想要的声音信号或"兴趣信号"。例如，在汽车里的手机用户通过他们的耳机可能难以听清所接收的语音信号，因为汽车的噪声屏蔽了兴趣信号(即手机所接收的语音信号)。为了解决这一问题，过去曾经进行了许多尝试。其中一些简要地描述如下-
(a) 被动噪声衰减耳机用于耳机应用的特定应用场合，由将环
境声音噪声与收听者的耳朵以物理方式隔离的大而笨重的耳罩提供无源噪声衰减。
(b) 放大放大输入的感兴趣的电信号以克服背景噪声的强度。如果控制不适当，可能导致有害的高声输出强度。并且，除非很好地控制了放大工作，否则不能提供所希望的好处。
(C)过滤信号被静态地过滤，使其更清晰。
(d) 简单自动增益控制(AGC):兴趣信号通过自动增益控制系统，其中根据耳罩内或耳罩外的噪声强度测量调节增益。这种AGC增
益通常通过简单测量整体噪声强度来控制。
(e) 主动噪声清除(ANC):产生抗噪声(用开环或闭环伺服系统产生的)并有声地施加给噪声信号。对于耳机的应用，参见Bose， Amar等人的"Headphoning"(美国专利4,455,675， 1984年6月19日) Reduction in Headphone System"， (Headwize技术论文库，1999)。
(f)有时候，这些方法相结合耳机应用的一个通常方案是将被动噪声衰减耳机和ANC系统相结合(见Bose， Amar等人的"Headphoning"， (美国专利4455675， 1984年6月19日))。
虽然在多种应用中，这些方法是很有效的，并且能减少噪声，但这些方法并不总是是合适的。例如，ANC需要精确的噪声基准(reference), 该噪声基准有时可能得不到，并且其只在低频下工作。被动噪声衰减只有在具有足够的隔音空间时才能有效地工作。过滤使信号频率成分失真。AGC系统没有考虑人的听力系统并产生次优化结果。同时，即使能够应用这些方案的，也存在着由于这些方案的能量消耗过大而受到限制的场合，所以需要小型化，低能量的技术。
Yoimg-cheol Park等人("具有心理声学响度校正的高性能数字式助听器处理器"，ICCE， International Conference on Consumer Electronics, 1997,页313-313，XP010249998)公开了一种执行非线性响度校正的数字式助听器处理器。Young-cheol Park等人处理输入信号以调节其响度。
WO 98 47315 A在图2中公开了一种噪声减小装置，其具有一个方框，用来将输入10变换成频率域的窗式频率变换方框32，一个用于检测来自输入10的声音的声音检测34，一个噪声频谱估计38和一个叠加再合成单方框44。
美国专利5,388,185在图2公开了一种自适应处理声音信号的系统。在步骤30，语音信号样本被置于时域中的四个重叠缓冲器的一个之中。然后，每个缓冲器用Hamming窗(用于变换成频率域)修正。在步骤 40、 50、 90，该系统执行快速傅立叶变换(FFT)、频谱修正和快速傅立叶反变换(IFFT)。在步骤100，四个重叠缓冲器相加以重构修改的语音信号。
WO 00 65872 A在图3公开了一种响度正常化控制系统，其具有一个将时域的声音信号变换成频率域的滤波器组电路42，一个信号处理器 46和一个合成滤波器50 (图3)。
ScheiderT等人("用于数字式助听器的多通道压縮策略"，1977， IEEE, International Conference on Acoustics, Speech, and Signal Processing:
ICASSP-97，页411-414, XP010226222, Munich Germany, Los Alamitos CA, USA, IEEE Comput., SOC， ISBN: 0-8186-7919-0)公开了一种压縮系
统，其使用了一个过采样的、多相离散傅立叶变换(DFT)滤波器组和一个合成滤波器组。
然而，还需要提供一种革新方法，使得可以克服干扰信号(诸如噪声)而提高信号清晰度。
因此，需要解决上面提到的这些问题并且还需要一种改进的方法以提高和/或取代现有的技术。

发明内容
本发明的目的是提供一种提高信号质量和信号清晰度的新颖方法和系统。
根据本发明的一方面，提供了一种克服干扰信号的提高信号清晰度的系统，其包括一个分析滤波器组，用于将时域中的信息信号转换成转换域中的多通道信息信号；一个信号处理器，用于处理分析滤波器组
的输出，该信号处理器包括一个利用心理声学模型计算动态范围的心理
声学处理器，以提供克服干扰信号的可听的信息信号；和一个合成滤波器组，用于混合信号处理器的输出，以产生输出信号。
本发明的信号清晰度增强(SIE)的设计使得减小了现有技术装置的不利因素和缺点。它可以用于噪声信号相对于兴趣信号很强的环境中。这种环境导致能得到的动态范围非常有限。虽然可以利用以往系统的简单动态范围压缩方法将兴趣信号映射到这个很小的动态范围中，但是所得到信号的保真度和质量可能受到影响。在这种情况下，施加使兴趣信号克服不良噪声而可被听见所需要的最小增益(因而更清晰)，造成了信号质量的提高。因此本发明涉及确定和应用这个最小增益。
根据本发明，SIE处理包括一个心理声学模型，它在工作进行中，
计算要使兴趣信号克服不良噪声而可被听见所必须施加的最小放大值。这样得到较好的保真度和信号质量。
根据本发明，信号清晰度增强(SIE)算法通过测量(1)外部干扰 (不良信号、噪声)强度或(2)头戴式耳机耳罩中的或耳道中的干扰 (不良信号、噪声)强度，自适应地调节兴趣信号(电的)的增益和平衡，以使兴趣信号的清晰度和可听性提高。这些强度测量是单独利用频段级别或综合利用本领域的已知技术来进行，这些技术描述在Schneider, ToldA.的"自适应动态控制器"(MASc论文集，加拿大安大略省，滑铁卢大学，1991) ; Schneider和Brennan的"用于数字助听器的压縮策略"(Proc.ICASSP 1997,德国，慕尼黑);和Schmidt, John的"音频信号的动态范围压縮装置"(美国专利5832444号)中已经说明。
总的来说，通过利用本发明，使用者接收的信号的SNR (信噪比) 得到了提高，并且其不断地适应使用者的环境，提供的兴趣信号强度是令人舒适的。这样就提高了信号清晰度，提高了感知信号质量，并减少使用者的疲劳。
为了提供最好的保真度，超微型的尺寸和最低的功率消耗，优选地， SIE算法利用过釆样滤波器组实现，以将兴趣信号和不良信号分成若干个交叠的、相邻的或不交叠的波段。在Schneider和Brennan的美国专利 6,236,731 "用于过滤信息信号并将信息信号分成不同波段的滤波器组结构和方法，特别是用于助听器的音频信号上述结构和方法"中说明了一种合适的过采样滤波器组。有利地实现该设计的结构组合了一个加权叠加(WOLA)滤波器组、一个可编程软件DSP芯、一个输入-输出处理器和非易失存储器。在Schneider和Brennan的美国专利6，240，192 "包
括应用特定的集成电路和可编程数字信号处理器的数字助听器中的过滤装置和方法"已说明了这种结构。
在任何需要提高含有大量噪声的所接收音频信号的清晰度，同时要保持高保真度和良好的信号质量的场合，都可以使用本发明。本发明的典型应用包括用于呼叫中心的耳机、在噪声环境(例如飞机、音乐会、工厂等)中使用的移动电话和其他微型/便携式音频装置。
参考下面的说明书、权利要求和附图可以进一步理解本发明的其他特征、方面和优点。

下面将参考附图描述本发明的实施例，其中图1示出了用于接收算法的典型情况；
图2是将兴趣信号的动态范围映射成可获得的动态范围的示意图；图3示出根据本发明的信号清晰度增强的基本操作。
图4示出根据本发明的SIE处理的高电平框图，包括期望信号活动性检测器(DSAD)(或声音活动性检测器(VAD));
图5示出利用自适应噪声估计的S正的框图6示出利用不同谱线的噪声估计的SIE的框图7示出直线压縮的输入/增益函数；
图8示出一个具有相结合的SIE和ANC的本发明的实施例；图9是一个说明结合左右噪声层(noise floor)的曲线图IO示出具有传输算法能力的二进制组合系统；
图11示出具有共享传输(Tx)传声器的开环SIE的框图12示出具有共享传输(Tx)传声器和方向处理的开环SIE的框图。
具体实施例方式
下面将具体参考收听者使用的耳机描述优选实施例，本发明主要用于耳机，但并不是只能用于耳机。
应用于音频收听的信号处理算法通常称之为"接收算法"(Rx)，因为收听者想要听到接收的音频信号。本发明的信号清晰度增强(SIE) 处理的一种典型应用是用于噪声环境的耳机。图1示意地示出了该元件和兴趣信号。收听者101收听通常来自电信号107的期望声音和环境(周围)噪声110的合成，环境噪声是使兴趣信号的清晰度降低的不良信号。由耳机115提供的被动衰减减少了可听到的环境噪声强度。
如果在耳道中兴趣信号的强度远低于噪声信号的强度，那末兴趣信号被淹没而听不到。收听者还具有觉得舒适的最大信号强度(响度不舒适级一LDL) 。 LDL可以是简单的基于频率的对不舒适级的测量(如本
带宽之内的信号^度、、频率成分、、信号持续时l^或其他;目关心理声学参数的心理声学响度的复杂测量。噪声信号和LDL均为频率的函数，两
者强度的差别在于有效动态范围，有效动态范围也是频率的函数。由于不良信号(即噪声)的强度，收听者感受到减小的动态范围。以与频率相关的方式再映射兴趣信号，增加兴趣信号的强度使之高于周围的噪声，兴趣信号就可以被听到。然而，放大作用必须使信号强度不能超出
使收听者感到舒适的最大信号强度(LDL)。解决的方法是在出现环境噪声的情况下，将原始兴趣信号的动态范围映射成可用的信号动态范围。这种信号处理被称为动态范围压縮。在图2中示出了单一频段的这种映射，在图2中，期望(原始)动态范围210及其噪声层215，与具有被环境噪声增大了的噪声层225的不纯动态范围220相比较。因此，动态范围压縮的目的是有意地使兴趣信号的动态范围失真，但同时使感觉到的失真最小。
下面参考图3来说明作为频率函数的一种动态范围压縮操作的形式。图3以频率300比任意强度305的比例的曲线形式，示出了期望兴趣信号310和不良(环境)噪声315的频谱。注意，在一定频率320之上，兴趣信号310的强度下降，趋近并低于不良噪声315。在系统中，兴趣信号310有选择地，即取决于频率和输入强度，作为输入强度地函数被放大为330，以便高于噪声层而能够被听到。多个交叠或不交叠的频段有利地实现了这一操作，这些频段可以被单独处理或组成为通道一起处理。为完整起见，图3还示出了前述的响度不舒适级(LDL) 340。
在下面对优选实施例的描述中，在一个或多个分析滤波器组和合成滤波器组之间的路径应当认为具有N维(dimension)(平行路径)，这是因为通过分析滤波器组得到N个子频段，每个都需要单独的路径。由于要单独考虑和操作每个子频段，这种考虑也适用于设置在该滤波器组之间的任何功能框。虽然通常N〉二 16，本发明特别适用于N〉1的情况。在某些实施例中，这些N个子频段组成为K个通道中，其中每个通道包括一个或多个相邻的子频段，然后处理每个通道，使得在这个通道内的所有子频段得到相同的增益。
参考图4，图4示出本发明的一个实施例的框图，第一声音输入装
置(信号传声器)401接收兴趣信号(通常是语音)，并且将它传递到第一 WOLA分析滤波器组405。第二声音输入装置(噪声传声器)402 接收可能参有兴趣信号的环境噪声并将它传递到第二 WOLA分析滤波
器组406。第二声音输入装置402通常位于耳道内(所谓的闭环装置 (implementation))或耳道外面(所谓开环装置)。每个滤波器组将输入信号分成N个子频段。
这些装置之间的任何差别在下面的描述中被指出。在闭环装置中，由于信号路径(例如，将声音传输到模制在耳机中的扬声器中的声管) 声音的原因，已经包括了平衡。相反，在开环装置中，由于头戴式耳机耳罩的衰减和频率响应以及声音信号路径的原因，包含从传声器到耳道内的传递函数模型。也可以包括输出级的模型，使得在任何自适应平衡之前，可能出现在耳道中的兴趣信号的强度能够被逼近。
在开环装置中，可以使用单独或共享的环境噪声传声器。在利用共享传声器的情况下，可以使用同一个扬声器传输信号(例如，应用耳机中传输语音)。这就减少了成本并简化了机械结构。在这种情况下，需要有一个信号或噪声活动性(activity)检测器，以确保噪声频谱估计不包含任何传输信号。
在运行中，包含在心理声学处理方框430中的心理声学模型以频率子频段的方式或以组合的频率子频段(通道)方式接收兴趣信号强度，该频率子频段覆盖由第一 (兴趣信号)WOLA分析滤波器组405产生的期望信号频谱。然后，使用这些相同频段或组合频段(通道)中的环境噪声强度，但被应用于由第二 (环境噪声)WOLA分析滤波器组产生的环境噪声频谱的心理声学处理方框430计算动态范围参数。这些计算出的参数被送到多段压縮器420，多段压縮器又将他们施加到由第一 (兴趣信号)WOLA分析滤波器组405得到的子频段。然后多段压縮器420 利用由心理声学处理方框430提供的动态范围参数去平衡作为频率函数的信号，从而改进可听见性或清晰度。利用与已知的动态范围压缩技术相结合的心理声学模型，确保了输出音频克服环境噪声而被清晰地听见，同时使感觉到的失真最小，并保持期望信号的质量。期望信号活动性检测器(DSAD)方框410接收来自WOLA分析滤波器405、 406的输出，并利用频谱估计方框435将更新控制到噪声频谱的估计。以下说明的该频谱估计方框435为心理声学处理方框430提供进一步信息。多段压縮器420的输出被提供给合成滤波器组450。合成滤波器组450将多段压縮器420的输出转换，以输出一个时域音频信号。
噪声估计
对在心理声学处理方框430中进行的SIE信号处理的一个重要输入是由第二输入装置402提供的环境噪声频谱。本发明的SIE处理频谱估计方框435包括一种自适应估计技术或频谱差分技术。结合期望信号功率检测器(DSAD) 410，这些技术对要确定的环境噪声频谱提供精确的不参杂的估计。在另一个优选实施例中，环境噪声是用共享的输入传声器获得的(见下文)。
在开环的情况下，噪声估计是由共享或单独传声器完成的。共享或单独传声器上的DSAD或VAD以从共享或单独传声器经频谱分析得到的噪声频谱估计来控制更新。如果在共享或单独传声器上检测到语音 (或某些其他兴趣信号)，那末噪声的频谱估计不进行更新(注意，在开环情况下不使用频谱差分和自适应估计)。
在闭环情况下，位于耳罩内的传声器接收的是信号加噪声的混合形式。在这种情况下，我们需要将信号去除(这是已知的，因为我们有电形式的信号)。这是利用频谱差分和自适应估计技术来实现的。
期望信号活动性检测器(DSAD)
DSAD410利用本领域共知的技术，在不存在兴趣信号时(即，在期望信号暂停或中断时)对信号频谱采样。这样确保算法不把期望信号(或在具有共享传声器的耳机应用情况下，所传输的语音)当作环境噪声的一部分。
在使用闭环装置的实施例中，当DSAD 410指示没有期望兴趣信
号出现，噪声频谱图像被更新，从而使得结果频谱被兴趣信号参杂得
最少。在利用开环装置的另一个实施例中，DSAD 410可以有选择地
监控环境噪声信号，以确保传输语音或其他兴趣信号不会参杂作为对心理声学模型的输入所提供的噪声频谱。
在闭环装置中，如果噪声频谱在某些预定的时间内没有被更新，那末，输出音频可以在短时间内有选择地净噪，使得在没有期望信号出现时，噪声频谱能够被更新。结合定时更新(需要时)使用DSAD，确保噪声频谱总是最新的，并且绝不参杂有期望信号频谱。
自适应噪声估计
在本发明的一个优选实施例中，利用采用了本领域已知技术的自
适应噪声估计来估计环境噪声，但是，在过采样的WOLA子频段滤波器组的情况下，也可以使用一种技术，这种技术在由本申请人同一天申请的一起尚待批准的序列号为2,354,808的加拿大专利申请中己作了说明，其名称为"在过釆样滤波器组中的子频段自适应处理"，其美国申请号为xxxxxxx，在此结合该专利公开的内容作为参考。
图5示出了具有自适应估计的S正的框图。虽然描述了时域技术，但本领域的技术人员应当明白，变换(例如，频率)域技术也是可能的并且是有利的。电子形式的期望信号501被传递到第一分析滤波器组503，该滤波器组产生多个如前面的实施例中的子频段。然后每个子频段被乘法器505用从心理声学模型507得到的函数G相乘。施加增益的结果转而传递到合成滤波器组509，该滤波器组转换来自子频段修改的信号并将该输出传递到驱动接收器513的功率放大器511。物理位置接近于接收器513的传声器520将其输出送出到一个自适应相关器 525，其中该输出是参有包括环境噪声的各种噪声成分的期望信号。作为噪声信号的估计，对自适应相关器525的输出被第二合成滤波器组 530分解成子频段。来自第二合成滤波器组530的子频段也被传递到心理声学模型框507。如上所述，自适应估计也可以在转换域中进行。
自适应噪声估计不需要中断兴趣信号来估计噪声。噪声是利用从传声器520得到的参杂信号和期望电输入信号501 (兴趣信号)之间的相关性连续地估计的。自适应相关器525的输出主要包含期望信号501 和期望信号加噪声520之间不相关的信号成分。
利用频谱差分的噪声估计
频谱差分是取兴趣信号的变换域形式与环境噪声的变换域形式的过滤或未过滤形式之间的差。这个减法可以在频段或频段组进行。这种估计方法在闭环装置(见下文)中特别有利，由于环境噪声和S正处理的兴趣信号的声学累加，在闭环装置中环境噪声信号也包含有兴趣信号。
采用对兴趣信号的过滤能够得到更精确的估计。当滤波器具有与
输出级(SIE平衡、放大器、扬声器和声音)以及传声器的频率响应相等或近似相等的频率响应时，那么变换域中的减法对未参杂的(用兴趣信号)环境噪声提供了极佳的近似。这种过滤可以有选择地包括对于零输出(null-out)变换器和其他差值的校准，并且可以用离线或在线技术来实现。
和自适应估计一样，频谱差分不需要中断期望信号来估计噪声一一噪声是利用两个信号之间的频谱差别连续地估计。图6示出了这样一种系统，其中引入了新的函数F' 605，该函数逼近分析滤波器组601 和接收器614之间的信号路径的整体传递函数F 610。信号路径包括一个乘法器611 、一个合成滤波器612、一个功率放大器613和接收器614 本身。采样传声器620将代表期望信号加任何引进噪声的信号送入第二滤波器组625，第二滤波器组的输出与作用在期望信号适当子频段的函数F' 605的结果相结合，以产生噪声估计630，噪声估计630被输送到心理声学模型635。然后来自心理声学模型635的增益输出与每个子频段在乘法器611中相乘。
图6a示出N个子频段被组合进K个通道中的另一个实施例，并且引进另一个与耳机性能特性估计相关的函数。对于重复图6中函数的那些组件，不再加以说明。分析滤波器601、 625的N个输出子频段被传递到频段成组框603、 627，频段成组框将若干个频段组合为单一的通道，这样仅仅进一步处理k个通道(其中K<N)。频段成组框603、 627的输出分别传递到强度测量方框605、 628，在此每个通道的强度被测量，其结果又传递到适当的强度寄存器606、 629。心理声学模型 635利用储存在寄存器606、 629的通道的兴趣信号和"信号+噪声" 强度，来计算施加到每个频段的增益。此外，这些增益以反馈的形式被用来调节函数H(z)615，该函数利用模型640逼近耳机的传递函数。函数H(z)的输出用减法器630调节作为提交给心理声学模型635的噪声强度。
心理声学处理
可以使用心理声学模型635的四个不同的方式以及其组合来计算施加给变换信号域的增益。对该增益的计算要确保期望信号处理后的形式总能克服环境噪声而被听见，并且总是能使收听者感到舒适。在所有情况下，LDL确定了动态范围的上限。
1) 动态范围的下限由一个频段或频段组合的环境噪声的能量来确定。
2) 动态范围的下限由一个频段或频段组合的环境噪声的强度乘以 0与l之间的可调节系数(X)建立。该系数控制低强度兴趣信号被装置放大的量。较低的X可使兴趣信号获得较大动态范围，并改进信号. 质量。X太低则意味着在低强度时，兴趣信号被环境噪声所掩没。
3) 动态范围的下限由复杂的心理声学模型确定，该模型考虑兴趣信号和环境噪声的强度、频谱成分和频谱性质，以计算在噪声内的最小的可清晰听到的强度，这在本领域内已为人所知。
4) 动态范围的下限由一个通道内的噪声能量减去兴趣信号的SNR
所确定。
在一个优选实施例中，利用临界频段、频率成分、信号持续时间或其他相关的心理声学参数，以信号强度为基础，并利用感知信号响度的在线估计来计算LDL。
多频段压縮器
在一个优选实施例中，心理声学模型的一个元件是多频段动态范围压縮器。对于较小的有效动态范围的动态范围压縮是利用若干种已知的强度映射算法中的一种完成的。使用这些方法时可以结合査询表或其他已知的手段的辅助，以提供压縮输入对增益函数的形状，在其他情况下增益可以根据数学公式直接计算。可能的强度映射算法的例子是
1) 直线压縮法——其中输入/增益函数是如图7所示的直线。这里，强度映射算法包括以分贝形式表示的用于压縮区的数学公式-
增益二E靜X (1—E倍号/LDL)
2) 曲线压縮法——输入/增益函数不是直线，而是弯曲的，以便较好地符合人的听力系统中对响度增长的感觉。这种方法的结果是改进
了感知保真度，但是它必须依赖于复杂的公式，或者要从査询表中提取信息。
3)心理声学模型包含在压縮器中或与压縮器一体，以使期望信号
能够被听见。对增益的时间变化以这样的方式控制，使感觉的失真最小，并且使兴趣信号尽可能被听见。
对于所有的强度映射算法，心理声学模型通过确定要在噪声内听到什么声音，来计算在给定(子频段或)通道中使失真最小的强度。这样的信息带来对期望信号质量的客观估计，能够计算出近似优化的压缩参数。采用其他强度映射模式也是可行的。
通常的情况是，输入的兴趣信号不是完全没有噪声的。在这种情况下，并非对整个动态范围进行压縮，对存在噪声的信号的低强度扩展(增加动态范围)是有利的。这样可以感觉到兴趣信号中的噪声减
小，并且使其听不到。如果已经知道兴趣信号的噪声层，前面参考图2 描述的动态范围再映射可以进一步减少该噪声层的可听见度，因为它
被环境噪声所掩没。
为了在所有环境中提供高感知保真度，可以执行频谱倾斜限制(tilt constraints)。这类限制防止本发明对声音过度处理到这样的程度，即输出音频的均衡使得在以频谱成形的噪声环境中，输出音频令人不舒服或质量下降。在一个优选实施例中，该限制是通过在压縮器的不同通道之间执行最大的增益差而实现的。当本发明中所用的处理试图超出最大增益差的阈值时，在各通道中兼顾考虑以要求更极端的调节或适应，并且施加或多或少的增益以满足该限制。也可采用使用更复杂手段的其他限制，例如语音质量的目标测量。
每个个人的是独一无二的，并且因此每个个人的能够确定并设置他或她自己的LDL、期望收听强度和响度的加大量。通过个性化处理，心理声学操作的关键特性是针对单个使用者进行调节(与助听器的调节方式不同)。在一个优选实施例中，这些参数作为心理声学模型的一部分，被非易失存储器存储。
使用者的SIE强度调节
SIE的使用者也许想要调节信号处理算法的灵敏度。因为低强度的声音是听不见的(不是因为高强度的声音是可听见的)，调节这种控制的使用者通常是调节强度，这种控制可以看作是高级音量控制。在一个优选实施例中，前面(心理声学处理中)所述的参数"X"可以让使用者能调节控制SIE算法的灵敏度。也可以采用其他更先进的实施例，其中强度调节为心理声学处理框提供一个参数输入。并且这类更先进的实施例依赖于所采用的心理声学处理的特定类型。
与主动噪声消除的结合
目前许多耳机都有主动噪声消除(ANC) 。 ANC技术的应用是通过产生主动消除环境噪声的抗噪声(anti-noise)，改善噪声环境中的信号清晰度。然而，由于己知的反馈系统的限制，ANC通常只对低频有效。通过将SIE发明与ANC结合，声音的质量和可感知度被增强，这是两种方法中任何一种都不能单独获得的。图8示出了这种结合。兴趣信号801进入分析滤波器组805，由此子频段通过乘法器807，然后传输到合成滤波器809，在此被转换并传递到加法器812，加法器的输出通过反相器814、输出级(放大器)816、使输出与噪声信号817 混合的第二加法器818，然后传输到接收器820。兴趣信号还输入给心理声学模型框840，心理声学模型框控制通过乘法器807的子频段。心理声学模型框840的另一个输入来自包含声音延时825的一个反馈回路，声学延时825将用来驱动接收器820的信号输送到传声器830，传声器830的输出首先被放大到832，然后通过低通滤波器834被传递到第一加法器812，并传输到心理声学模型框840。在某些实施例中，相关ANC系统已经具有用来采样噪声的传声器，这个传声器同时可以用于信号清晰度增强以对耳道中的环境噪声进行采样。这两种技术的结合使其每一种更精巧，因此减小了失真，同时可以提高质量和感知性。
在另一个实施例中，SIE和ANC处理的结合是使用过采样的 WOLA滤波器组作为对ANC系统的预均衡器实现的。可以利用这二者结合的模拟或数字信号处理来实现ANC系统。在本领域，这种ANC 处理是众所周知的，因此不再说明。WOLA测量耳道中的(闭环ANC)
预均衡的剩余噪声或外部环境噪声(开环ANC)，并使用所得的频谱信息作为给预均衡器提供动态范围参数的心理声学模型的输入。
双声道操作
当使用立体声系统时(例如双耳声道耳机或头戴式麦克风)，可以包括用于SIE的联合通道处理扩展。考虑两种情况
1) 每只耳朵外(开环)或耳罩内(闭环)有一个传声器。在这种
情况下，如图9所示，其中具有噪声强度轴950，频率轴960，右声道 910和左声道900的噪声层通过某种方式(例如取每个通道的或每个通道中的每个子频段的左右侧的最大强度或平均强度)结合，以提供结合的噪声层920。
2) 在耳罩中的一个或在装置的其它地方只有一个传声器。在这种情况下，只具有一个噪声测量。
仅有一个噪声测量对于SIE算法是很重要的，因为立体声压縮器方式(可能具有独立的噪声测量)可以导致不需要的独立通道调节，并因此降低感知的音频质量。当使用者仅有一个环境噪声测量时，SIE 处理方式的左右两侧使用同样的信息来。在立体声兴趣信号情况下，两个SIE处理装置使用同样的环境噪声强度，以控制随后的每个音频流的处理。
在图IO所示的一个实施例中，双声道耳机1020、 1052与单声道信号1000—起使用。其典型的应用是使用单声道语音的移动电话耳机。结合器(combiner) 1072、心理声学模型框1075和供给乘法器1007 的组合实现了一个单一SIE处理装置被。经过放大器1001的放大、数字到模拟的转换1003，输入(期望的)信号1999被第一分析滤波器 1005分成子频段，每个子频段在乘法器1007与来自心理声学模型框 1075的合适输出相乘，然后被合成滤波器1013转换为单频段。这个"单频段"电信号经其各自的低通滤波器1030、 1060，反相器1035、 1062，加法器1015、 1050和放大器1017和、1051被送到输出变换器1020、 1052，根据靠近其各自接收器1020、 1052的噪声检测传声器1022、 1055 的输入，这些信号进一步被单独修正。心理声学模型框1075也利用来自噪声检测扬声器1022、 1055的信号，噪声检测扬声器1022、 1055
的输出经过其各自的模-数转换器1027、 1065传递到第二和第三分析滤波器1040、 1070，其输出子频段在结合器1072被结合形成联合频谱图像，以便由心理声学模型方块1075处理，来产生用于乘法器1007中的各个子频段的合适增益控制信号。这种方式的优势在于，只用一个 D/A转换器1013将处理过的信号传递给两个输出转换器1020、 1052。
包括簡、1030、 1035、和1015 (或廳、1060、 1062和1050) 的反馈路径实现了前述的ANC系统与SIE的结合。
共享噪声传声器
本发明的另一个SIE实施例被用在图11所示的幵环结构中(通常用在无线电通信头戴式耳机中)，其中用来接收传输的(Tx)语音的传声器1120也用来采样环境噪声——所谓的共享传声器技术。兴趣信号 1101被第一分析滤波器组1103输入到N个子频段，并且子频段被频段成组框1150组成K个通道。每个这些"兴趣信号"通道的强度由强度测量框1153来测量，并且该强度被存储在合适的寄存器1155中。每个子频段还被乘法器1107修正，并且这些子频段被合成滤波器组1110重新组合成单频段并传输到音频输出1115。类似地，来自传声器1120的环境噪声的釆样被第二合成滤波器1123分成N个子频段，并且其结果的子频段被另一个频段组合框1160组合成K个通道。每个这些噪声通道的强度由强度测量框1163测量并存储在合适的寄存器1165中。心理声学模型框1140利用存储在兴趣信号寄存器和噪声寄存器中的强度值确定由乘法器1107施加到输入的兴趣信号1101的每个频段的增益。声音活动性检测器1125监控噪声分析滤波器组1123的输出并检测传输信号(声音)的间隙。只有出现这种间隙时，测量到的强度才被认为是正确的。因此，信号从声音活动性检测器1125传递到强度寄存器1165指示出何时没有声音活动性。这种方式降低了成本和硬件的复杂性。
在另一个实施例中，用来恢复传输信号的算法也可以与图1的开环传声器共享SIE系统相结合。例如，在图12中，本领域所共知的或尚待批准的处理算法已经被用来减少传输信号的噪声，但是用于该信号的相同传声器也可以釆用图11所示的技术被用于估计环境噪声。在图12 中，兴趣信号1210的路径类似于前述实施例中的路径，即兴趣信号1210
被第一方向滤波器组1213分成子频段，每个子频段被乘法器1215修改，并且这些子频段被合成滤波器组1217变换成单一频段，并且被放大器 1219放大用于接收器1220。然而，相反的是，噪声信号是从两个扬声器(所谓的前后扬声器)1201、 1207得到的，扬声器1201、 1207的输出被相应的第二和第三分析滤波器组1203、 1209分成子频段。两组子频段被方向处理框1230利用，因在此不相关，所以不作说明。同一组子频段信号被传输给期望信号活动性检测器(DSAD)框1240，框1240 的输出传输给控制乘法器1215的心理声学模型框1260。同时，对应距离被传输信号最远的传声器的第三分析滤波器1209的输出经过传递函数框1250，被传递给心理声学模型框1260。期望能够确定从Tx传声器到输出变换器的传递函数1250，以对耳道中的噪声强度提供精确的估计，从而逼近闭环条件。
在另一个实施例中(图12未示出)，方向处理框提供一个输出噪声估计以获得包含较少传输语音的噪声估计，该输出噪声估计是使音束偏离被传输的信号源而产生的。在又一个实施例中，可以从一个传声器中减去方向输出，以便获得改进的噪声估计。
注意，诸如DSAD，自适应噪声估计或频谱差分噪声估计的前端处理技术可以被用在任何开环结构中。其他的前端处理(如方向处理)能使某些语音和噪声的分离，从而改进性能。
以下说明本发明的其他特征和方面，以及相关的优点
1) 提高了信号清晰度。同时，保持了信号的保真度和质量，并且在噪声环境中提高了感知质量。
2) 对心理声学模型和高保真度的，限制动态范围适应方式的使用意味着使用的动态范围的最大(其中动态范围是在噪声之上的能听见的最小信号强度与最大允许信号强度之间的强度差)。这样就得到极佳的信号质量和保真度。
3) 该设计可以利用适合直接安装于头戴式耳机中或其他便携式音频应用中的超低能量、次微型技术来实现(见Schneider和Brennan的美国专利6，240，192号，其名称为"包括应用特定的集成电路和可编程数字信号处理器的数字助听器中的过滤装置和方法")。利用过采样滤波器组的实现(见Schneider和Brennan的美国专利6,236,731号中，其名
称为"用于过滤信息信号并将信息信号分成不同波段的滤波器组结构和方法，特别是用于助听器的音频信号上述结构和方法")为便携式低能量音频应用提供了理想的高保真和超低能量解决方案。
4) 当与闭环、主动噪声消除(ANC)系统结合时，可以利用一个优势，即两者都需要有在接近输出变换器的地方测量不良噪声的装置。所以同一个传声器(位于输出变换器的附近)既可以被用来测量产生"抗噪"的信号，也能提供剩余强度的测量，从该测量可以计算用于信号清晰度增强(SIE)处理的输入强度估计。这种结合方法比单独使用两种方法之一效果要好，这是因为ANC只限于对低频有利(由于设计的考虑)，信号清晰度增强在高频下有利。利用同一个传声器减少了成本，并使系统简化。在很多收听情况下，低频噪声占主要地位。这里，在低频下用ANC以减少噪声增加了可用的动态范围，其结果是相对于单独使用一种方法(ANC或S正)，保真度被提高。
5) 在兴趣信号包含噪声的情况下，兴趣信号可以用心理声学模型和/或低强度扩展来处理，使得噪声强度有效地低于声音信号强度(或在应用ANC时，是剩余信号强度)。当处理得当时，收听者感知到很小的噪声。
6) 可以将单个传声器噪声减少技术结合在兴趣信号通道中，如在加拿大的PCT申请Bernnan， Robert的PCT/CA98/00331 "用于减少噪声，特别时助听器中的噪声的方法和装置"中所述。因为被处理的兴趣信号包含很少噪声，这就为收听者提供了更容易听到的信号(相对于环境噪声)，并减少长时间的收听疲劳。
7) 当使用期望信号活动性检测器(DSAD)时，就能够实现区分兴趣信号和环境噪声(干扰)。这样确保了噪声信号估计不会参杂兴趣信号，使声音交流具有较高清晰度而更加清楚。
8) 在本发明的另一个实施例中，使用了自适应滤波器使参杂信号 (信号+噪声)与未参杂电信号发生关系，以便能够得到噪声估计。这
对于参杂了兴趣信号的噪声信号提供了更可靠的估计。采用这种技术提高了信号的保真度。
9) 在本发明的另一个实施例中，使用了频谱差分技术估计环境噪声的频谱内容。这对于参杂了兴趣信号的噪声信号提供了更可靠的估计。这种处理也提高了信号的保真度。
10) 利用压縮器元件的多频段处理(频率范围被单独地处理，而不一致地压縮整个频谱)，可以对剩余动态范围进行更精确地映射，并且
提高了整体感知音频质量，这在Schneider和Brennan的"用于数字助听器的压缩策略"(Proc.ICASSP 1997，德国，慕尼黑)中已作了说明。相互独立地处理频段使得产生高保真度压縮具有更大的自由度。此外，通过限制频率范围的相关对压縮水平使得出现预定的最大频率成形量，在较宽范围的噪声环境中保持了信号质量。这确保了频率局域噪声源可以被更好地处理。
11) 使用多频段和/或自适应噪声强度测量，能够使设备平滑地处理噪声环境的任何变化。它还能防止不良失真，否则的话，在环境噪声剧烈变化时就会发生这种失真。见Schneider, Told A.的"自适应动态控制器"(MASc论文集，加拿大，安大略省，滑铁卢，滑铁卢大学，1991) 和Schneider和Brennan的"用于数字助听器的压縮策略"(Proc. ICASSP 1997，德国，慕尼黑)。
12) 本发明隐含有一个安全系统。信号处理不会使期望声音放大超过使用者的响度不舒适级(LDL)。这是设计的一个安全特征，有助于在高噪声环境中保护使用者的听力。这与本发明提供的其他调节一起，可以对特定使用者实现个性化的处理。
虽然已经参考具体实施例，对本发明作了描述，但这种描述只是对本发明的说明，而不应理解为对本发明的限制。对本领域的技术人员来说，还可以对本发明进行各种更改，同时不脱离所附权利要求限定的本发明的实质和范围。
权利要求
1.一种克服干扰信号的提高信号清晰度的系统，所述系统包括第一输入端，用于接收包括可能被环境噪声污染的兴趣信号的信息信号；第二输入端，用于接收包括所述环境噪声的干扰信号，所述第二输入能基于连续方式接收所述干扰信号，而不管所述兴趣信号是否存在；分析滤波器组，用于通过所述第一输入接收所述信息信号，并将时域中的所述信息信号变换成变换域中的多个子带信息信号；信号处理器，用于接收并处理从所述分析滤波器组输出的所述子带信息信号和基于连续方式通过所述第二输入接收的所述干扰信号，所述信号处理器包括心理声学处理器，其利用心理声学模型计算动态范围，使得所述子带信息信号能克服所述干扰信号而被听见，和合成滤波器组，用于将从所述信号处理器输出的所述可听子带信息信号组合，以产生具有信号清晰度被提高的所述兴趣信号的输出信号。
2. 如权利要求l所述的系统，还包括分析滤波器组，用于将时域的所述干扰信号变换成变换域的多个子带干扰信号。
3. 如权利要求1或2所述的系统，其中所述信号处理器还包括用于估计所述环境噪声的频谱的噪声估计电路，所述频谱被提供给所述心理声学模型。
4. 如权利要求3所述的系统，其中所述噪声估计电路执行自适应噪声估计。
5. 如权利要求3所述的系统，其中所述噪声估计电路利用频谱差分技术执行噪声估计。
6. 如权利要求1或2所述的系统，其中所述信号处理器包括-自适应相关器，用于基于所述信息信号和所述干扰信号提供所述环境噪声的估计。
7. 如权利要求2所述的系统，其中所述信号处理器包括噪声估计电路，其通过从所述子带干扰信号中减去所述子带信息信号执行所述环境噪声的估计，所述估计被提供给所述心理声学模型。
8. 如权利要求1至5中任一项所述的系统，其中所述信号处理器还包括压縮器，其基于所述心理声学处理器提供的动态范围参数对所述子带信息信号进行动态范围压縮。
9. 如权利要求1至5中任一项所述的系统，其中所述信号处理器还包括电路，其为所述兴趣信号的预定水平扩展所述动态范围，使得所述环境噪声不被听见。
10. 如权利要求1至5中任一项所述的系统，其中所述心理声学处理器处理输入信号以执行低水平扩展，使得接收所述输出信号的使用者感受到较少噪声。
11. 如权利要求1至5中任一项所述的系统，其中所述心理声学处理器基于响度不舒适级(LDL)计算所述动态范围，以使所述输出信号处于一响度舒适级。
12. 如权利要求ll所述的系统，还包括持久数据存储装置，用于为每个接收所述输出信号的使用者存储所述响度不舒适级(LDL)。
13. 如权利要求1至5中任一项所述的系统，其中所述信号处理器中的信号处理的灵敏度是可调的。
14. 如权利要求13所述的系统，还包括存储器，用于为每个接收所述输出信号的使用者存储参数，以控制所述信号处理的所述灵敏度。
15. 如权利要求1至5中任一项所述的系统，其中所述信号处理器还包括用来调节所述输出信号的量的电路。
16. 如权利要求3至5中任一项所述的系统，其中所述信号处理器包括期望数字信号活动性检测器(DSAD)，用于控制所述噪声估计电路，使得当所述兴趣信号不存在时所述频谱被采样。
17. 如权利要求1至5中任一项所述的系统，还包括用于提高所述输出信号的清晰度的前端处理器。
18. 如权利要求17所述的系统，其中所述前端处理器包括用于执行定向处理算法以提供噪声估计的电路。
19. 如权利要求17所述的系统，其中所述前端处理器包括用于减少所述环境噪声的电路。
20. 如权利要求1至5中任一项所述的系统，还包括主动噪声消除 (ANC)电路，其通过将所述信号处理的结果反馈给所述信号处理器主动地消除所述环境噪声。
21. 如权利要求1至5中任一项所述的系统，其中所述干扰信号包括被所述兴趣信号污染的所述环境噪声。
22. 如权利要求1所述的系统，其中所述分析滤波器组和所述合成滤波器组由过采样滤波器组实现。
23. 如权利要求2所述的系统，其中用于所述信息信号的所述分析滤波器组和用于所述干扰信号的所述分析滤波器组由过采样滤波器组实现。
24. 如权利要求1至5中任一项所述的系统，其中所述信号处理器执行听力辅助应用。
25. 如权利要求21所述的系统，其中所述信号处理器还包括用于估计所述环境噪声的频谱的噪声估计电路和期望数字信号活动性检测器(DSAD)，所述期望数字信号活动性检测器用于控制所述噪声估计电路，使得当所述兴趣信号不存在时所述频谱被采样。
26. 如权利要求1或2所述的系统，其中所述信号处理器还包括用于控制噪声估计的期望数字信号活动性检测器(DSAD)。
27. —种克服干扰信号的提高信号清晰度的方法，所述方法包括在第一输入端处，接收包括可能被环境噪声污染的兴趣信号的信息信号；在第二输入端处，接收包括所述环境噪声的干扰信号，所述第二输入端能基于连续方式接收所述干扰信号，而不管所述兴趣信号是否存在；在分析滤波器组处，将时域的所述信息信号变换成变换域的多个子带信息信号；在信号处理器处，处理所述子带信息信号和基于连续方式的所述干扰信号，包括利用心理声学模型、使所述子带信息信号能克服所述干扰信号而被听见的计算动态范围的步骤，和在合成滤波器组处，将所述可听子带信息信号组合，以产生具有信号清晰度被提高的所述兴趣信号的输出信号。
28. 如权利要求27所述的方法，还包括以下步骤在用于所述干扰信号的分析滤波器组处，将时域的所述干扰信号变换成变换域的多个子带干扰信号，从而所述处理步骤处理所述子带信息信号和所述子带干扰信号。
29. 如权利要求27或28所述的方法，其中所述处理步骤包括以下步骤估计所述环境噪声的频谱，和将所述频谱提供给所述心理声学模型。
30. 如权利要求29所述的方法，其中所述估计步骤执行自适应噪声估计。
31. 如权利要求29所述的方法，其中所述估计步骤利用频谱差分技术执行噪声估计。
32. 如权利要求27或28所述的方法，还包括基于所述信息信号和所述干扰信号提供所述环境噪声的估计。
33. 如权利要求28所述的方法，其中所述处理步骤包括以下步骤-通过从所述子带干扰信号中减去所述子带信息信号执行所述环境噪声的估计，和将所述估计提供给所述心理声学模型。
34. 如权利要求27或28所述的方法，其中所述处理步骤包括以下步骤基于所述心理声学处理器提供的动态范围参数对所述子带信息信号进行动态范围压縮。
35. 如权利要求27或28所述的方法，其中所述处理步骤包括以下' 为所述兴趣信号的预定水平扩展所述动态范围，使得所述环境噪声不被听见。
36. 如权利要求27或28所述的方法，其中所述处理步骤包括以下步骤执行低水平扩展，使得接收所述输出信号的使用者感受到较少噪声。
37. 如权利要求27或28所述的方法，其中所述处理步骤包括以下基于响度不舒适级(LDL)计算所述动态范围，以使所述输出信号处于一响度舒适级。
38. 如权利要求37所述的方法，还包括以下步骤为每个接收所述输出信号的使用者存储所述响度不舒适级(LDL)。
39. 如权利要求27或28所述的方法，还包括以下步骤-调节所述信号处理器中的信号处理的灵敏度。
40. 如权利要求29所述的方法，还包括以下步骤为每个接收所述输出信号的使用者存储参数，以控制所述信号处理的所述灵敏度。
41. 如权利要求27或28所述的方法，其中所述处理步骤包括以下步骤调节所述输出信号的量。
42. 如权利要求29至31中任一项所述的方法，其中所述处理步骤包括以下步骤控制所述噪声估计电路，使得当所述兴趣信号不存在时所述频谱被采样。
43. 如权利要求27或28所述的方法，还包括以下步骤在前端处理器处，提高所述输出信号的清晰度。
44. 如权利要求43所述的方法，其中所述提高清晰度的步骤包括以下步骤执行定向处理算法以提供噪声估计。
45. 如权利要求43所述的方法，其中所述提高清晰度的步骤包括以下步骤-减少所述环境噪声。
46. 如权利要求27或28所述的方法，还包括以下步骤通过将所述信号处理的结果反馈给所述信号处理器，主动地消除所述环境噪声。
47. 如权利要求27或28所述的方法，其中所述干扰信号包括被所述兴趣信号污染的所述环境噪声。
48. 如权利要求27所述的方法，其中所述变换和所述组合步骤由过釆样滤波器组实现。
49. 如权利要求28所述的方法，其中用于所述信息信号的所述变换步骤和用于所述干扰信号的所述变换步骤由过采样滤波器组实现。
50. 如权利要求27或28所述的方法，还包括以下步骤在所述信号处理器处，执行听力辅助应用。
51. 如权利要求27所述的方法，还包括估计所述环境噪声的频谱；和控制所述估计步骤，使得当所述兴趣信号不存在时所述频谱被采样。
52. 如权利要求27或28所述的方法，还包括将所述信号处理的结果反馈给所述信号处理器，以主动地消除所述环境噪声。
全文摘要
本发明公开了一种声音清晰度增强(SIE)系统。该SIE系统利用心理声学模型，并且优选地，利用一个过取样滤波器组，在其中低于环境噪声的兴趣信号被有选择地放大作为输入强度和频率的函数，以使该信号克服噪声而可以被听见，但是绝不会超过作为频率函数的一个预定最大输出强度。该SIE系统可以与主动噪声消除相结合。
文档编号G10L21/0364GK101105941SQ200710006509
公开日2008年1月16日申请日期2002年8月7日优先权日2001年8月7日
发明者D·库德, P·欧利杰尼克, R·L·布伦南, T·施奈德申请人:艾玛复合信号公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｔ.施奈德;Ｄ.库德;Ｒ.Ｌ.布伦南;Ｐ.欧利杰尼克
技术所有人：艾玛复合信号公司
我是此专利的发明人

上一篇：一种丢包补偿方法及装置的制作方法
上一篇：用于乐器的自动演奏系统和其中用于自学的计算机程序的制作方法