智能梯度噪声降低系统的制作方法

文档序号：2831791阅读：188来源：国知局

专利名称：智能梯度噪声降低系统的制作方法
技术领域：
本发明涉及噪声抑制，并且更具体地，涉及一种智能梯度噪声降低系统。
背景技术：
提供语音通信的移动设备通常包括用于抑制非期望噪声的噪声降低系统。该非期望噪声可以是用户对移动设备讲话时存在的环境噪声，诸如背景噪声。捕获来自用户的语音信号的麦克风可捕获该非期望背景噪声并且产生包含该语音信号和该非期望背景噪声的复合信号。如果该非期望噪声未被充分抑制，则该非期望背景噪声可使该语音信号质量劣化。
全向麦克风可捕获来自所有方向的语音。参考图9，示出了全向麦克风的示例性灵敏度图案900。其中捕获声音的麦克风的前部端口对应于顶部的90度标志。灵敏度图案卯l展现了全向麦克风可等同地捕获来自所有方向(例如，0 360度)的声音。因此，全向麦克风可捕获来自诸如语音的声音的主要方向以外的方向的诸如噪声的声音，该诸如语音的声音通常到达该全向麦克风的前部端口。因此，当用户在前部端口中讲话时，该全向麦克风拾取该语音信号并且还等同地拾取诸如背景噪声的任何其他外围声音，因此不提供任何噪声抑制能力。
相反地，梯度麦克风可捕获自主要方向到达的语音。参考图10，示出了梯度麦克风的示例性灵敏度图案950。其中捕获声音的梯度麦克风的前部端口也对应于顶部的90度标志。灵敏度图案950展现了相比于来自梯度麦克风的左侧和右侧(例如，180度和0度)的声音，梯度麦克风对于到达梯度麦克风的前部分951和后部分952 (例如，90和
6270度)的声音更加灵敏。灵敏度图案950示出了在左和右位置处零灵敏度的区域。到达左方和右方的声音相对于自前方和后方到达的声音得到更多的抑制。因此，梯度麦克风对在主要方向(例如，前方或后方)以外的方向到达的声音提供固有的噪声抑制。因此，当用户在前部端口中讲话同时在所有方向中存在环境噪声时，梯度麦克风捕获语
音信号但是抑制主要的前方向外围(例如，左方和右方)的噪声。

发明内容
梯度麦克风相比于全向麦克风对距离的变化更加灵敏。例如，当用户移动以更远离前部端口时，灵敏度作为用户和麦克风之间的距离的函数相比于全向麦克风下降得更多。当用户移动以更接近前部端口时，灵敏度作为用户的距离的函数而增加。因此，当用户接近麦克风时，使用梯度麦克风作为捕获语音信号的装置的噪声降低系统相对小的位置改变呈现出大的幅度改变。而且，例如，当用户在讲话时握持移动设备时，梯度麦克风对容纳该梯度麦克风的该移动设备的移动变化是灵敏的。在这一点上，需要提供一种实现梯度麦克风的噪声降低能力但是不会因梯度麦克风的接近效应由移动设备的移动引起声音水平变化的噪声降低系统。
本公开的一个实施例是一种智能噪声降低系统，其可包括麦克风单元，用于捕获话音信号；语音活动检测器(VAD)，其操作地耦合至该麦克风单元以确定该话音信号中的话音活动部分和噪声活动部分；自动增益控制(AGC)单元，其操作地耦合至该麦克风单元，用于调整该话音信号的话音增益以使话音信号水平的变化最小；和控制器，其操作地耦合至该VAD和该AGC以控制由该AGC应用到噪声活动部分的话音增益，以使话音活动和噪声活动之间的可听变换平滑。在第一示例性配置中，该控制器可防止该话音增益在噪声活动部分期间的更新。该控制器可在噪声活动部分之后继续调整该话音增益。在第二示例性配置中，该控制器可在噪声活动部分期间应用噪声门(noisegate)。在第三示例性配置中，该控制器可在梯度话音中的噪声部分期间应用最后话音帧增益和门限噪声帧之间的平滑增益变换。该平滑增益变换可以是线性的、对数的或二次的衰退。
在一个布置中，该麦克风单元可以是梯度麦克风，其针对该梯度麦克风的前部分和后部分之间的声压水平差进行操作以产生梯度话音信号。该梯度麦克风的灵敏度可作为到产生该话音信号的源的距离的函数而改变。在另一布置中，该麦克风单元可包括第一麦克风、第二麦克风和差分单元，该差分单元从该第二麦克风接收的第二信号中减去该第一麦克风接收的第一信号以产生梯度话音信号。该智能噪声降低系统可包括校正滤波器，其将高频衰减应用到该梯度话音信号以校正因梯度过程引起的高频增益。
本公开的第二实施例是一种用于智能噪声降低的方法，该方法可包括捕获话音信号；识别该话音信号中的话音活动部分和噪声活动部分；调整该话音信号的话音增益以使话音活动部分期间的话音信号水平的变化最小；以及控制噪声活动部分中的话音增益以使话音活动和噪声活动之间的可听变换平滑。控制话音增益的步骤可包括防止在噪声活动部分期间调整该话音增益，和在噪声活动部分之后继续调整该话音增益。控制话音增益的步骤可包括在噪声活动部分期间冻结该话音增益，在噪声活动部分期间应用噪声门，或者在梯度话音的噪声部分期间应用最后话音帧增益和门限噪声帧之间的平滑增益变换。该方法可包括捕获来自第一麦克风的第一信号，捕获来自第二麦克风的第二信号，使该第一信号和该第二信号相减以产生梯度话音信号，以及应用校正滤波器以补偿因该相减引起的频率相关幅度损失。
本公开的第三实施例是一种智能噪声降低系统，其可包括梯度麦克风，该梯度麦克风用于产生梯度话音信号；校正单元，其用于对因该梯度麦克风引起的该梯度话音信号的高频增益进行去加重；语音活动检测器(VAD)，其操作地耦合至该校正单元以确定该梯度话音信号中的话音活动部分和噪声活动部分；自动增益控制(AGC)单元，
8其操作地耦合至该梯度麦克风以调整该梯度话音信号的话音增益，以使话音信号水平的变化最小；和控制器，其操作地耦合至该VAD和该AGC以控制由该AGC应用到噪声活动部分的话音增益，以保持该梯度话音信号中的话音活动和噪声活动之间的话音噪声水平比。该控制器可在噪声活动部分期间冻结话音增益，在噪声活动部分期间应用噪声门，或者在梯度话音中的噪声部分期间应用最后话音帧增益和门限噪声帧之间的平滑增益变换。该控制器可防止在噪声活动部分期间调整该话音增益，并且在噪声活动部分之后继续调整该话音增益。

在所附权利要求中具体地阐述了被认为是新颖的该系统的特征。通过结合附图参考下面的描述可理解此处的实施例，在数个附图中相同的附图标记表示相同的元件，并且其中
图1示出了根据本公开的实施例的示例性智能噪声降低系统；
图2示出了根据本公开的实施例的示例性麦克风单元；
图3示出了根据本公开的实施例的用于智能噪声降低的示例性方
法；
图4示出了根据本公开的实施例的用于控制自动增益控制(AGC)的图3的方法的扩展；
图5示出了根据本公开的实施例的全向和梯度麦克风的归一化为全向响应的100Hz灵敏度相对距离的曲线；
图6示出了根据本公开的实施例的全向和梯度麦克风的归一化为全向响应的300Hz灵敏度相对距离的曲线；
图7示出了根据本发明的实施例的用于智能噪声降低的示例性曲
线；
图8是根据本发明的实施例的电子设备的框图9示出了全向麦克风的极性灵敏度或方向性曲线；以及
图IO示出了梯度麦克风的极性灵敏度或方向性曲线。
具体实施方式
尽管本说明书以限定被视为新颖的本发明的实施例的特征的权利要求为结论，但是认为，通过结合附图考虑下面的描述，将更好地理解该方法、系统和其他实施例，在附图中沿用相同的附图标记。
如需要的，此处公开了本方法和系统的详细实施例。然而，将理解，所公开的实施例仅是示例性的，其可具体化为多种形式。因此，此处公开的特定结构和功能细节不应被解释为限制，而是仅应被解释为权利要求的基础和用于教导本领域的技术人员在实际上任何适当详细的结构中以多种形式采用本发明的实施例的代表性基础。而且，此处使用的术语和习语不应作为限制，而是用于提供此处的实施例的可理解的描述。
如此处使用的术语"一"被限定为一个或不止一个。如此处使用的术语"多个"被限定为两个或多于两个。如此处使用的术语"另一" 被限定为至少第二个或更多。如此处使用的术语"包含"和/或"具有" 被限定为包括(即，开放性语言)。如此处使用的术语"耦合"被限定为连接，尽管其没有必要是直接连接，也没有必要是机械连接。术语"处理"或"处理器"可被限定为能够执行预先编程的或者编程的指令集的任何数目的适当的处理器、控制器、单元等。如此处使用的术语"程序"、"软件应用程序"等被限定为设计用于在计算机系统上执行的指令序列。程序、计算机程序或软件应用程序可包括子程序、函数、进程、对象方法、对象实现方案、可执行应用程序、源代码、对象代码、共享库/动态负载库和/或设计用于在计算机系统上执行的其他指令序列。
参考图l，示出了智能噪声降低系统100。智能噪声降低系统100
可包括麦克风单元110、操作地耦合至麦克风单元110的语音活动检测器120 (VAD)、操作地耦合至麦克风单元U0的自动增益控制130
(AGC)单元、和操作地耦合至VAD 120和AGC 130的控制器140。 VAD 120可接收来自AGC 130的话音信号输出的反馈。智能噪声降低系统100可集成在移动设备中，诸如蜂窝电话、膝上型电脑、计算机
或者任何其他移动通信设备。广而言之，VAD 120检测话音和噪声的存在，并且控制器140响应于接收到来自VAD 120的语音活动检测决策而在噪声活动区域中控制AGC 130。智能噪声降低系统100可在噪声活动时段期间抑制麦克风单元IIO捕获的声音信号中的非期望噪声。
在根据本发明的实施例的一个布置中，麦克风单元IIO可以是梯度麦克风。梯度麦克风针对声音信号的两个点之间的声压水平差操作，而非针对声音信号上的某点处的声压水平操作。因此，梯度麦克风对离开产生声音信号的源的距离变化更加灵敏。例如，当用户接近麦克风单元110时，梯度麦克风检测到在该梯度麦克风的前部分处捕获的声波形和在该梯度麦克风的后部分处捕获的相同的声波形的大的声压水平(SPL)差。当用户远离该麦克风时，梯度麦克风检测到在该梯度麦克风的前部分处捕获的声波形和在该梯度麦克风的后部分处捕获的相同的声波形的小的声压水平(SPL)差。
在另一布置中，根据本发明的实施例，梯度麦克风可被实现为两个麦克风，其一起形成梯度过程。参考图2，示出了麦克风单元UO的示例性配置。麦克风单元UO可包括第一麦克风111、第二麦克风112 和差分单元114，差分单元114从第二麦克风接收的第二信号减去第一麦克风接收的第一信号以产生梯度话音信号。通过使麦克风信号相减并且随后使得到的单个信号行进通过校正滤波器，来创建该梯度麦克风。该校正滤波器将高频衰减应用(例如，去加重)到梯度话音信号以补偿作为梯度过程的结果的高频增益。
图2的麦克风单元110的操作在原理上与梯度麦克风相似，尽管其使用两个分立的麦克风实现前部和后部效应。梯度过程针对第一麦克风111和第二麦克风112之间的声压水平差操作以产生梯度话音信号。图2的麦克风单元110实现的梯度过程包括差分和校正，这因此使声音信号随着离开源的距离的增加而衰减得更多。由于麦克风相对于讲话人的移动，因远场效应引起的衰减的增加生成信号水平的变化。当在接近麦克风单元110的位置(例如，近场)捕获声音信号时，该
梯度过程还引入了放大。控制器140通过引导AGC 130来调节应用到
在话音活动时段期间在麦克风处捕获的信号部分的话音增益，补偿这些近场和远场效应。
参考图3和4，示出了用于智能噪声降低的方法300。方法300可通过数目多于或少于所示情况的组件实践。在描述方法300时还将参考图1、 2、 5、 6和7。简而言之，方法300可通过图1的智能噪声降低系统100实践。作为示例，方法300可开始于如下状态，其中在移动设备中使用智能噪声降低系统IOO来抑制非期望噪声。
在步骤310中，麦克风单元IIO捕获话音信号。作为示例，握持移动设备的用户可将麦克风单元UO的方向取为朝向用户。用户可以变化的距离握持该移动设备，例如，在相对用户的近场(即，接近) 或相对用户的远场(即，远离)中。诸如其他人讲话的背景噪卢或环境噪声可出现在麦克风单元IIO捕获的话音信号中。
图5示出了使用全向麦克风或梯度麦克风的100Hz话音信号的灵敏度相对距离的曲线500。曲线500说明了例如，以不同的手臂长度握持移动设备时全向麦克风和梯度麦克风之间的灵敏度的差异。曲线500 被归一化到5cm距离，这相当于典型的移动设备麦克风位置。即，分贝参考是离开麦克风约5cm的灵敏度。该归一化允许梯度麦克风相比于全向麦克风的幅度增益的差异直观化。如说明的，全向响应差分501 是0dB，这是因为在全向响应和其自身之间不存在差异。相应地，梯度响应502与单位归一化全向响应501相关。在这一点上，可看到，梯度麦克风引入了低于交叉点503的近场中的100Hz信号的放大，并且引入了超过交叉点503的远场中的100Hz信号的衰减。如示出的，交叉点503出现在约5cm处。该衰减在离开麦克风lm和更远处接近 -20dB，并且该放大在离开麦克风的距离低于5cm处接近+10dB。图6示出了关于使用全向麦克风或梯度麦克风的300Hz dB处话音信号的灵敏度相对距离的曲线600。曲线600也说明了例如，以不同的手臂长度握持移动设备时的全向麦克风和梯度麦克风之间的灵敏度的差异。图5和图6之间的主要差异是麦克风处捕获的信号的频率。在图5中，梯度响应502对应于100Hz的捕获麦克风信号频率，并且在图6中，梯度响应对应于300Hz的捕获麦克风信号频率。如图6中所示，该梯度过程引入了 lm和更远处的接近-10dB的衰减(与100Hz处的-20dB的衰减相对)，尽管放大在低于5cm交叉点603处仍接近 + 10dB。最大衰减量随着频率的增加而减少，例如，达20KHz的频率。
简而言之，响应曲线500和600说明了近场中的梯度过程的明显放大和远场中的梯度过程的明显衰减。显然，因梯度过程引起的放大使近场中的移动设备的灵敏度增加并且可引入具有小的距离变化的极大的幅度改变。例如，如果用户在通话中极大地移动移动设备，则话音可被放大不成比例的量。
返回图3，在步骤320中，VAD 120识别话音信号中的话音活动部分和噪声(非话音)活动部分。考虑在麦克风单元110处捕获的信号包括话音和噪声部分。例如，对电话讲话的用户的语音构成话音，并且由麦克风单元100捕获的仟何背景噪声构成噪声。图7呈.现了用丁-使智能噪声降低方法3 00形象化的-组示例性—f 曲线。/ 曲线A小出了关于话音活动701和噪声活动702部分的VAD 120判决。更具体地，子曲线A示出了由麦克风单元110捕获的信号帧。帧尺寸的长度可为5ms 20ms，但是不限于这些值。该信号可在多种量化方案(例如， 16比特、32比特)下以多种固定的或混合的采样速率被采样(例如， 8KHz、 16KHz) 。 VAD 120针对处理的每个帧进行话音分类701或噪声分类702判决。子曲线B示出了与子曲线A的VAD判决相对应的由麦克风单元110捕获的话音信号。显然，话音部分710与话音分类 701判决一致，并且噪声部分712与噪声分类判决702 —致。
13返回图3，在步骤330中，AGC 130调整话音信号的话音增益以使话音活动部分期间的话音信号水平的变化最小。AGC 130内部估计应用到话音信号以用于补偿信号幅度变化的增益。然而，AGC被调谐用于与全向麦克风一同使用，不能充分地设定增益以解决因梯度过程引起的变化。因此，在步骤340中，控制器140基于自VAD 120接收的话音和噪声指定，控制由AGC 130应用的话音增益的调整。回来参考图7，该控制器使话音活动和噪声活动之间的可听变换平滑。
显然，在话音活动710时段期间控制器140不干预应用到话音信号的AGC话音增益调节。在话音活动期间，控制器140不扰乱AGC 的正常过程，并且仅监视VAD120的分类判决。当VAD120将话音信号部分分类为噪声活动712区域时，控制器140与AGC 130联合来调节AGC 130的增益调节。在这一点上，控制器140随后在噪声活动712 时段期间与AGC 130联合以使AGC 130调节应用到话音信号的增益。特别地，控制器140防止AGC 130在噪声帧期间进行调整，并且保持最后话音帧的终点处的AGC话音增益在新的话音帧出现时被用作 AGC的起点。
参考图4，示出了控制器140实现的用于控制AGC 130的多种方法400。在描述多种方法400时将参考图7。
如方法441中所示，该控制器在噪声活动部分期间冻结话音增益。更具体地，该控制器防止噪声活动部分期间AGC 130内的话音增益的更新，并且在噪声活动部分之后允许AGC继续调整话音增益。参考图 7的子曲线C，示出了AGC 130的示例性话音增益曲线。应当注意， AGC 130基于话音信号的多个方面确定话音增益，诸如峰峰电压、均方根(RMS)值、频谱能量分布和/或基于时间的测量。特别地，AGC 130尝试基于一个或多个语音度量来使捕获的话音信号中的频谱能量分布平衡。返回步骤441，该控制器在VAD开始检测到噪声活动时冻活动区域中使该话音增益保持恒定720。控制
器130响应于VAD检测到话音活动的开始，移除对信号增益的冻结。这允许AGC 130继续调整，如同话音信号完全由话音组成。
显然，控制器140冻结话音增益，用于防止AGC 130放大噪声活动水平，并且还允许该AGC继续调整，如同AGC在处理连续话音。在前者的情况中，语音通信链路的接收端处的用户将听到话音活动和噪声活动之间的平滑变换。而且，噪声水平相对话音水平的比将是恒定的并且表示由麦克风单元110捕获的噪声对话音水平。在后者的情况中，AGC 130不需要重新调节内部度量以用于补偿因噪声活动引起的信号增益调节。即，控制器140允许该AGC保留在话音处理模式中。
返回图4，如方法442中所示，控制器140可替选地可在噪声活动部分期间应用噪声门。更具体地，控制器140建立在噪声活动时段期间的噪声本底。实际上，当VAD 120检测到噪声活动时，控制器140 引导AGC 130将信号抑制到预定的噪声本底水平。例如，该AGC响应于控制器140的引导在噪声活动时段期间生成舒适噪声以应用噪声门。此外，在门限噪声帧期间可将低水平人工"舒适噪声"添加到信号以减少门限过程的不利的感知影响。
图7的子曲线D形象化地说明了向噪声活动部分应用噪声门的结果。如示出的，控制器140响应于接收到VAD 120的噪声分类判决在噪声活动时段期间应用噪声门730。控制器140可存储在话音活动710 期间AGC 130应用的最后话音增益731，在噪声活动时段期间应用噪声门，并且在与最后话音活动710中的话音增益相对应的水平上继续调整信号增益732。在连续的示例中，语音通信链路的接收端处的用户将听到话音的话语之间的低水平静默或舒适噪声的时段。在噪声门期间可插入舒适噪声以防止用户认为呼叫已被终止。如果在非话音(例如，静默)活动时段期间未听到可听声音，则用户可能认为呼叫已被终止或掉线。控制器140可在高背景噪声水平中应用噪声门或舒适噪
15声。在这一点上，用户将听到合成背景噪声而非因高背景水平噪声的抑制导致的混乱噪声。
返回图4，如方法443中所示，控制器140可替选地可在梯度话音中的噪声部分期间应用最后话音帧增益和门限噪声帧之间的平滑增益变换。控制器140可应用线性的、对数的或二次的衰退，但是不限于此。例如，如子曲线E中所示，控制器140可使用二次衰退函数在噪声活动时段期间使话音增益从当前话音增益开始逐渐变小(例如，逐渐降低)至噪声本底水平(例如，噪声门)。显然，控制器140应用平滑变换以减少因话音710到抑制或门限噪声712水平的变换引起的水平突变。从语音通信链路的接收端处的用户的角度来看，在话音过程中听到的背景噪声水平将在噪声活动时段期间没有任何断裂地平滑变换到噪声本底水平。控制器140通过在噪声活动时段期间逐渐调节信号增益水平来抑制抽运效应(pumping effect)(即，话音活动和噪声活动时段之间的感知噪声水平的改变)。在这一点上，控制器140 可在不引入因应用噪声门而可能出现的感知噪声抽运的情况下，抑制非话音帧中的噪声(例如，噪声活动)。
在回顾前述实施例之后，对于本领域的普通技术人员显而易见的是，在不偏离如所附权利要求描述的范围和精神的前提下可修改、縮减或增强所述实施例。在不偏离所附权利要求的范围的前提下存在可应用于本公开的用于实现关于麦克风的梯度过程或者控制AGC的许多配置。例如，控制器130可集成在VAD 120或AGC 130中，用于控制噪声活动时段期间的信号增益。而且，控制器130可并入风噪降低装置，其连结到VAD 120以经由滑频滤波器或子带频谱抑制改进风噪降低。控制器140可使用VAD来改进智能噪声降低系统的鲁棒性。而且，控制器HO可防止风噪降低妨碍语音识别性能。这些仅是在不偏离所
附权利要求的范围的前提下可应用于本公开的修改的数个示例。因此，将读者引导至权利要求部分以更全面地理解本公开的广度和范围。在如图8的图示表述中说明的本发明的另一实施例中，具有噪声抑制系统或部件810的诸如机器(例如，蜂窝电话、膝上型计算机、
PDA等)的电子产品可包括耦合至部件810的处理器802。通常，在多种实施例中，其可被认为是具有计算机系统800的形式的机器，其中指令集在被执行时可使该机器执行此处讨论的任何一个或多个方法。在某些实施例中，该机器作为独立设备操作。在某些实施例中，该机器可连接到(例如，使用有线或无线网络)其他机器。在联网部署中，该机器可操作作为服务器-客户端用户网络环境中的服务器或客户端用户机器，或者作为对等(或分布式)网络环境中的对等机器操作。例如，该计算机系统可包括接收设备801和发送设备850，反之亦然。
该机器可包括服务器计算机、客户端用户计算机、个人计算机 (PC)、平板PC、个人数字助理、蜂窝电话、膝上型计算机、桌面型
计算机、控制系统、网络路由器、交换机或桥、或者能够(顺序地或以其它方式)执行指令集的任何机器，更不必说移动服务器，所述指令集指明由该机器采取的行动。将理解，本公开的设备广泛地包括提供语音、视频或数据通信或呈现的任何电子设备。而且，尽管说明了单个机器，但是术语"机器"还可被认为包括单独地或联合地执行指令集以执行此处讨论的任何一个或多个方法的任何机器集合。
计算机系统800可包括控制器或处理器802 (例如，中央处理单元(CPU)、图形处理单元(GPU或此两者)、主存储器804和静态存储器806，其经由总线808相互通信。计算机系统800可进一步包括诸如显示器的呈现设备。计算机系统800可包括输入设备812 (例如，键盘、麦克风等)、光标控制设备814 (例如，鼠标)、盘驱动单元 816、信号生成设备818 (例如，还可用作呈现设备的扬声器或远程控制)和网络接口设备820。当然，在公开的实施例中，这些项中的许多项是可选的。盘驱动单元816可包括机器可读介质822，在机器可读介质822 上存储一个或多个指令集(例如，软件824)，该指令集具体化此处描述的一个或多个方法或功能，包括上文说明的那些方法。指令824还可完全地或至少部分地驻留在主存储器804、静态存储器806中和/或在计算机系统800的执行过程中驻留在处理器或控制器802中。主存储器804和处理器或控制器802也可构成机器可读介质。
专用硬件实现方案，包括，但不限于，专用集成电路、可编程逻辑阵列、FPGA和其他硬件设备，同样地可被构造用于实现此处描述的方法。可包括多种实施例的装置和系统的应用广泛地包括多种电子和计算机系统。某些实施例在两个或更多的特定互连硬件模块或设备中实现功能，其中在模块之间和通过模块传递相关控制和数据信号，或者实现为专用集成电路的部分。因此，示例系统可应用于软件、固件和硬件实现方案。
根据本发明的多种实施例，此处描述的方法用f作为在计算机处理器上运行的软件程序操作。而且，软件实现方案可包括，但不限于，分布式处理或组件/对象分布式处理，并行处理或虚拟机器处理也可被构造用于实现此处描述的方法。而且应当注意，实现方案还可包括神经网络实现方案和通信设备之间的自组织或网状网络实现方案。
本公开考虑包含指令824的机器可读介质，或者通过传播信号接收和执行指令824，由此连接到网络环境826的设备可发送或接收语音、视频或数据，并且使用指令824在网络826上通信的机器可读介质。可进一步经由网络接口设备820在网络826上发射或接收指令824。
尽管在示例性实施例中机器可读介质822被示为单个介质，但是术语"机器可读介质"应被认为包括存储一个或多个指令集的单个介质或多个介质(例如，集成或分布式数据库，和/或关联的缓存和服务器)。术语"机器可读介质"还将被认为包括能够存储、编码或承载
18用于由机器执行的指令集并且使该机器执行本公开的任何一个或多个方法的任何介质。
尽管结合特定实施例描述了本发明，但是显而易见，考虑到前面的描述，许多替选、修改、变更和变化对于本领域的普通技术人员是明显的。因此，本发明应涵盖落入所附权利要求的范围内的所有该替选、修改、变更和变化。尽管已说明和描述了本发明的优选实施例，但是显见，本发明的实施例不限于此。在不偏离如所附权利要求限定的本发明的实施例的精神和范围的前提下，本领域的技术人员将想到许多修改、改变、变化、替换和等效方案。
权利要求
1.一种智能噪声降低系统，包括麦克风单元，用于捕获话音信号；语音活动检测器(VAD)，操作地耦合至所述麦克风单元以确定所述话音信号中的话音活动部分和噪声活动部分；自动增益控制(AGC)单元，操作地耦合至所述麦克风单元，用于调整所述话音信号的话音增益以使话音信号水平的变化最小；以及控制器，操作地耦合至所述VAD和所述AGC以控制由所述AGC应用到所述话音信号的所述话音增益。
2. 如权利要求1所述的智能噪声降低，其中所述控制器防止所述话音增益在噪声活动部分期间的更新。
3. 如权利要求1所述的智能噪声降低，其中所述控制器在所述噪声活动部分之后继续调整所述话音增益。
4. 如权利要求1所述的智能噪声降低，其中所述控制器在噪声活动部分期间应用噪声门。
5. 如权利要求1所述的智能噪声降低，其中所述控制器在梯度话音中的噪声部分期间应用最后话音帧增益和门限噪声帧增益之间的平滑增益变换。
6. 如权利要求1所述的智能噪声降低，其中所述平滑增益变换是线性的、对数的或二次的衰退。
7. 如权利要求1所述的智能噪声降低，其中所述麦克风单元是梯度麦克风，所述梯度麦克风针对所述梯度麦克风的前部分和后部分之间的声压水平差进行操作以产生梯度话音信号，其中所述梯度麦克风的灵敏度作为到产生所述话音信号的源的距离的函数而改变。
8. 如权利要求1所述的智能噪声降低，其中所述麦克风单元包括第一麦克风、第二麦克风和差分单元，所述差分单元从所述第二麦克风接收的第二信号中减去所述第一麦克风接收的第一信号以产生梯度话音信号。
9. 如权利要求7所述的智能噪声降低，进一步包括校正滤波器，所述校正滤波器将高频衰减应用到所述梯度话音信号以补偿梯度效应的高频增益。
10. 如权利要求9所述的智能噪声降低，其中所述麦克风单元包括第一麦克风、第二麦克风和用于产生梯度话音信号的差分单元。
11. 一种用于智能噪声降低的方法，所述方法包括.-捕获话音信号；识别所述话音信号中的话音活动部分和噪声活动部分；调整所述话音信号的话音增益以使话音活动部分期间的话音信号水平的变化最小；以及控制噪声活动部分中的所述话音增益，以使话音活动和噪声活动之间的可听变换平滑。
12. 如权利要求11所述的方法，其中控制所述话音增益的步骤包括防止在噪声活动部分期间调整所述话音增益。
13. 如权利要求ll所述的方法，其中控制所述话音增益的步骤包括在噪声活动部分之后继续调整所述话音增益。
14. 如权利要求11所述的方法，其中控制所述话音增益的步骤包括在噪声活动部分期间冻结所述话音增益。
15. 如权利要求11所述的方法，其中控制所述话音增益的步骤包括在噪声活动部分期间应用噪声门。
16. 如权利要求ll所述的方法，其中控制所述话音增益的步骤包括在梯度话音的噪声部分期间应用最后话音帧增益和门限噪声帧增益之间的平滑增益变换，其中所述平滑增益变换是线性的、对数的或二次的衰退。
17. 如权利要求11所述的方法，包括捕获来自第一麦克风的第一信号；捕获来自第二麦克风的第二信号；使所述第一信号和所述第二信号相减以产生梯度话音信号；以及应用校正滤波器以补偿因所述相减引起的频率相关幅度损失。
18. —种智能噪声降低系统，包括梯度麦克风，用于产生梯度话音信号；校正单元，用于对因所述梯度麦克风引起的所述梯度话音信号的高频增益进行去加重；语音活动检测器(VAD)，操作地耦合至所述校正单元以确定所述梯度话音信号中的话音活动部分和噪声活动部分；自动增益控制(AGC)单元，操作地耦合至所述梯度麦克风以调整所述梯度话音信号的话音增益，以使话音信号水平的变化最小；以及控制器，操作地耦合至所述VAD和所述AGC以控制由所述AGC应用到所述噪声活动部分的所述话音增益，以保持所述梯度话音信号中的话音活动和噪声活动之间的话音噪声水平比。
19.如权利要求18所述的智能噪声降低系统，其中所述控制器至少执行下述之一在噪声活动部分期间冻结所述话音增益；在噪声活动部分期间应用噪声门；以及在梯度话音的噪声部分期间应用最后话音帧增益和门限噪声帧之间的平滑增益变换。
20.如权利要求18所述的智能噪声降低系统，其中所述控制器防止在噪声活动部分期间调整所述话音增益，并且在噪声活动部分之后继续调整所述话音增益。
全文摘要
提供了一种智能噪声降低系统(100)。该系统可包括用于产生梯度话音信号的梯度麦克风(110)、用于对由该梯度麦克风带来的高频增益进行去加重的校正单元(116)、用于确定该梯度话音信号中的话音活动部分(701)和噪声活动部分(702)的语音活动检测器120(VAD)、用于调整该梯度话音信号的话音增益(740)以使话音信号水平的变化最小的自动增益控制130(AGC)单元、以及用于控制由该AGC应用到噪声活动部分的话音增益以保持该梯度话音信号中的话音活动和噪声活动之间的话音噪声水平比的控制器(140)。
文档编号G10L21/02GK101689373SQ200880023133
公开日2010年3月31日申请日期2008年6月27日优先权日2007年7月2日
发明者乔尔·A·克拉克, 罗伯特·A·茹雷克申请人:摩托罗拉公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗伯特.Ａ.茹雷克;乔尔.Ａ.克拉克
技术所有人：摩托罗拉公司
我是此专利的发明人