时间零收敛单麦克风降噪的制作方法

文档序号：10654545阅读：418来源：国知局

时间零收敛单麦克风降噪的制作方法
【专利摘要】本发明的实施例包括用于减小噪声的设备。设备可以包括存储设备，被配置为存储噪声数据；处理器，被配置为：使用在发起通信会话前积累的噪声数据来对噪声分段进行分类；使用根据噪声分类接收到的信息来估计所述噪声分段；以及，基于由在发起所述通信会话之前积累的声音数据定义的上下文，选择导致用户的当前上下文的噪声简档。
【专利说明】
时间零收敛单麦克风降噪
技术领域
[0001]本文公开的各种实施例大体上涉及软件，并且更具体地涉及降噪方法和设备。
【背景技术】
[0002]语音通信和回放经常受到沿线的噪声以及两个用户中任意一个的背景中的噪声的干扰。

【发明内容】

[0003]各种实施例简单总结如下。在以下概述中有一些简化和省略，其旨在突出和介绍各实施例的一些方面，而非限制本发明的范围。在下面的部分中将给出足以使本领域普通技术人员利用和使用发明构思的优选实施例的详细描述。
[0004]各种实施例涉及由处理器执行的降噪方法，该方法包括:使用在发起通信会话前积累的声音数据来对噪声分段进行分类;使用根据噪声分类接收到的信息来估计噪声分段；以及，基于由在发起所述通信会话之前积累的声音数据定义的上下文，选择导致用户的当前上下文的噪声简档。
[0005]描述了各种实施例，还包括:应用噪声估计来消除通信会话中的噪声。
[0006]描述了各种实施例，其中，估计还包括:使用与由用户所处的上下文相关联的算法，所述用户所处的上下文由根据所述噪声分类接收到的信息提供。
[0007]描述了各种实施例，还包括:无论用户是否处于通信会话中，在始终开启模式下收集针对声音数据的音频。
[0008]描述了各种实施例，其中，选择还包括:基于在发起通信会话之前积累的声音数据，丢弃噪声估计，该声音数据表示用户的上下文已经发生变化。
[0009]描述了各种实施例，其中，估计还包括:当根据噪声分类接收到的信息指示噪声位于固定的上下文中时，使用最小统计进行估计。
[0010]描述了各种实施例，其中，分类还包括:将噪声的分段分类，作为用户所处的环境。
[0011]描述了各种实施例，包括用于降噪的设备，该设备包括存储设备，被配置为存储声音数据;处理器，被配置为:使用在发起语音呼叫前积累的声音数据来对噪声分段进行分类;使用根据噪声分类接收到的信息来估计噪声分段；以及选择噪声简档，与由在发起语音呼叫之前积累的声音数据所定义的上下文相比，噪声简档导致用户的当前上下文。
[0012]描述了各种实施例，其中，处理器还被配置为:应用噪声估计来消除通信会话中的噪声。
[0013]描述了各种实施例，其中，处理器还被配置为:使用与由用户所处的上下文相关联的算法来进行估计，所述用户所处的上下文由根据噪声分类接收到的信息提供。
[0014]描述了各种实施例，还包括:无论用户是否处于通信会话中，在始终开启模式下收集针对声音数据的音频。
[0015]描述了各种实施例，其中，处理器还被配置为:当根据噪声分类接收到的信息指示噪声位于固定的上下文中时，使用最小统计进行估计。
[0016]描述了各种实施例，其中，处理器还被配置为:基于在发起通信会话之前积累的声音数据，丢弃噪声估计，所述声音数据表示用户的上下文已经发生变化。
[0017]描述了各种实施例，其中，处理器还被配置为:将噪声的分段分类，作为用户所处的环境。
[0018]描述了各种实施例，包括使用指令编码的非暂时性机器可读介质，所述指令能够由处理器执行，用于执行降噪方法，该非暂时性机器可读介质包括用于以下操作的指令:使用在发起通信会话之前积累的声音数据来对噪声分段进行分类;使用根据噪声分类接收到的信息来估计噪声分段；以及，基于由在发起通信会话之前积累的声音数据定义的上下文，选择导致用户的当前上下文的噪声简档。
[0019]描述了各种实施例，还包括:应用噪声估计来消除通信会话中的噪声。
[0020]描述了各种实施例，其中，估计还包括:使用与由用户所处的上下文相关联的算法，所述用户所处的上下文由根据所述噪声分类接收到的信息提供。
[0021]描述了各种实施例，还包括:无论用户是否处于通信会话中，在始终开启模式下收集针对声音数据的音频。
[0022]描述了各种实施例，其中，估计还包括:当根据所述噪声分类接收到的信息指示噪声位于固定的上下文中时，使用最小统计进行估计。
[0023]描述了各种实施例，其中，选择还包括:基于在发起通信会话之前积累的声音数据，丢弃噪声估计，所述声音数据表示用户的上下文已经发生变化。
[0024]描述了各种实施例，其中，分类还包括:将噪声的分段分类，作为用户所处的环境。
【附图说明】
[0025]为了更好地理解各实施例，将参照附图，附图中:
[0026]图1示出了用户环境；
[0027]图2示出了噪声抑制系统的框图；
[0028]图3示出了时间戳机制；
[0029]图4示出了用于估计噪声的方法；以及
[0030]图5示出了设备的硬件图。
[0031]为帮助理解，使用相同的附图标记来表示具有本质上相同或相似结构或本质上相同或相似功能的单元。
【具体实施方式】
[0032]说明书和附图仅示出本发明的原理。因此可以理解的是，本领域的技术人员将能够设计出虽然没有明确地描述或示出但体现了本发明的原理并包括在其范围之内的各种布置。此外，全部示例主要旨在明确地用于示范目的，以帮助读者来理解发明人为推进技术所贡献的本发明的原理和构思，并且应被理解为不对具体陈述的示例和条件进行限制。此夕卜，除非另有说明(例如“或其它的”或“或备选地”)，本文中使用的术语“或者”指代非排他性的或(即，和/或)。此外，本文说明的各实施例不必是相互排他的，一些实施例可与一个或多个其他实施例组合，以形成新的实施例。
[0033]在无线通信期间经常出现的一个问题是单麦克风降低算法的收敛时间。当连接上时，在电话或移动通信期间频繁发起噪声抑制算法。通常，例如在电话呼叫期间以及在建立呼叫之前，可能在没有对用户环境的任何预先了解的情况下建立若干个模块。例如，这些模块可以包括听觉回声消除器、降噪算法、以及噪声抑制模块。在降噪模块可能生效之前，可在降噪模块中使用的噪声估计器可以试图在几秒钟之内收敛到真实的背景噪声电平，以便能够不被听到。用户将经常听到慢慢降低的背景噪声电平。因此，本领域中存在针对更好的降噪算法以及积累发生在使用算法之前的噪声数据的需求。
[0034]在某些实施例中，系统可以在噪声分类模块中创建并执行噪声分类。此外，在噪声分类模块中的处理之后，噪声估计模块可以比较可能适于相关的被分类确定的噪声类型的噪声校正和消除算法。最后，噪声估计选择模块在然后可以使用不同的选择方案来确定使用哪个噪声估计机制并做出最终判决。在该组件中可以使用数据表格。接下来，可以向噪声抑制模块提供估计类型和估计选择，该噪声抑制模块可以与听觉回声消除模块一起执行噪声抑制。
[0035]图1示出了用户环境100。用户环境可以包括通过网络110连接到用户设备115的用户设备105。
[0036]网络110可以是用于提供各种服务的订户网络。在各实施例中，网络110可以是公共陆地移动网络(PLMN)。网络100可以是用于提供对各种服务的访问的电信网络或其它网络。例如，网络100可以是个域网(PAN)、局域网(LAN)、城域网(MAN)或者广域网(WAN)。类似地，网络100可以使用任何类型的通信网络协议，例如4G、4G长期演进(LTE)、码分多址接入(CDMA)、全球移动通信系统(GSM)、基于网际协议的语音(VoIP)或者传输控制协议/网际协议(TCP/IP)。
[0037]用户设备105或115可以是与用于向最终用户提供数据服务的网络110通信的设备。例如，这样的数据服务可以包括语音通信、文本消息传输、多媒体流传输以及因特网访问。更具体地，在各实施例中，用户设备105或115可以是个人计算机或膝上型计算机、无线电子邮件设备、蜂窝电话、平板计算机、电视机顶盒、或者能够与其它设备通信的任何其它设备。在一些实施例中，作为通信会话，用户设备105可以与用户设备115通信。例如，通信会话可以包括语音呼叫、视频呼叫、视频会议、VoIP呼叫、以及数据通信。
[0038]用户设备105和115可以包含监听、记录和回放设备。例如，用户设备105、115可以包含麦克风、集成型麦克风或多个麦克风。类似地，用户设备105、115可以具有一个或多个扬声器以及不同类型的扬声器，例如集成或嵌入的扬声器。
[0039]图2示出了噪声抑制系统200的实施例。噪声抑制系统200的一个实施例可以包括感测解决方案，该感测解决方案230包括噪声分类模块205、噪声估计模块210、噪声估计选择模块215、听觉回声消除模块220、以及噪声抑制模块225。噪声抑制系统200的一个实施例的实现可以涉及解决降噪算法的收敛时间问题。在某些实施例中，可以使用移动设备，例如电话、平板手机或平板计算机。
[0040]噪声分类模块205可以使用任何声音或噪声识别和分类算法，来对用户设备105中感测到的噪声进行分类。算法的一些示例包括:高斯混合模型、神经网络(NN)、深层神经网络(DNN)、具有隐马尔科夫模型(HMM)的GMM、维特比算法、支持向量机(SVM)、以及有监督或无监督的方法。噪声分类模块205可以在始终开启模式下运行。噪声分类模块可以在设备的微控制器单元(MCU)上执行。
[0041]在一个实施例中，可描述用户环境的背景噪声分类可以使用机器学习(ML)算法。当进行有监督的学习时，使用ML算法，可以使用和/或识别数据中的特征，以创建可以被用于对麦克风采集的声音进行分类的预测模型。因此，可以计算与麦克风的信号有关的相关特征，并且构建具有不同背景噪声源的模型。模型的数据可以传递到分类算法。在另一个实施例中，可以使用没有模型的无监督学习。
[0042]例如，可以从麦克风的信号中提取的特征包括:梅儿频率倒谱系数(MFCC)及其衍生物Delta-MFCC和Delta-Delta-MFCC JFCC提取特征可以用于对嘈杂信号以及语音信号进行特征描述。
[0043]为了考虑时间信息，还可以使用递归定量分析(RQA)来计算附加特征，RQA例如Gerard Roma、Waldo Nogueira和Perfecto Herrera的Recurrence quantificat1nanalysis features for auditory scene classificat1n，IEEE AASP Challenge onDetect1n and Classificat1n of Acoustic Scenes and Events，2013，其内容以引用方式并入本文。可以捕捉背景噪声来源的时间和频率签名这二者。本领域技术人员将会简单地认识到可以使用若干个其它特征中的任意特征。
[0044]可以使用若干分类算法中的任意算法。在一个示例中，支持向量机(SVM)可以执行分类，该分类基于使用从麦克风的信号中提取的特征建立的模型。可以向在‘始终开启’模式下运行的SVM分类器提供将要识别和/或获取的背景噪声模型，该背景噪声模型可以基于训练数据集。因此，可以持续地对麦克风信号进行分类。噪声分类模块可以通过指示例如汽车、餐馆、地铁、家庭、街道、办公室来每几秒钟输出用户上下文。
[0045]在噪声估计模块210中，硬件或软件的数字信号处理器(DSP)可以用于估计从噪声分类模块205接收的噪声和噪声数据。噪声分类模块205可以提供音频上下文识别。可以通过使用与噪声上下文和/或噪声数据相对应的最合适的噪声估计器来驱动噪声估计模块210中的噪声估计。上下文可以是固定或非固定的，例如以信号方式通知不同噪声估计器。在一个实施例中，可以使用贝叶斯方法。在另一实施例中，类似地可以使用非贝叶斯方法。
[0046]在一些实施例中，可以使用被称作固定噪声的适当的估计。例如，基于最小统计的噪声估计可以用于固定噪声源，例如汽车噪声。最小统计噪声估计方法在以下文献中描述:Rainer Martin的Noise power spectral density estimat1n based on optimalsmoothing and minimum statisties (IEEE Transact1ns on Speech and Aud1Processing,2001)，其内容以引用方式并入本文。
[0047]在一些实施例中，可包括非固定噪声的改变中的环境可以使用不同的估计技术。可用于有害噪声环境的一个技术包括以下文献中描述的技术:Israel Cohen的Noisespectrum estimat1n in adverse environments:improved minima controlledrecursive averaging(IEEE Transact1ns on Speech and Aud1 Processing,vol.11,2003)，其内容以引用方式并入本文。在另一个实施例中，可以针对非固定噪声使用以下文献中教导的噪声估计技术:Timo Gerkmann和Richard C.Hendriks的Noise powerestimat1n based on the probability of speech presence(IEEE Workshop onApplicat1n of Signal Processing to Aud1 and Acoustics，2011)，其内容以引用方式并入本文。非固定噪声估计器可以用于非固定噪声来源，例如最小均方误差(MMSE)、短时谱幅度(STSA)、改进的最小值控制递归平均(IMCRA)以及数据驱动的递归噪声功率估计。类似的，任何类型的噪声估计器都能够跟踪脉冲噪声。可通过任何类型的噪声数据处理(例如上述的噪声数据处理)来进行噪声估计模块210对噪声分段的估计。可由噪声分类模块205提供的噪声分段可以指示正在进入的噪声和/或声音的某个时间段或持续时间。因此，噪声或声音的估计可以包括多个类型以及各种类型的数据和声音分段处理。
[0048]可以针对每个上下文和/或用户环境来适当地在噪声估计模块210中切换或选择噪声估计。在前进至噪声估计选择模块215之前，噪声估计模块210可以执行平滑程序以确保不存在咔哒声，例如，由于用户环境的突然变化可能发生的咔哒声。
[0049]噪声估计选择模块215可以从噪声估计模块210接收噪声估计数据。噪声估计选择模块215可以基于任何类型的选择准则来选择要使用的噪声估计模型。例如，噪声估计选择模块215可以使用投票机制、加权判决机制、表格、最终判决、建模等等。
[0050]由于用户可以在一天或一小时的过程中随意前往不同的位置，难以预测什么时候开启或需要噪声估计。例如，在电话呼叫的情况下，大多数电话呼叫将会在随机的时间发生，并且没有办法识别什么时候需要降噪算法。此外，类似地，用户或设备可能所处的位置也难以预测。例如，设备可以位于用户的口袋里，在桌子上、在汽车工具箱、餐馆、家庭、室外等等。噪声估计选择模块215可以用于丢弃与符合真实或当前用户环境的噪声条件不一致的噪声估计。例如，当使用电话时。例如，可以丢弃当移动电话从用户的口袋或包中移动到他/她的耳朵时麦克风采集的噪声。在一些实施例中，在电话呼叫或通信期间，语音呼叫可以从手持模式切换为免手持模式，或者从免手持模式切换为手持模式，并且噪声估计和分类可以发生在期间或之间的任何时间。
[0051]选择机制可以基于时间或质量的考虑。例如，最后的噪声估计可以是选择以向噪声抑制模块225提供的噪声估计。类似地，使用的方法可以是投票机制。在一个实施例中，考虑到用户环境的和噪声估计相对于语音呼叫时间的时间戳，可以选择最佳的过去噪声估计。噪声估计选择模块215可以向噪声抑制模块225传递精确的和最新的噪声估计。
[0052]噪声估计选择模块215可以向噪声抑制模块225提供抑制什么类型的噪声。类似地，噪声抑制模块225可以与听觉回声消除模块220通信，该听觉回声消除模块220确保根据由感测解决方案230完成的噪声选择来发生实际的噪声消除。听觉回声消除模块220可以包括通常用于消除回声的任何类型的硬件或软件噪声消除系统或方法。
[0053]图3示出了时间戳机制300ο时间戳机制300可以包括噪声估计的缓冲305、30秒的持续时间310、3秒的持续时间315、音频上下文更新320、倒回325、在呼叫开始之前最后获得的噪声估计330、以及电话呼叫335。
[0054]在时间戳机制300中，每个噪声估计可以在例如时隙音频上下文更新320中接收时间戳。在时间戳机制300中，每个音频上下文更新320时隙的长度为0.5秒。在该示例中，六个时隙组成3秒的持续时间315。噪声估计的缓冲305可以由在时隙中标记的任意数量的噪声估计来构成。例如，100ms、200ms或甚至I秒的时隙/采样周期可以被用于噪声估计和分类。在时间戳机制300中，噪声估计305的缓冲是先进先出(FIFO)算法。
[0055]在一个实施例中，噪声记录可以开始于设备启动后的任意时间。电话呼叫(例如电话呼叫335)可以在已经发生了若干个噪声估计之后发生。设备(例如用户设备105)可以在启动时开始记录噪声，并且在电话呼叫335处接收呼叫。在电话呼叫335的同时，可以记录并通过时间戳标记在开始呼叫330之前获得的最后的噪声估计。在接收呼叫时，感测解决方案230可以使用倒回325以回退任意时间量，并开始使用噪声估计数据。例如，倒回325可以回到当前噪声类型(例如汽车中、餐馆中、室外、家中、步行中)开始的点，并且使用该数据来进行噪声消除。因此，在任何噪声消除程序开始之前，可以检索之前的噪声估计。在一个示例中，当在环境中没有出现重大变化时，可以检索6秒前计算的噪声估计。
[0056]在一些示例中，关于知道用户环境的噪声估计中可能的变化，可以使用预测技术。例如，如果用户在汽车中，可以使用当离开车辆时可能发生的风的噪声或室外噪声来加速并准备估计机制。
[0057]例如，如果用户在停车并且离开汽车时在其汽车中接收呼叫，则在噪声条件中可能发生突然变化，并且该突然变化可被跟踪。可以进行精确的跟踪以向噪声抑制模块225提供好的噪声估计。因此，不同的统计可以用于不同的分类和噪声类型，以及改变中的或能够预测的上下文改变。
[0058]图4示出了噪声估计400的方法。例如，用户设备105或用户设备115可以实现用于噪声估计400的方法。用户设备105可以开始于步骤405，并且前进到可以执行噪声分类的步骤 410。
[0059]在步骤410中，可以通过关于噪声分类模块205讨论的任意方法来进行噪声分类。在步骤410中，噪声分类模块205可以使用任何声音或噪声识别和分类算法。算法的示例可以包括GMM、NN、DNN、HMM和SVM。噪声分类模块20 5可以在始终开启模式下运行。噪声分类模块可以在设备的微控制器单元(MCU)上执行。可以使用若干分类算法中的任意一个。在一个示例中，SVM可以执行分类，该分类基于使用从麦克风的信号中提取的特征建立的模型。可以向在‘始终开启’模式下运行的SVM分类器提供将要识别和/或获取的背景噪声模型，该背景噪声模型可以基于训练数据集。因此，可以持续地对麦克风信号进行分类。噪声分类模块可以通过指示例如汽车、餐馆、地铁、家庭、街道、办公室来每几秒钟输出用户上下文。
[0060]用户设备105可以前进到可执行噪声估计的步骤415。可以通过关于噪声估计模块210讨论的任意方法来进行噪声估计。在步骤415a中，硬件或软件数字信号处理器(DSP)可以用于估计从噪声分类模块205接收的噪声和噪声数据。噪声分类模块205可以提供音频上下文识别。可以通过使用与噪声上下文和/或噪声数据相对应的最合适的噪声估计器来驱动噪声估计模块210中的噪声估计。上下文可以是固定或非固定的，例如以信号方式通知不同噪声估计器。可以使用贝叶斯和/或非贝叶斯方法。可以针对每个上下文和/或用户环境来适当地在噪声估计模块210中切换或选择噪声估计。在前进至噪声估计选择模块215之前，噪声估计模块210可以执行平滑程序以确保不存在咔哒声，例如，由于用户环境的突然变化可能发生的咔哒声。在一些实施例中，通信可以从手持模式切换到免手持模式或从免手持模式切换到手持模式，这些模式分别发起各种不同的噪声估计和分类。
[0061]用户设备105可以前进到可以执行噪声估计选择的步骤420。可以通过关于噪声估计选择模块215讨论的任意方法来进行噪声估计选择。噪声估计选择模块215可以基于任何不同类型的选择准则来选择要使用的噪声估计模型。例如，噪声估计选择模块215可以使用投票机制、加权判决机制、表格、最终判决、建模等等。噪声估计选择模块215可以被用于丢弃与符合真实用户环境的噪声条件不一致的噪声估计。选择机制可以基于时间的考虑。类似地，使用的方法可以使投票机制。
[0062]用户设备105可以前进到可以应用噪声抑制的步骤425。结合听觉回声消除模块220，可以在噪声抑制模块225中进行噪声抑制。用户设备105可以前进到可以终止操作的步骤430。
[0063]图5示出了设备500(例如移动电话、个人计算机或平板计算机)的硬件示意图。设备500可以对应于用户设备105。如图所示，设备500包括经由一个或多个系统总线510互连的处理器520、存储器530、用户界面540、网络接口 550、和存储设备560。将要理解的是，图5包括一定程度的抽象并且设备500的组件的实际组织可以比所示出的更为复杂。
[0064]处理器520可以是能够执行存储在存储器530或存储模块560中的指令的任何硬件设备。由此，处理器可以包括微处理器、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、M⑶或其它类似的设备。处理器520还可以是微处理器，并且可以包括任意数量的用于噪声监测和感测的传感器。
[0065]存储器530可以包括各种存储器，例如L1、L2、L3高速缓存或系统存储器。因此，存储器530可以包括静态随机存取存储器(SRAM)、动态RAM(DRAM)、闪存、只读存储器(ROM)、或者其他类似存储设备。
[0066]用户接口540可以包括用于使得能够与用户进行通信的一个或多个设备。例如，用户接口 540可以包括显示器、触摸屏、以及用于接收用户命令的键盘。
[0067]网络接口550可以包括用于实现与其他硬件设备的通信的一个或多个设备。例如，网络接口 550可以包括被配置为根据LTE、GSM、CDMA或VoIP协议通信的移动处理器。此外，网络接口 550可以实现用于根据TCP/IP协议的通信的TCP/IP栈。网络接口 550的各种备选或附加的硬件或配置将是显而易见的。
[0068]存储设备560可以包括一个或多个机器可读存储介质，例如，只读存储器(R0M)、随机存取存储器(RAM)、磁盘存储介质、光学存储介质、闪存设备、或类似的存储介质。在各个实施例中，存储设备560可以存储由处理器520执行的指令或者处理器520可以操作的数据。例如，存储设备560可以存储操作系统561来处理规则引擎的指令。存储设备560可以存储用于根据本文描述的概念执行噪声估计、分类和抑制的噪声系统指令562。存储设备还可以存储处理器使用来执行噪声系统指令562的噪声数据563。
[0069]从上述描述中可以明显看出，本发明的各种实施例可以通过硬件来实现。此外，各个实施例可以实现为机器可读存储介质上存储的指令，该指令可以由至少一个处理器来读取和执行，以执行本文详细描述的操作。机器可读存储介质可以包括用于以机器可读的形式存储信息的任何机制，例如个人或膝上型计算机、服务器或其它计算设备。因此，机器可读存储介质可以包括只读存储器(R0M)、随机存取存储器(RAM)、磁盘存储介质、光盘存储介质、闪速存储器设备和类似存储介质。
[0070]尽管主机设备500被示出为包括每个所描述的组件中的一个，可以在各实施例中复制各个组件。例如，处理器520可以包括被配置为独立地执行本文中描述的方法或被配置为执行本文中描述的方法的步骤或子例程的多个微处理器，使得多个处理器协同实现本文描述的功能。
[0071]根据前述描述可以看出，本发明的多个实施例可以实施为硬件和/或固件。此外，各个实施例可以实现为机器可读存储介质上存储的指令，该指令可以由至少一个处理器来读取和执行，以执行本文详细描述的操作。机器可读存储介质可以包括用于以机器可读的形式存储信息的任何机制，例如个人或膝上型计算机、服务器或其它计算设备。因此，机器可读存储介质可以包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光盘存储介质、闪速存储器设备和类似存储介质。
[0072]本领域技术人员应当认识到，本文的任何框图表示实现本发明原理的示意电路的概念视图。类似地，将理解的是，任何流程图、流程示意图、状态转换图、伪代码等表示可以实质上表示在机器可读介质中并且因此由计算机或处理器来执行的各种处理，而不论这种计算机或处理器是否被显式地示出。
[0073]虽然具体参考了各个实施例的某些方面对各个实施例进行了详细描述，应该理解的是本发明可以采用其它实施例以及它的细节可以在各种明显的方面进行修改。本领域的普通技术人员可以容易地看到，可以在本发明的精神和范围内进行多种变型和修改。相应地，前述公开、描述和图仅仅是用于说明性的目的，不该以任何形式限制本发明，本发明仅由权利要求限定。
【主权项】
1.一种降噪设备，所述设备包括: 存储设备，被配置为存储声音数据；处理器，被配置为: 使用在发起通信会话之前积累的声音数据来对噪声分段进行分类；使用根据噪声分类接收到的信息来估计所述噪声分段；以及基于由在发起所述通信会话之前积累的声音数据定义的上下文，选择导致用户的当前上下文的噪声简档。2.根据权利要求1所述的降噪设备，其中，所述处理器还被配置为: 应用噪声估计来消除所述通信会话中的噪声。3.根据权利要求1或2所述的降噪设备，其中，所述处理器还被配置为: 使用与由用户所处的上下文相关联的算法来进行估计，所述用户所处的上下文由根据所述噪声分类接收到的信息提供。4.根据任一项前述权利要求所述的降噪设备，其中，所述处理器还被配置为: 无论用户是否处于所述通信会话中，在始终开启模式下收集针对声音数据的音频。5.根据任一项前述权利要求所述的降噪设备，其中，所述处理器还被配置为: 当根据所述噪声分类接收到的信息指示噪声位于固定的上下文中时，使用最小统计进行估计。6.根据任一项前述权利要求所述的降噪设备，其中，所述处理器还被配置为: 基于在发起通信会话之前积累的声音数据，丢弃噪声估计，所述声音数据表示用户的上下文已经发生变化。7.根据任一项前述权利要求所述的降噪设备，其中，所述处理器还被配置为: 当根据所述噪声分类接收到的信息指示噪声位于非固定的上下文中时，使用最小均方误差进行估计。8.—种使用指令编码的非暂时性机器可读存储介质，所述指令能够由处理器执行用于执行降噪方法，所述非暂时性机器可读存储介质包括用于以下操作的指令: 使用在发起通信会话之前积累的声音数据来对噪声分段进行分类；使用根据噪声分类接收到的信息来估计所述噪声分段；以及基于由在发起所述通信会话之前积累的声音数据定义的上下文，选择导致用户的当前上下文的噪声简档。9.根据权利要求8所述的非暂时性机器可读存储介质，还包括用于以下操作的指令: 应用噪声估计来消除所述通信会话中的噪声。10.根据权利要求8或90所述的非暂时性机器可读存储介质，其中，用于进行估计的指令还包括用于以下操作的指令: 使用与由用户所处的上下文相关联的算法来进行估计，所述用户所处的上下文由根据所述噪声分类接收到的信息提供。11.根据权利要求8至100中任一项所述的非暂时性机器可读存储介质，还包括用于以下操作的指令: 无论用户是否处于所述通信会话中，在始终开启模式下收集针对声音数据的音频。12.根据权利要求8至11中任一项所述的非暂时性机器可读存储介质，其中，用于进行估计的指令还包括用于以下操作的指令: 当根据所述噪声分类接收到的信息指示噪声位于固定的上下文中时，使用最小统计进行估计。13.根据权利要求8至12中任一项所述的非暂时性机器可读存储介质，其中，用于进行选择的指令还包括用于以下操作的指令: 基于在发起通信会话之前积累的声音数据，丢弃噪声估计，所述声音数据表示用户的上下文已经发生变化。14.根据权利要求8至13中任一项所述的非暂时性机器可读存储介质，其中，用于进行估计的指令还包括用于以下操作的指令: 当根据所述噪声分类接收到的信息指示噪声位于非固定的上下文中时，使用最小均方误差进行估计。
【文档编号】H04M9/08GK106024002SQ201610082998
【公开日】2016年10月12日
【申请日】2016年2月6日
【发明人】卢多维克·多米尼克·乔尔·勒保罗克, 让-克里斯多弗·迪普伊, 劳伦·皮拉蒂
【申请人】恩智浦有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卢多维克·多米尼克·乔尔·勒保罗克;让-克里斯多弗·迪普伊;劳伦·皮拉蒂;
技术所有人：恩智浦有限公司;
我是此专利的发明人

上一篇：结合图像的语音定位和增强系统及方法
上一篇：一种提高麦克风阵列语音增强性能的方法