基于内容的噪声抑制的制作方法_2

文档序号：9308977阅读：来源：国知局

器的组合（例如，ARM与DSP)。
[0030] 麦克风206经配置以捕获声学声音，且作为响应，产生如由执行来自存储器212的特定指令的处理器204控制的输入音频信号。麦克风206的实例包含用于将声音转换成电音频信号的任何可适用传感器或换能器，例如，电容传声器、动态麦克风、压电麦克风和类似者。在一些实施例中，麦克风206是任选的，且输入音频信号（例如）从来自数据存储装置210或存储器212的数据产生，或从通信接口208接收，如将在以下参看图3所论述。
[0031] 通信接口 208包含经配置以允许音频处理装置202发射和接收数据（例如，用于识别、检索或存取内容源的数据）的电子器件。通信接口 208可通信耦合到无线天线、WLAN/ LAN和其它类型的路由器和类似通信装置。
[0032] 数据存储装置210和存储器212包含经配置以通过化学、磁性、电、光学或类似方式存储信息的机构。举例来说，数据存储装置210和存储器212可各自为非易失性存储器装置（例如，快闪存储器或硬盘驱动器），或易失性存储器装置（例如，动态随机存取存储器 (DRAM)或静态随机存取存储器（SRAM))。在一些实施例中，处理器204可通过存取数据存储装置210的内容源数据库来存取内容源。图2将数据存储装置210展示为音频处理装置 202的部分。在其它实施例中，数据存储装置210可位于单独装置上且可由通信信道存取，例如，经由网络。将关于图3进一步详细地论述音频信号分析器模块216。
[0033] 在存储器212内的为音频信号分析器模块216,其包含配置处理器204以起始输入音频信号的内容的识别以提供对对应的内容源的存取和/或接收经识别的源信号的指令。如将关于图3进一步详细地论述，在一些实施例中，从输入音频信号提取特征。提取的特征可用以确定由输入音频信号表示的媒体内容的内容身份，且可使用内容身份存取与所述内容身份相关联的内容源。将关于图4和5进一步详细地论述音频信号分析器模块218。
[0034] 在存储器212内的为音频消除器模块218,其包含配置处理器204以处理具有经识别的源信号的输入音频信号以衰减音频噪声的指令。明确地说，将输入音频信号与经识别的源信号比较。在一个实施例中，对经识别的源信号滤波以考虑室内声学。进行此的其中一个原因是因为部分归因于电子装置所位于的声学空间的声学效应，由媒体装置产生的声音可不同于经识别的源信号。声学效应可包含声学抑制和回声。在另一实施例中，输入音频信号与经识别的源信号经同步以考虑从计算、通信和声学因素产生的各种延迟。将关于图4和5进一步详细地论述音频消除器模块218。
[0035] 在存储器212内的为通信模块220,其包含配置处理器204以控制通信接口208发射或接收数据的指令。在一些实施例中，起始音频处理装置202与单独媒体装置（例如，图 1的具备网络功能的TV116)之间的通信，如下文进一步详细地论述。
[0036] 在操作中，处理器204可执行来自存储器212的指令以接收由麦克风206捕获的输入音频信号。输入音频信号可含有语音信号和音频噪声信号。例如，语音信号可表示用户的语音，而音频噪声信号可表示由附近媒体装置产生的声音。处理器204可执行来自音频信号分析器模块216的指令以识别音频噪声信号的内容。处理器204可接着针对与经识别的内容相关联的内容源搜索数据存储装置210。另外或替代地，处理器204可执行来自音频信号分析器和/或通信模块212的指令以经由通信接口208在网络上搜索数据库。一旦音频处理装置202能够存取内容源且具有对应的经识别的源信号，那么处理器204可执行来自音频消除器模块218的指令以通过比较噪声信号（例如，经滤波或未滤波的经识别的源信号）的副本与输入音频信号来抑制或衰减音频噪声信号的至少部分。
[0037] 参看图3,框图展示由图2的音频处理装置202实施的音频信号分析器300的特定说明性实施例。音频信号分析器300可实施有由处理器204执行的计算机可执行指令（例如，音频信号分析器模块216的指令）。图3的音频信号分析器300包含识别符产生器302，其经配置以接收输入音频信号和产生内容识别信息。内容识别信息可包含以下中的一或多者：艺术家的姓名、内容标题（歌曲、电影、有声读物等的名称）、识别号和类似身份标志。音频信号分析器300还具有源匹配器304,其经配置以接收内容识别信息和产生经识别的源信号。
[0038] 图3的识别符产生器302具有特征提取器306、内容识别符308和内容-身份数据库310。特征提取器306可由包含配置处理器204以确定输入音频信号的特征信息以确定内容的指令的模块实施。例如，在操作中，特征提取器306可分析输入音频信号以确定可识别或特性化输入音频信号的声学图案或指纹。在一个实施例中，声学图案或指纹可基于执行频谱图（例如，时间_频率）分析。应了解，可选择用于特征提取的其它可适用的方法和系统，例如，基于梅尔频率倒谱系数和/或感知线性预测（例如，相对频谱变换-感知线性预测）的音频处理技术。用于内容识别的特征提取系统的一个特定非限制性实例可发现于 (例如）王的论文"一种工业强度音频搜索算法（Anindustrialstrengthaudiosearch algorithm)(关于音乐检索的国际会议学报ISMIR，第3册，2003) "。举例来说，由王描述的系统利用频谱图中的局部峰值图案来改善对背景噪声的稳固性。
[0039] 内容识别符308可由包含配置处理器204以使用声学图案或指纹针对声学图案或指纹的内容身份搜索内容-身份数据库310的指令的模块实施。例如，处理器204可针对对应于或大致匹配声学图案或指纹的内容识别信息搜索内容-身份数据库310。识别符产生器302将内容识别信息提供到源匹配器304。
[0040] 图3的源匹配器304包含源搜索器312、源数据库314和源发射器316。源搜索器 312可由包含配置处理器204以使用内容识别信息针对内容源搜索源数据库314的指令的模块实施。例如，处理器204可针对对应于或大致匹配内容识别信息的内容源（例如，歌曲的MP3文件）搜索存储于数据存储装置210上（或存储在外部且借助于通信接口 208存取）的源数据库314。
[0041] 源发射器316可存取由源搜索器312识别的内容源且可产生经识别的源信号。可将源信号作为脉冲代码调制（PCM)音频样本、数据包（包含经压缩或经译码的数据）或类似数据格式发射。因此，源发射器316可任选地包含声码器/编码器318以产生待发射到音频处理装置202的经译码音频数据包。换句话说，源发射器316可位于服务器计算装置处，且可在数据路径或语音路径上将源信号发送到音频处理装置202 (例如，图1的移动电话 102)。
[0042] 应了解，音频信号分析器300的功能中的每一者可由图2的音频处理装置202执行。在其它实施例中，功能中的一或多个由一或多个服务器计算装置（例如，内容数据库 110和连接到网络的其它装置）执行。例如，音频处理装置202可使用通信接口 208与服务器计算机经由网络通信。可全部以类似流式发射方式或在数据块中、以类似下载方式经由网络提供经识别的源信号。因此，音频处理装置202可接收经识别的源信号的部分（在需要将其用于消除前）。因此，内容-身份数据库310和源数据库314中的每一者可以电子方式存储在音频处理装置202的数据存储装置210或存储器212上，或其可在外部存储到音频处理装置202且经由网络存取。
[0043] 图4展示由图2的音频处理装置202实施的音频消除器系统400的特定说明性实施例的框图。如所展示，音频消除器系统400可用以抑制多个音频噪声源。举例来说，音频消除器系统400具有n个同步块402 (1)到402 (n)(也被称为"信号同步器"）和n个对应的音频消除器404 (1)到405 (n)，以及任选的后处理块406、声码器块408和语音辨识块410。音频消除器系统400可实施有计算机可执行指令，例如，由处理器204执行的音频消除器模块218的指令。
[0044] 在操作中，音频消除器系统400接收输入音频信号和n个经识别的源信号，n个待衰减的可能音频噪声中的每一者对应一个经识别的源信号。例如，参看图1，音频噪声1可对应于来自具备网络功能的TV116的音频120,且音频噪声2可对应于来自收音机118的音频122。此外，每一经识别的源信号可对应于由（例如）图3的音频信号分析器300产生的源信号。n对同步块402(1)到402(n)和音频消除器块404(1)到404(n)经串联配置，使得音频噪声1首先受到抑制且将所得经处理的输入音频信号馈入到音频消除器2以抑制音频噪声2,等等。应了解，可选择其它可适用的配置，例如，n个平行音频消除器404(1)到 404 (n)〇
[0045] 如所陈述，n个经识别的源信号可由n个单独源发射器（例如，图3中展示的源发射器）提供。另外或替代地，n个经识别的源信号可由产生音频噪声的单独媒体装置产生。可将n个经识别的源信号（以及输入音频信号）各作为PCM音频样本或数据包提供。例如，在一个实施例中，可将n个经识别的源信号作为经译码语音包发射，且音频消除器系统400 包含任选的声码器/解码器（未图示），用于在将信号提供到同步块402(1)到402(n)前解码信号。
[0046] 如图4中所展示，音频消除器404(1)到404(n)中的每一者分别与同步块402(1) 到402(n)相关联。同步块402(1)到402(n)中的每一者可同步输入音频信号（或先前音频消除器的输出）与对应的经识别的源信号。同步块402(1)到402(n)可补偿归因于处理、通信和类似延迟来源的时序差。另外，同步块402(1)到402 (n)可用以补偿在确定或估计正由媒体装置播放的源的当前时间位置的误差。同步块402(1)到402(n)中的每一者可分别具有对应的数据缓冲器416 (1)-416 (n)，用于提供用于同步的延迟。在一些实施例中，延迟可为可调谐的。在操作中，可通过执行校准过程来确定可调谐的延迟。用于校准和调谐延迟的过程的非限制性实例可发现于2012年8月9日申请的美国临时专利申请案第 61/681，474 号中。
[0047]n个音频消除器404(1)到404(n)中的每一者可分别具有经配置以滤波对应的源信号的一或多个自适应滤波器412(1)到412(n)。可使用滤波来考虑捕获的音频噪声与源信号之间的变化。即，由于包含以下各者的许多因素，由麦克风206捕获的音频噪声可与源信号有变化：声学空间的动力学（例如，回声和声学阻抑，其可随麦克风206和媒体装置位置而变化）、扬声器/麦克风的动力学、内容源的变化（例如，不同记录质量）和类似者。
[0048] 为了补偿这些变化，自适应滤波器412(1)到412(n)中的每一者可具有一或多个可调谐的滤波器参数

完整全部详细技术资料下载

当前第2页1 2 3 4 5