基于内容的噪声抑制的制作方法_2

文档序号:9308977阅读:来源:国知局
器的组合(例如,ARM与DSP)。
[0030] 麦克风206经配置以捕获声学声音,且作为响应,产生如由执行来自存储器212的 特定指令的处理器204控制的输入音频信号。麦克风206的实例包含用于将声音转换成电 音频信号的任何可适用传感器或换能器,例如,电容传声器、动态麦克风、压电麦克风和类 似者。在一些实施例中,麦克风206是任选的,且输入音频信号(例如)从来自数据存储装 置210或存储器212的数据产生,或从通信接口208接收,如将在以下参看图3所论述。
[0031] 通信接口 208包含经配置以允许音频处理装置202发射和接收数据(例如,用于 识别、检索或存取内容源的数据)的电子器件。通信接口 208可通信耦合到无线天线、WLAN/ LAN和其它类型的路由器和类似通信装置。
[0032] 数据存储装置210和存储器212包含经配置以通过化学、磁性、电、光学或类似方 式存储信息的机构。举例来说,数据存储装置210和存储器212可各自为非易失性存储器 装置(例如,快闪存储器或硬盘驱动器),或易失性存储器装置(例如,动态随机存取存储器 (DRAM)或静态随机存取存储器(SRAM))。在一些实施例中,处理器204可通过存取数据存 储装置210的内容源数据库来存取内容源。图2将数据存储装置210展示为音频处理装置 202的部分。在其它实施例中,数据存储装置210可位于单独装置上且可由通信信道存取, 例如,经由网络。将关于图3进一步详细地论述音频信号分析器模块216。
[0033] 在存储器212内的为音频信号分析器模块216,其包含配置处理器204以起始输入 音频信号的内容的识别以提供对对应的内容源的存取和/或接收经识别的源信号的指令。 如将关于图3进一步详细地论述,在一些实施例中,从输入音频信号提取特征。提取的特征 可用以确定由输入音频信号表示的媒体内容的内容身份,且可使用内容身份存取与所述内 容身份相关联的内容源。将关于图4和5进一步详细地论述音频信号分析器模块218。
[0034] 在存储器212内的为音频消除器模块218,其包含配置处理器204以处理具有经识 别的源信号的输入音频信号以衰减音频噪声的指令。明确地说,将输入音频信号与经识别 的源信号比较。在一个实施例中,对经识别的源信号滤波以考虑室内声学。进行此的其中 一个原因是因为部分归因于电子装置所位于的声学空间的声学效应,由媒体装置产生的声 音可不同于经识别的源信号。声学效应可包含声学抑制和回声。在另一实施例中,输入音 频信号与经识别的源信号经同步以考虑从计算、通信和声学因素产生的各种延迟。将关于 图4和5进一步详细地论述音频消除器模块218。
[0035] 在存储器212内的为通信模块220,其包含配置处理器204以控制通信接口208发 射或接收数据的指令。在一些实施例中,起始音频处理装置202与单独媒体装置(例如,图 1的具备网络功能的TV116)之间的通信,如下文进一步详细地论述。
[0036] 在操作中,处理器204可执行来自存储器212的指令以接收由麦克风206捕获的 输入音频信号。输入音频信号可含有语音信号和音频噪声信号。例如,语音信号可表示用 户的语音,而音频噪声信号可表示由附近媒体装置产生的声音。处理器204可执行来自音 频信号分析器模块216的指令以识别音频噪声信号的内容。处理器204可接着针对与经识 别的内容相关联的内容源搜索数据存储装置210。另外或替代地,处理器204可执行来自音 频信号分析器和/或通信模块212的指令以经由通信接口208在网络上搜索数据库。一旦 音频处理装置202能够存取内容源且具有对应的经识别的源信号,那么处理器204可执行 来自音频消除器模块218的指令以通过比较噪声信号(例如,经滤波或未滤波的经识别的 源信号)的副本与输入音频信号来抑制或衰减音频噪声信号的至少部分。
[0037] 参看图3,框图展示由图2的音频处理装置202实施的音频信号分析器300的特定 说明性实施例。音频信号分析器300可实施有由处理器204执行的计算机可执行指令(例 如,音频信号分析器模块216的指令)。图3的音频信号分析器300包含识别符产生器302, 其经配置以接收输入音频信号和产生内容识别信息。内容识别信息可包含以下中的一或多 者:艺术家的姓名、内容标题(歌曲、电影、有声读物等的名称)、识别号和类似身份标志。音 频信号分析器300还具有源匹配器304,其经配置以接收内容识别信息和产生经识别的源 信号。
[0038] 图3的识别符产生器302具有特征提取器306、内容识别符308和内容-身份数据 库310。特征提取器306可由包含配置处理器204以确定输入音频信号的特征信息以确定 内容的指令的模块实施。例如,在操作中,特征提取器306可分析输入音频信号以确定可识 别或特性化输入音频信号的声学图案或指纹。在一个实施例中,声学图案或指纹可基于执 行频谱图(例如,时间_频率)分析。应了解,可选择用于特征提取的其它可适用的方法和 系统,例如,基于梅尔频率倒谱系数和/或感知线性预测(例如,相对频谱变换-感知线性 预测)的音频处理技术。用于内容识别的特征提取系统的一个特定非限制性实例可发现于 (例如)王的论文"一种工业强度音频搜索算法(Anindustrialstrengthaudiosearch algorithm)(关于音乐检索的国际会议学报ISMIR,第3册,2003) "。举例来说,由王描述的 系统利用频谱图中的局部峰值图案来改善对背景噪声的稳固性。
[0039] 内容识别符308可由包含配置处理器204以使用声学图案或指纹针对声学图案或 指纹的内容身份搜索内容-身份数据库310的指令的模块实施。例如,处理器204可针对 对应于或大致匹配声学图案或指纹的内容识别信息搜索内容-身份数据库310。识别符产 生器302将内容识别信息提供到源匹配器304。
[0040] 图3的源匹配器304包含源搜索器312、源数据库314和源发射器316。源搜索器 312可由包含配置处理器204以使用内容识别信息针对内容源搜索源数据库314的指令的 模块实施。例如,处理器204可针对对应于或大致匹配内容识别信息的内容源(例如,歌曲 的MP3文件)搜索存储于数据存储装置210上(或存储在外部且借助于通信接口 208存 取)的源数据库314。
[0041] 源发射器316可存取由源搜索器312识别的内容源且可产生经识别的源信号。可 将源信号作为脉冲代码调制(PCM)音频样本、数据包(包含经压缩或经译码的数据)或类 似数据格式发射。因此,源发射器316可任选地包含声码器/编码器318以产生待发射到 音频处理装置202的经译码音频数据包。换句话说,源发射器316可位于服务器计算装置 处,且可在数据路径或语音路径上将源信号发送到音频处理装置202 (例如,图1的移动电 话 102)。
[0042] 应了解,音频信号分析器300的功能中的每一者可由图2的音频处理装置202执 行。在其它实施例中,功能中的一或多个由一或多个服务器计算装置(例如,内容数据库 110和连接到网络的其它装置)执行。例如,音频处理装置202可使用通信接口 208与服务 器计算机经由网络通信。可全部以类似流式发射方式或在数据块中、以类似下载方式经由 网络提供经识别的源信号。因此,音频处理装置202可接收经识别的源信号的部分(在需 要将其用于消除前)。因此,内容-身份数据库310和源数据库314中的每一者可以电子方 式存储在音频处理装置202的数据存储装置210或存储器212上,或其可在外部存储到音 频处理装置202且经由网络存取。
[0043] 图4展示由图2的音频处理装置202实施的音频消除器系统400的特定说明性实 施例的框图。如所展示,音频消除器系统400可用以抑制多个音频噪声源。举例来说,音频 消除器系统400具有n个同步块402 (1)到402 (n)(也被称为"信号同步器")和n个对应的 音频消除器404 (1)到405 (n),以及任选的后处理块406、声码器块408和语音辨识块410。 音频消除器系统400可实施有计算机可执行指令,例如,由处理器204执行的音频消除器模 块218的指令。
[0044] 在操作中,音频消除器系统400接收输入音频信号和n个经识别的源信号,n个待 衰减的可能音频噪声中的每一者对应一个经识别的源信号。例如,参看图1,音频噪声1可 对应于来自具备网络功能的TV116的音频120,且音频噪声2可对应于来自收音机118的 音频122。此外,每一经识别的源信号可对应于由(例如)图3的音频信号分析器300产生 的源信号。n对同步块402(1)到402(n)和音频消除器块404(1)到404(n)经串联配置, 使得音频噪声1首先受到抑制且将所得经处理的输入音频信号馈入到音频消除器2以抑制 音频噪声2,等等。应了解,可选择其它可适用的配置,例如,n个平行音频消除器404(1)到 404 (n)〇
[0045] 如所陈述,n个经识别的源信号可由n个单独源发射器(例如,图3中展示的源发 射器)提供。另外或替代地,n个经识别的源信号可由产生音频噪声的单独媒体装置产生。 可将n个经识别的源信号(以及输入音频信号)各作为PCM音频样本或数据包提供。例如, 在一个实施例中,可将n个经识别的源信号作为经译码语音包发射,且音频消除器系统400 包含任选的声码器/解码器(未图示),用于在将信号提供到同步块402(1)到402(n)前解 码信号。
[0046] 如图4中所展示,音频消除器404(1)到404(n)中的每一者分别与同步块402(1) 到402(n)相关联。同步块402(1)到402(n)中的每一者可同步输入音频信号(或先前音 频消除器的输出)与对应的经识别的源信号。同步块402(1)到402(n)可补偿归因于处 理、通信和类似延迟来源的时序差。另外,同步块402(1)到402 (n)可用以补偿在确定或 估计正由媒体装置播放的源的当前时间位置的误差。同步块402(1)到402(n)中的每一者 可分别具有对应的数据缓冲器416 (1)-416 (n),用于提供用于同步的延迟。在一些实施例 中,延迟可为可调谐的。在操作中,可通过执行校准过程来确定可调谐的延迟。用于校准和 调谐延迟的过程的非限制性实例可发现于2012年8月9日申请的美国临时专利申请案第 61/681,474 号中。
[0047]n个音频消除器404(1)到404(n)中的每一者可分别具有经配置以滤波对应的源 信号的一或多个自适应滤波器412(1)到412(n)。可使用滤波来考虑捕获的音频噪声与源 信号之间的变化。即,由于包含以下各者的许多因素,由麦克风206捕获的音频噪声可与源 信号有变化:声学空间的动力学(例如,回声和声学阻抑,其可随麦克风206和媒体装置位 置而变化)、扬声器/麦克风的动力学、内容源的变化(例如,不同记录质量)和类似者。
[0048] 为了补偿这些变化,自适应滤波器412(1)到412(n)中的每一者可具有一或多个 可调谐的滤波器参数
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1