基于内容的噪声抑制的制作方法

文档序号:9308977阅读:429来源:国知局
基于内容的噪声抑制的制作方法
【技术领域】
[0001] 以下描述是针对音频信号处理。明确地说,描述是针对音频噪声抑制。
【背景技术】
[0002] 部分归因于电池、处理和通信技术的进展,个人装置已变得日益移动、强大且被连 接。随着这些技术进展,用户在他们可使用其装置且与其装置交互的方式方面具有更大灵 活性。明确地说,移动装置可使用语音辨识来允许用户用语音命令控制移动装置。此外,对 于语音辨识和语音遥测,用户想要移动装置在多种环境(包含声学严酷环境)中正常地操 作。
[0003] 已使用各种噪声抑制方案来减少或减轻当用户正与移动装置交互时的背景噪声 的不利影响。频率选择性滤波(例如)可用以抑制与某些频带相关联的噪声。其它噪声抑 制方案使用统计模型抑制在统计上与噪声有关或在统计上与打算的音频信号不相关的所 捕获音频信号的某些方面。又其它噪声抑制方案使用内部信号消除从由移动装置产生且然 后感测的声音产生的噪声(例如,回声噪声)。

【发明内容】

[0004] 本发明的系统、方法和装置各自具有若干方面,其中无单一方面单独地负责其合 乎需要的属性。在不限制如由以下权利要求书表达的本发明的范围的情况下,现在将简洁 地论述一些特征。在考虑此论述之后,并且尤其在阅读了标题为"【具体实施方式】"的章节之 后,人们将理解本发明的特征如何提供包含减少背景噪声以改善音频处理的优势。
[0005] -个实施例为一种衰减音频噪声的装置。所述装置可包含麦克风,其经配置以接 收输入音频信号。所述装置还可包含音频信号分析器,其经配置以确定所述输入音频信号 是否包含具有可识别的内容的噪声信号。如果存在具有可识别的内容的噪声信号,那么所 述音频信号分析器可存取内容源以获得所述噪声信号的副本。所述装置还可包含音频消除 器,其经配置以基于比较所述噪声信号的所述副本与所述输入音频信号来产生具有衰减的 噪声信号的经处理的音频信号。
[0006] 另一实施例为一种衰减音频噪声的方法。所述方法可包含接收输入音频信号。所 述方法还可包含确定所述输入音频信号是否包含具有可识别的内容的噪声信号。如果存在 具有可识别的内容的噪声信号,那么所述方法可包含存取内容源以获得所述噪声信号的副 本。所述方法可更包含基于比较所述噪声信号的所述副本与所述输入音频信号来产生具有 衰减的噪声信号的经处理的音频信号。
[0007] 再一实施例为一种非暂时性计算机可读媒体,其存储在经执行时使处理器执行方 法的指令。所述方法包含接收输入音频信号,和确定所述输入音频信号是否包含具有可识 别的内容的噪声信号。如果存在具有可识别的内容的噪声信号,那么所述方法包含存取内 容源以获得所述噪声信号的副本。所述方法更包含基于比较所述噪声信号的所述副本与所 述输入音频信号来产生具有衰减的噪声信号的经处理的音频信号。
【附图说明】
[0008] 图1为根据一个实施例的包含移动电话以抑制来自一或多个媒体装置的噪声的 音频系统的框示意图。
[0009] 图2为抑制音频噪声的音频处理装置的说明性实施例的框图。
[0010] 图3为由图2的音频处理装置实施的音频信号分析器的特定说明性实施例的框 图。
[0011] 图4为由图2的音频处理装置实施的音频消除器系统的特定说明性实施例的框 图。
[0012] 图5为由图2的音频处理装置实施的音频消除器系统的特定说明性实施例的框 图。
[0013] 图6为根据各种实施例的音频噪声抑制的方法的流程图。
[0014] 图7A为根据一个实施例的用于确定音频输入信号是否包含具有可识别的内容的 噪声的实例方法的说明性流程图。
[0015] 图7B为根据一个实施例的用于存取内容源以获得源信号的实例方法的说明性流 程图。
[0016] 图8为根据实施例的用于衰减音频噪声的实例方法的说明性流程图。
[0017] 图9为根据实施例的音频噪声抑制的特定说明性方法的流程图。
【具体实施方式】
[0018] 实施例涉及用于抑制由电子装置接收的音频信号中的不想要的音频噪声的系统 和方法。在一个实施例中,系统抑制表示可鉴别的媒体内容(例如,正在背景中播放的流行 歌曲)的音频噪声。所述系统可获得媒体内容的副本,从媒体内容的副本产生不想要的音 频噪声的副本,且从音频信号去除不想要的音频噪声。例如,在操作中,系统确定不想要的 音频噪声的声学图案或指纹且使用所述图案识别由音频噪声表示的媒体内容(例如,特定 歌曲)。可使用身份来搜索媒体内容源,例如,经识别的歌曲的数字记录。一旦歌曲经识别, 可将歌曲的副本下载到电子装置,且接着用以从音频信号减去那首歌。在一个实施例中,所 述系统可由便携式计算装置(例如,蜂窝式电话)实施。例如,蜂窝式电话可在电话会话期 间抑制在背景中播放的歌曲或其它媒体内容。
[0019] 在一个特定实例中,所述系统可由具有麦克风的蜂窝式电话和存储于电话的存储 器中数字音乐库实施。当人在播放特定歌曲的收音机附近在电话上谈话时,系统可从麦克 风的音频信号提取音频特征以显现那首歌的声学图案或指纹。显现的图案可接着用以搜索 含有由这些声学图案索引以找到正由收音机播放的歌曲的歌曲身份的数据库。如果歌曲身 份匹配图案,那么电话可接着针对经识别的歌曲的副本搜索其音乐库。替代地,电话可经由 网络连接请求来自服务器的经识别的歌曲的副本。一旦经存取,可将歌曲的副本同步化到 歌曲的时间位置(当其在收音机上播放时)以抑制来自接收到的音频信号的歌曲。具有此 系统的电话将允许用户在对于电话会话将另外过于声学严酷的区域(例如,室外音乐场馆 或音乐会大厅)中操作电话。
[0020] 在另一特定实例中,噪声抑制系统可由控制具有无线通信能力的单独媒体装置 (例如,电视(TV))的语音控制的遥控器实施。所述控制器可直接从TV接收内容信息。例 如,TV可传递正对遥控器显示的作用中频道,且遥控器可使用那个信息通过因特网连接存 取频道的音频。替代地,TV可将广播的副本发送到遥控器。遥控器可又使用广播的副本消 除由TV产生的音频。此将允许语音控制的电子装置通过产生音频的媒体装置来起作用。
[0021] 揭示的方法、设备和系统可用以改善现有的噪声抑制技术。具体来说,在一些情形 中,在估计和/或识别了音频噪声的内容后,可发现音频噪声为实质上确定性的。借助于说 明,一个此情形为预先记录的歌曲为噪声源。在此情况下,如果(例如)已知正在播放一首 歌曲、何特定歌曲和歌曲的特定时序,那么歌曲可为实质上确定性的。如果与以上内容有关 的信息已知或可识别,那么可使用歌曲或音频信号的副本来衰减或消除音频信号对应于歌 曲的分量。以此方式对歌曲的抑制可改善经由移动装置的语音辨识或话音通信的质量。
[0022] 媒体装置的实例包含电视、收音机、膝上型计算机/上网本计算机、平板计算机、 桌上型计算机和经配置以播放媒体内容(包含音频媒体内容)的类似电子装置。音频媒体 内容的实例包含表示音乐、视频和具有音频的其它类似媒体的数据或信号。
[0023]为了进一步说明,图1展示包含经配置以抑制来自一或多个媒体装置的噪声的移 动电话102的特定音频配置100的框图。明确地说,移动电话102具有麦克风104和天线 106。移动电话102可将语音和数据信号传递到网络108或其它电子装置。网络108可为 有线或无线网络,且可提供对存储各种内容源(例如,音乐和音频视频数据文件)的一或多 个内容数据库110的存取。在一个实施例中,网络为因特网。
[0024]在操作中,用户112对用于(例如)话音通信和/或语音辨识的移动电话102的麦 克风104讲话,以控制移动电话102或控制通信耦合到移动电话102的其它电子装置。移 动电话102的麦克风104捕获用户的语音命令114以产生输入音频信号。在一些情形中, 移动电话102可最紧密接近单独媒体装置,例如,具备联网功能的电视(TV) 116或收音机 118。这些装置可产生充当关于移动电话102的操作的不想要的背景音频噪声的背景声音 120、122 〇
[0025]例如,具备网络功能的TV116或收音机118可正播放存储的或流式发射的音乐。 麦克风104可在背景声音由具备网络功能的TV116或收音机118产生的同时捕获来自用 户112的语音命令114。在这些情况下,来自具备网络功能的TV116或收音机118的声音 可显著干扰用户的语音命令114,且使会话或语音辨识对用户变得困难。各种实施例涉及抑 制输入音频信号的噪声分量。
[0026]移动电话102可抑制噪声信号,更具体地说,如果噪声信号的内容可识别。在一个 实施例中,移动电话102分析输入音频信号以确定输入音频信号是否具有可识别的内容, 例如,来自电视广播的特定歌曲或音频。例如,一个实施例通过提取输入音频信号的特征且 接着搜索、下载、流式发射或另外存取内容源来确定内容识别信息(例如,歌名、专辑名称、 艺术家姓名或类似者)。例如,参看图1,移动电话102可搜索内容数据库110以存取内容 源,其中基于匹配源识别信息来确定内容源。移动电话102能够存取内容源,可获得音频噪 声的副本("源信号"),其可用以特定地衰减或抑制对应于由媒体装置产生的声音的音频 噪声。
[0027]另外或替代地,移动电话102可直接或经由网络108与具备网络功能的TV116和 /或收音机118通信以识别内容源。例如,移动电话102可能能够请求(例如)来自具备网 络功能的TV116的信道信息,其中具备网络功能的TV116可通过使用其通信天线124来 通信。基于接收的信道信息,移动电话102可存取来自内容数据库110的内容源。作为另 一实例,移动电话102可存取来自正对具备网络功能的TV116广播媒体内容的装置(未图 示)的内容源,例如,通过调谐到识别的信道。作为又一实例,移动电话102可存取来自具 备网络功能的TV116的内容源。换句话说,具备网络功能的TV116可直接将内容源发射 或中继到移动电话102。
[0028] 现转到图2,展示经配置以抑制不想要的音频噪声的音频处理装置202的说明性 实施例的框图。音频处理装置202包含由总线214互连的处理器204、麦克风206、通信接口 208、数据存储装置210和存储器212。此外,存储器212可包含音频信号分析器模块216、 音频消除器模块218和通信模块212。音频处理装置202的实例包含任何可适用的电子装 置,例如,移动计算装置、蜂窝式电话、通用计算机和类似者。
[0029] 处理器204包含经配置以执行来自存储器212的指令且控制和操作麦克风206、 通信接口 208、数据存储装置210、存储器212和总线214的电路(例如,微处理器或微控制 器)。明确地说,处理器204可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理 器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。虽然在音频处理装置202 中仅展示了单一处理器,但在替代性配置中,可使用处理
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1