信号源分离的制作方法_2

文档序号:9278247阅读:来源:国知局
br>[0048] 该B.P.可以使用离散变量来实现(例如,量化到达方向为一组矢量)。离散因子 图可以使用硬件加速器实施,例如如在US2012/0317065A1"PROGRAMMABLEPROBABILITY PROCESSING"描述,其在此引入作为参考。
[0049] 因子图可以结合各种方面,包括结合到来估计的方向估计的源特性(例如,音调、 频谱等)的隐藏(潜在)变量。因子图跨越跨时间和频率的变量,从而改进到达估计的方 向,而这又提高了掩模的质量,从而可以减少诸如音乐噪声的伪像。
[0050] 因子图/B.P.计算可以托管在用于处理多个传声器输入的相同的信号处理芯片 上,从而提供了低功耗实施方式。低功率可使得电池操作的"打开传声器"的应用,诸如监 测触发字。
[0051] 在一些实现方式中,B.P.计算提供控制时域滤波器组的到达值的方向的预测估计 (例如,用米特拉陷波滤波器实现),从而提供所述信号路径上的低延迟(这对于诸如扬声 器电话的应用是希望的)。
[0052] 应用包括用于扬声器电话模式的信号处理,用于智能手机、助听器、汽车语音控 制、消费电子产品(例如,电视、微波炉)控制和其他通信或自动语音处理(例如,语音识 另1J)任务。
[0053] 一个或多个方面的优点可以包括以下内容。
[0054] 该方法可以利用间隔很近的传声器,以及不适于传统波束形成方法的其他配置。
[0055] 机器学习和概率图形建模技术可以提供高性能(例如,高级别的信号增强、输出 信号的语音识别准确度、虚拟辅助智能等)。
[0056] 该方法可降低自动语音识别的错误率,提高移动电话(智能电话)在扬声器电话 模式中的清晰度,提高在呼叫模式中的清晰度,和/或改进音频输入以口头唤醒。该方法还 可以启用智能传感器处理,用于设备环保意识。该方法可以特别定制用于由风噪声引起的 信号衰减。
[0057] 在其中远程从设备执行某些语音识别的客户端-服务器的语音识别架构中,该方 法可以较低的延迟改进自动语音识别(即在听筒中做更多,在空气中较少)。
[0058] 该方法可以被实现为非常低功率的音频处理器,它具有灵活的体系结构,其允许 例如软件的算法整合。该处理器可以包括用于先进算法的集成硬件加速器,例如,概率推理 引擎、低功率FFT、低延迟滤波器组、和梅尔频率倒谱系数(MFCC)计算模块。
[0059] 传声器的紧密间隔允许集成到非常小的封装,例如,5X6X3毫米。
[0060] 本发明的其它特征和优点从以下的描述以及权利要求是显而易见的。
【附图说明】
[0061] 图1是源分离系统的框图;
[0062] 图2A是智能电话应用的图;
[0063] 图2B是汽车应用的图;
[0064] 图3是到达计算的方向的框图;
[0065] 图4A-C是音频处理系统的图。
[0066] 图5是流程图。
【具体实施方式】
[0067]在一般情况下,本文描述的多个实施例针对接收音频信号(例如,获取声信号), 并处理该信号以从特定源分离出(例如,提取,识别)信号的问题,例如用于在通信系统上 通信所提取的音频信号(例如,电话网络)或使用基于计算机的分析处理的目的(例如,自 动语音识别和自然语言理解)。参照图2A-B,这些方法的应用可用于个人计算设备,诸如使 用传声器110采集和处理用户的语音信号的智能电话210,它具有多个元件112 (任选地包 括一种或多种其它多元件110A),或在处理驾驶员的语音信号的车辆250中。如下面进一步 描述地,传声器传递信号到模数转换器132,以及信号然后使用处理器212进行处理,它实 现信号处理单元120并利用推理处理器140,这可以使用处理器212实施,或在一些实施例 中可以至少部分实施在专用电路或在远程服务器220中。通常,来自关注源的所需信号和 其他干扰信号被嵌入在所获取的传声器信号中。干扰信号的示例包括来自其它扬声器的声 音信号和/或环境噪声,诸如车辆风声或道路噪声。在一般情况下,在此描述的信号分离方 法应被理解为在各种实施例中包括或实施对所接收或获取的声信号的信号增强、源分离、 降噪、非线性波束形成和/或其他修改。
[0068] 可用于从干扰信号分离所需源的信号的信息包括到达方向的信息,以及关注源的 信号和/或干扰信号的预期结构信息。到达方向的信息包括涉及在源和多个物理分离的声 学传感器(例如,传声器元件)的每个之间的信号传播时间上差异的相对相位或延迟信息。
[0069] 关于以下术语,术语"传声器"一般用于例如指测量某点的声音的理想化音响传感 器,以及指传声器的实际实施例,例如制造为微机电系统(MEMS),具有已通过声学端口耦合 到声学环境的移动微型机械隔膜(diaphram)的元件。当然,也可以使用其他的传声器技术 (例如,基于光学的声传感器)。
[0070] 作为简单的例子,如果两个传声器相距距离d,然后直接从源成90度到达它们之 间线路的信号将没有相对相位或延迟地接收,而从遥远的源以0 =45度到达的信号具有1 =dsin0的路径差,则传播时间之差为1/c,其中c是声音的速度(在20度的温度下,343 米/秒)。因此,相距d= 3mm的传声器和入射角0 =45度的相对延迟大约是(dsin0)/ c= 6ms,以及波长A对应于相位差(J) = 2JT1/A= (2Jrd/A)sin0。例如,对于分离d = 3mm以及波长A= 343mm(例如,1000赫兹信号的波长),相位差巾= 0.038弧度,或伞 =2. 2度。应当认识到:在随时间变化的输入信号中这样小的延迟或相位差的估计可导致 具有相对高的误差(估计噪声)的时间和频率的本地估计。注意:如果具有更大的分离,延 迟和相对相位增加,使得如果传声器元件相距d= 30mm而不是d= 3mm时,则在以上示例 中的相位差将是巾=22度,而不是巾=2.2度。然而,如下面所讨论地,紧密间隔可超过 更大相位差的传声器元件是有利的,其可以更容易地估计。还需要注意:在更高的频率(例 如,超声波),以45度角的入射角的lOOkHZ信号具有约巾= 220度,它可以甚至与广告为 3mm传感器分离更可靠的估计的相位差。
[0071] 如果到达方向具有两个自由度(例如,方位角和仰角),那么需要三个传声器以确 定到达方向(理论上在两个图像的一个内,一个在传声器的平面的两侧中的任一侧)。
[0072] 应当理解:在实践中,在多个传声器接收的信号的相对相位不一定遵循上面概述 的类型的理想化模型。因此,当在本文中使用术语"到达方向信息"时,应广义地理解为包括 体现从源位置到多个传声器元件的信号路径的差异之间的信息,即使不按照上述引入的简 化模型。例如,如下文参照至少一个实施例所讨论地,到达方向信息可以包括相对相位的图 案,其是特定源在特定位置相对于传声器的签名,即使该模式不遵循简化的信号传播模型。 例如,从源到传声器的声学路径可能受到如下影响:声端口的形状、端口在设备的面上的凹 陷(例如,智能电话的面板)、设备主体的闭塞(例如,设备后面的源)、源的距离、反射(例 如,从房间壁)以及声音传播领域的技术人员将认识到的其他因素。
[0073] 用于信号分离的另一个信息来源来自关注信号的结构和/或干扰源的结构。例 如在系统的操作期间,该结构可以基于源的声音产生方面的理解已知和/或可以根据经验 确定。语音源的结构的例子可包括方面:诸如在有声语音中由于周期激励的谐波频谱结构 的存在,在擦音和爆破音期间的宽带噪声状激励,以及具有特定像言语特性的频谱包络,例 如具有特征共振(即共振)峰。语音源也可具有时间结构,例如,根据语音的详细语音内容 (即,特定单词口语的声学语音结构),或更一般地更粗的性质,包括声学口语的节奏和特 性定时以及语音结构。非语音声源还可以具有公知的结构。在汽车的示例中,道路噪声可 以具有特征光谱形状,其可以是驱动条件的函数,诸如转速,或暴雨期间的雨刷可具有特性 的周期性性质。可凭经验推断的结构可以包括扬声器的特定光谱特性(例如,关注的扬声 器或干扰扬声器的音调或整体光谱分布)或干扰噪声源的光谱特性(例如,室内的空气调 节单元)。
[0074] 下面的一些实施例使用相对紧密间隔的传声器(例如,d彡3mm)。这种紧密的间 距可产生到达方向的相对不可靠的估算,作为时间和频率的函数。该到达方向的信息可不 单独足够用于根据其到达方向分离期望信号。信号的结构信息也可不单独足够用于根据它 的结构或干扰信号的结构分离期望信号。
[0075] -些实施例联合使用到达方向信息和声音结构信息用于源分离。虽然方向信息和 结构信息都不单独足以足够好的源分离,它们的协同作用提供了非常有效的源分离方法。 这种组合方法的优点在于:不一定需要远隔(例如,30_)的传声器,因此可以使用具有多 个密切相隔(例如,1.5_,2. 5mm,3mm间距)集成传声器元件的集成设备。作为例子,在智 能手机应用中,利用集成紧密间隔传声器元件可避免需要多个传声器和用于智能手机的屏 面的声学端口的对应开口,例如在设备的最远角落或者在车辆中应用中,可使用在顶篷或 后视镜的单个传声器位置。当多个独立传声器分别安装在系统中时,减少传声器位置的数 量(每个都具有多个传声器元件的传声器设备的位置)可以减少互连电路的复杂性,并能 提供传声器元件之间可预测的几何关系和难以实现的匹配机械和电特性。
[0076] 参照图1,音频处理系统100的实施例使用上方所引入的技术的组合。具体而言, 该系统使用多元件传声器110,其感测在多个非常紧密间隔(例如,在毫米范围)的点的声 信号。示意性地,每个传声器元件112a_d经由声学端口 112a_d感测声场,使得每个元件感 测在不同位置的声场(任选以及或代替基于端口的物理结构的不同方向特性)。在图1的 示意图中,传声器元件示于线性阵列,但当然元件的其它平面或三维布置也是有用的。
[0077] 该系统还使用推理系统136,例如使用置信传播,其例如根据时间和频率识别在一 个或多个传声器元件接收到的信号的分量,以从其他干扰信号分离期望的声源的信号。请 注意:在下面的讨论中,从紧密间隔的传声器接收多个信号和分离信号的方法一起描述,但 它们可以彼此独立地使用,例如,使用具有更广泛隔开的推理组件,或具有多个紧密间隔元 件的传声器使用不同的方法来确定所需组件的时间-频率图。此外
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1