基于空间分析的麦克风阵列处理器的制造方法_2

文档序号:9619222阅读:来源:国知局
分析得到一时间-频率掩蔽,该 时间-频率掩蔽提高了对在空间上与所需源有所不同的干扰声音的抵抗力。
[0023] 作为背景目的,所描述的方法应用了先前应用到不同声道信号的空间分析方法。 例如,空间分析方法先前已被应用到多声道系统,其中输入包括不同声道信号以及它们的 空间位置(由格式角度确定)。在本发明的实施例中,使用多波束成形器将来自阵列中的换 能器(transducer)的输入信号分解成多个单独的波束信号并对每个接收的波束信号分配 一空间上下文(例如,方向向量)。
[0024] 下面描述的空间分析-合成方案是针对空间音频编码(SAC)和增强而开发的。该 分析得到所感觉到的声音事件的空间位置参数表示。在合成中,这些空间提示(spatial cue)被用于呈现输入场景的可信再现;或者可替换地,提示可以被修改来产生经过空间变 化的呈现。以下论述集中在用于将空间分析-合成应用到本发明的波束成形系统的重要概 念。
[0025] 空间提示
[0026] 在听觉定位的基本理论中,当同一信号从Μ个不同方向(带有不同的权重aj到 达听众时所感觉到的聚集方向由下式给出:
[0028] 其中,義"是指示Μ个信号方向的单位向量,下文称之为格式向量;对于各个方向 的归一化权重由信号权重α "根据下式给出:
[0030] 该所谓的Gerzon向量可以被容易地应用到多声道音频信号(例如,标准的五声道 音频格式)的定位,例如,当格式向量&对应于角度{-30°,30°,0°,-110°,110° }时。
[0031] 图1示出在收听环境中各个方向向量的应用。图1(a)示出用于标准的5声道音 频格式的向量。在图1(b)中,针对5声道信号(实线)示出如等式(1)和(2)所指定的 Gerzon向量(虚线);在图1(c)中,针对2个活动声道的Gerzon向量被示出;在图1(d)中, 相应的增强后的方向向量被示出。图1 (c)和1 (d)的曲线还示出Gerzon向量的多边形编 码轨迹(locus)。Gerzon方向向量、增强的方向向量以及用于空间分析的相关方法在题为 "Spatial Audio Coding Based on Universal Spatial Cues"的美国申请 No. 11/750, 300 中有更详细描述,该美国申请通过引用被结合于此。
[0032] 在具有中心听众并且声音事件的位置通过极坐标(r,Θ)被参数化的听圆周 (listening-circle)情形中,(其中,角度Θ是声音方向,半径r是其在圆周上的位置),r=1对应于一离散点源,r = 0对应于一无方向源,并且中间r值对应于圆周内的位置,例如 在越过(fly-over)或穿过(fly-through)声音事件中。给定一组信号(多声道音频信号) 和各自的格式向量(声道角度),等式(1)的Gerzon向量提供了对在该听圆周情形中感觉 到的声音事件的聚集角度Θ的可靠估计。但是,Gerzon向量由于其低估了 r而具有缺点, 之所以低估r是因为其大小受由格式向量火所限定的已记下的多边形所限制。以对具有两 个活动相邻声道的信号的大小低估为例,该编码轨迹在图1(c)中示出。对于这种成对摆动 的点源,所需结果(r = 1)在图1 (d)中示出。固有的Gerzon向量大小低估在2007年5月 17 日递交的题为"Spatial Audio Coding Based on Universal Spatial Cues" 的美国申 请No. 11/750,300中所描述的空间分析方法中本质上通过补偿性规模调整而得到解决,该 美国申请通过引用被结合于此。在该方法中,向量屋被分解成成对的并且无方向的(或零) 分量,并且增强的方向向量被表示如下:
[C
[0034] 其中,半径r基于成对零分解。
[0035] 具体讲,
[0037] 其中,矩阵Pu的列是两个包围|的格式向量爲和戶,,即,角度最靠近(在任一侧) 由f.给出的角度提示0的格式向量。半径r则是f在由这对相邻的格式向量爲.和為所限定 的基础上的扩展的系数之和。
[0038] 与本发明的各个波束成形系统实施例相关的关键思想在于:(1)方向向量3 (或g )给出一大概的聚集信号方向Θ ;以及(2)半径r本质上捕获到接收的信号从多个方向发 起的程度。本领域技术人员将理解,在二维情况下,方向向量$(或I)可以等同地使用坐 标(r,Θ )来表示。
[0039] 本发明的实施例通过形成多个被操纵的波束来针对波束成形情形调整该方案,所 述被操纵的波束本质上在由操纵角度所给出的各个方向上对该声音场景采样。在一个 实施例中,多波束成形和操纵是通过线性组合输入的麦克风信号xn [t]与进展延迟nm τ 3和 元素滤波3"[幻来执行的:
[0041] 在其他实施例中,使用替代方法来形成不同方向上的多个波束。在优选实施例中, an[t]被设计为实现波束图样中的频率不变性。在另一实施例中,可以使用简单的统一加权 an[t] = δ [t]来使得处理开销最小化。由处理采样率?3确立的单位延迟τ s导致波束成 形器操纵角度的离散化。对于线性阵列几何学,操纵角度由下式给出:
[0043] 其中,τ。是针对阵列中的空间上最靠近的元素的元素间行进时间。在优选实施例 中,使用线性阵列几何学,但是该方法也可以被应用到其他配置。
[0044] 根据本发明的一个实施例的增强波束成形系统的框图如图2所示。最初,传入麦 克风信号\(202)被接收,该信号\包含来自麦克风阵列的单独的换能器信号;这些传入麦 克风信号是时域信号,但是图中没有标注时间索引。如前所述,传入信号202可以包括所需 信号以及附加信号,例如来自不想要的源的干扰和回响,所有这些信号都被单独的换能器 (麦克风)所拾取和传输。在块204中,接收的信号被处理,以生成与多个被操纵的波束相对 应的波束信号。如图所示,Μ个波束信号bjt] (206)经由STFT (短时间傅立叶变换)208被 转换成时间-频率表示B"[k,1] (209);这些波束信号209随后被与它们的空间上下文(操 纵角度Φη(210)) -道提供到空间分析模块212。在替换实施例中,如本领域技术人员将理 解的,多波束成形和空间后处理通过在频域上实现多波束成形器而被集成。
[0045] 在空间分析模块212中,(r,Θ )提示(214)被从波束信号209和波束操纵方向 210导出。基准信号S[k,l] (216)优选地对应于在观看方向上操纵的波束,例如,其操纵角 度最靠近所需观看方向Θ。的B"[k,l] (209)。但是,在不同实施例中,基准信号可以由在多 波束成形器中生成的所有波束信号的和、单麦克风信号或由全通波束(具有统一的空间接 收性的波束)生成的信号来表示。为了从基准信号216生成输出信号219,在块218中应用 基于空间标准(提示)214的乘法性时间-频率掩蔽。一般而言,空间分析212被用来聚集 多个接收的信号以产生主导方向。基准信号(例如,基准观看方向波束)的空间选择性随 后通过在块218中应用时间-频率掩蔽所实现的过滤操作而得到增强,所述过滤是基于方 向提示214的。合成信号219随后在反向短时间傅立叶变换模块220中被处理,以生成增 强的时域输出信号222。
[0046] 在
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1