空间音频装置的制造方法_5

文档序号:9476595阅读:来源:国知局
的延迟和求和波束成形器。在更新之后,通过应用W1C1-W1C1/| |W1CJ |将每个空间协方差矩阵 缩放成单位弗罗宾尼斯范数。
[0243] 经由对
求偏导来获得空间协方差矩阵W1C]的更新规则,得到:
[0245] 将上面的导数设置为零,使用来自Sawada等人对其的定义代入τ 1]kc]得到下面的 更新:
[0247] 其中,是相比于W1C]的实际所需更新而言具有经修改的相位延迟的初步更新。 由于在
中定义的缩放,可以无视上面的更新中的除 数,并且使用其定义
代入C1]kci,上面 的更新可以被修改为下面的乘法更新:
[0249] 在某些实施例中,复数非负矩阵因式分解器105可以被配置为通过应用以下来生 成I。的更新
[0251] 其仅更新波束成形内核的量值部分,并且因而更新源的空间协方差矩阵的量值。
[0252] 特别在最高频率处对W1C]的更新可以产生非半正定的矩阵,并且对角线处的负值 等于并不期望的有负号的量值模型。因此,在某些实施例中,复数非负矩阵因式分解器105 可以被配置为:通过应用特征值分解Wlc= VDVH和将具有负特征值的特征分量设置为零而 强制施行半正定波束内核矩阵,由:β.表示。
[0253] 更新波束内核的最后阶段被给出为:
[0255] 可以关于图7示出波束成形器和复数非负矩阵因式分解器105的操作的总结。
[0256] 首先,复数非负矩阵因式分解器105被配置为接收空间协方差矩阵。
[0257] 此外,复数非负矩阵因式分解器105被配置为利用均匀分布在零和一之间的随机 值对zk。,tik和V k.j进行初始化。
[0258] 利用均勾分布在零和一之间的随机值对zk。,tik和v k_j进行的初始化在图7中由步 骤601示出。
[0259] 波束成形器 107 被配置为根据[WicJ nm= W nm (f,k。)| = exp (j2 Jr f τ nm (k。)),
对I。进行初始化,并且应用
[0260] 对I。进行的初始化在图7中由步骤602示出。
[0261] 复数非负矩阵因式分解器105被进一步配置为根据
丨重新计算 量值模型i域。
[0262] 对量值模型元进行评估的操作在图7中由步骤603示出。
[0263] 复数非负矩阵因式分解器105被进一步配置为根据
更新tik。
[0264] 更新tlk的操作在图7中由步骤604示出。
[0265] 复数非负矩阵因式分解器105被进一步配置为根据
.重新计算 量值模型$_访。
[0266] 重新计算量值模型私/的操作在图7中由步骤605示出。
[0267] 复数非负矩阵因式分解器105被进一步配置为根据
[0268] 更新vkj的操作在图7中由步骤606示出。
[0269] 复数非负矩阵因式分解器105被进一步配置为:如在
中指定的那样针对单位I2范式来缩放V k]以及通过 重新缩放tlk来进行补偿。
[0270] 缩放vkj和t lk的操作在图7中由步骤607示出。
[0271] 复数非负矩阵因式分解器105被进一步配置为根据
重新计 算量值模型
[0272] 重新计算秦以的操作在图7中由步骤608示出。
[0273] 复数非负矩阵因式分解器105被进一步配置为根据
[0274] 更新zk。的操作在图7中由步骤609示出。
[0275] 复数非负矩阵因式分解器105被进一步配置为:如在
中指定的那样针对I2范式来缩放Z kc]以及通过 重新缩放tlk来进行补偿。
[0276] 缩放zk。和t lk的操作在图7中由步骤610示出。
[0277] 复数非负矩阵因式分解器105被进一步配置为根据
重新计 算量值模型
[0278] 重新计算途的操作在图7中由步骤611示出。
[0279] 复数非负矩阵因式分解器105被进一步配置为根据
[0280] 更新I。的操作在图7中由步骤612示出。
[0281] 复数非负矩阵因式分解器105被进一步配置为:通过'将W1C]强制 施行为半正定的,并且应用
[0282] 将^。强制施行为半正定的操作在图7中由步骤613示出。
[0283] 复数非负矩阵因式分解器105被进一步配置为重复步骤603到613达预定数量的 迭代,或者直到参数更新收敛并且在各个更新之间不显著改变为止。
[0284] 实施循环跳回步骤603的操作在图7中由步骤614示出。
[0285] 此外,在某些实施例中,复数非负矩阵因式分解器105被进一步配置为输出模型 参数。
[0286] 模型参数tlk、vkj、zk。和W 1C]的生成或输出在图7中由步骤615示出。
[0287] 在某些实施例中,模型参数被输出给分离器109。
[0288] 利用波束内核实施复数非负矩阵因式分解的操作在图3中由步骤307示出。
[0289] 在某些实施例中,所述装置包括分离器109。分离器109在某些实施例中被配置为 接收CNMF分量和阵列输入,以及将音频信号分离为各个源。
[0290] 针对真实声学源的分离因此需要对先前被解译为各个源的已进行复值非负矩阵 因式分解(CNMF)的分量进行聚类。换句话说,采用CNMF分量的固定频谱基带并将其进行 限制以便仅对真实源的一些部分进行建模。从源自于同一源的CNMF分量共享由空间权重 zk。确定的非常类似的空间协方差属性。这在图8中示出,其中示出了目标源1:Q 701空间 响应702被体现于阵列703,该空间响应702如在本文中描述的那样被因式分解为NMF分量 705,该NMF分量705被进行估计和聚类706以便生成经估计或重构的源1 :Q 707。在某些 实施例中,聚类是基于空间权重相似性,并且分离的聚类算法可用于解决CNMF分量与实际 声学源映射的关联。
[0291] 在下面的示例中,对空间权重zkc]应用的k均值聚类被用于测试和评估分离质量。 在所述实施例中,分离器109被配置为使得每个zk,:充当特征向量,并且在以下情况下应用 k均值聚类:所需聚类计数等于原始声音源的总数Q。在所述实施例中,根据k均值聚类,满 足分量k属于源q的聚类判定,并且该聚类判定由二元参数bqk表示。单一源量值声谱图的 CNMF量值模型然后可被定义为:
[0293] 应当理解,在某些实施例中,任何其它聚类算法或CNMF分量向源的链接策略均可 以用于估计二元或软判定bqk,并且选择使用被应用于空间权重的k均值聚类是用于说明 DoA分析和所提出的实施例的建模性能的示例。
[0294] 在某些实施例中,来自CNMF参数的其它特征(诸如频谱相似性和随时间改变的增 益表现)可以并行地用于将CNMF分量关联到源。
[0295] 分离器109在某些实施例中被配置为将经聚类的源输出给空间合成器111。
[0296] 将源分离成聚类的操作在图3中由步骤309示出。
[0297] 在某些实施例中,所述装置包括空间合成器111。空间合成器111被配置为接收经 聚类的源参数以便再生源信号。在某些实施例中,源信号的重构采用维纳滤波器。在所述 实施例中,利用CNMF分量聚类判定bkk将源重构滤波给出为:
[0299] 其中,yljq现在担任真实声学源。从逆STFT(iSTFT)获得时域源。
[0300] 关于图9,示出了根据某些实施例的示例空间合成器111。此外,关于图10,示出了 图9中所示的空间合成器的操作。
[0301] 在某些实施例中,空间合成器111包括逆短时傅立叶变换器(iSTFT)801,该逆短 时傅立叶变换器801被配置为对由分离器109输出的经聚类的CNMF参数应用逆短时傅立 叶变换。
[0302] 已进行逆短时傅立叶变换的参数在某些实施例中被输出给头部相关脉冲响应 (HRIR)滤波器 8〇3。
[0303] 对经聚类的CNMF参数应用iSTFT的操作在图10中由步骤901示出。
[0304] 在某些实施例中,所述装置包括HRIR滤波器803,该HRIR滤波器803被配置为接 收iSTFT经聚类的CNMF参数。
[0305] 此外,在某些实施例中,HRIR滤波器803被配置为接收原始STFT观察量Xl j,并根 据CNMF量值模型参数构造维纳滤波器,以便在STFT域中过滤出源频谱详情。源重构滤波 在某些实施例中被给出为:
[0307] 其中,y1]k是如由阵列所见的经估计的源信号(换句话说,已与其空间脉冲响应进 行了卷积,并且Xl]是由阵列捕获的混合信号的STFT)。
[0308] 在某些实施例中从iSTFT 801获得时域信号。
[0309] 在某些实施例中,HRIR滤波器803被配置为将由具有最高功率的波束确定的方向 选作占优势的源方向,以及关联于该方向的单一 HRTF滤波器被使用。
[0310] 在某些实施例中,可以采用其它双声道空间合成方案,例如在HRIR滤波阶段对每 个源使用若干占优势的方向。
[0311] 在某些实施例中,空间合成器111包括HRTF数据库,所述HRTF数据库被配置为存 储被检索的HRIR滤波器分量。
[0312] 从HRTF数据库检索HRIR滤波器分量的操作在图10中由步骤902示出。
[0313] 在下面的示例中,用非正式测试来确定双声道合成精度,因为源定位被确定为类 似于源的实际定位。
[0314] 在图11中给出了通过模型分析的空间权重的一个示例。原始位置为具有零仰角 的〇度和90度,这可以从所分析的权重中清楚地看出,其中,所分析的权重产生了良好的分 离和使用双声道合成方案的精确空间合成。
[0315] 在某些实施例中,针对每个CNMF分量的各个空间协方差被解译为单一源的方向, 并且CNMF分量可直接用于空间合成。在其中仅期望3D声音合成的情况下,不需要任何分 离阶段,但利用以上定义的空间声场合成方法之一,每个CNMF分量被单独地合成,并且它 们被定位到其经分析的空间位置。
[0316] 在某些实施例中,使用关联的空间权重来确定哪些HRTF以头部相关脉冲响应 (HRIR)的形式被用于对经分离的源进行滤波。这模拟了通过双声道线索进行的源定位,其 中,所述双声道线索例如是到达时间差和由耳廓导致的与方向相关的频率滤波器。
[0317] HRIR滤波的操作在图10中由903示出。
[0318] 在某些实施例中,HRIR滤波器被配置为将经滤波的分量输出给组合器805。
[0319] 在某些实施例中,空间合成器111包括组合器805,该组合器805被配置为对HRIR 滤波器源进行求和或组合。换句话说,在某些实施例中,在对每个源利用其关联的与方向相 关的双声道滤波器(HRIR)来进行滤波之后,全部各个源被求和到一起以形成双声道合成 信号。
[0320] 对滤波器源进行组合(求和)的操作在图10中由步骤905示出。
[0321] 应当理解,可以使用基于已知源信号及其多维度源定位的任何其它空间声场合成 技术。例如,在某些实施例中,可经由矢量基幅值相移来实施空间声场合成。
[0322] 对输出量(例如双声道立体声输出)进行输出的操作在图3(和图9)中由步骤 313示出。
[0323] 在某些实施例中,可以对方向权重zk。强制施行稀疏,这可以用于引导算 法找出具有点状本质并且不包括具有混响形式的环境内容的源的空间协方差。在 某些实施例中,这可以用于减少经分离的源之间的串话。在所述实施例中,在
中规定的zk。的1 2范数缩放被定义为使得可以 使用稀疏代价ΣρΖ??。。
[0324] 此外,在某些实施例中,可以直接估计CNMF分量与源的关联。在所述实施例中,聚 类判定bqk是可以包括在模型中的非负参数,并且可以获得基于求偏导的更新规则。在这些 实施例中,关于每个真实声学声源对SCM进行估计,并且与所呈现的模型类似,维持了使用 DSBF的频率依赖性。
[0325] 下面通过将实施例的结果与适于具有合理量混响的小型扩音器阵列捕获的特定 情况的常规BSS方法进行比较,说明了某些实施例的分离性能。通过诸如由BSS评估工具 箱提供的分离质量度量、信号失真比(SDR)、图像空间失真比(ISR)、信干比(SIR)和信伪比 (SAR)来确定分离性能。
[0326] 在下面的示例中,使用从各个方向在规则会议室中记录的脉冲响应来实施分离评 估。使用最大长度序列(MLS)方法和使用针对MLS激发的Genelec 1029A扬声器来获得每 个源位置对扩音器阵列的脉冲响应。将无回声测试采样与脉冲响应进行卷积并且求和到一 起以模拟同时捕获的源。所使用的采样频率为48kHz,房间尺寸大约为5x
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1