从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置与流程

文档序号:11216448阅读:454来源:国知局
从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置与流程

本申请是申请号为201380016236.8、申请日为2013年3月20日、发明名称为“从高阶立体混响声音频信号解码立体声扬声器信号的方法和装置”的发明专利申请的分案申请。

本发明涉及一种用于使用用于采样圆上的点的平移函数从高阶立体混响声(ambisonics)音频信号解码立体声扬声器信号的方法和装置。



背景技术:

立体声扬声器或耳机设置的立体混响声表示的解码被称为一阶立体混响声,例如根据可以从xiphwiki-ambisonicshttp://wiki.xiph.org/index.php/ambisonics#default_channel_conversions_from_b-format获得的j.s.bamford、j.vender-kooy的《ambisonicsoundforus》(audioengineeringsocietypreprints,conventionpaper4138presentedatthe99thconvention,1995年10月,纽约)中的等式(10)。这些方式基于在英国专利394325中公开的blumlein立体声。另一方式使用模式匹配:m.a.poletti的《three-dimensionalsurroundsoundsystemsbasedonsphericalharmonics》(j.audioeng.soc.,卷53(11),第1004-1025页,2005年11月)。



技术实现要素:

这种一阶立体混响声方式要么具有与基于具有八图案(figure-of-eightpatterns)的虚拟扬声器的blumlein立体声(gb394325)的立体混响声解码器一样的高负旁瓣(参见s.weinzierl的《handbuchderaudiotechnik》(springer,柏林,2008年)中的第3.3.4.1节),要么具有前方向上的较差定位。例如,使用负旁瓣,来自右后方向上的声音对象在左立体声扬声器上再现。

本发明要解决的一个问题是提供使用改进的立体声信号输出解码的立体混响声信号。该问题通过权利要求1和2中公开的方法解决。在权利要求3中公开利用这些方法的装置。

本发明描述用于更高阶立体混响声hoa音频信号的立体声解码器的处理。期望平移函数可以从扬声器之间的虚拟源的位移的平移定律而推导。对于每一个扬声器,定义全部可能的输入方向的期望平移函数。类似于j.m.batke、f.keiler的《usingvbap-derivedpanningfunctionsfor3dambisonicsdecoding》(proc.ofthe2ndinternationalsymposiumonambisonicsandsphericalacoustics,2010年5月6-7日,巴黎,法国,urlhttp://ambisonics10.ircam.fr/drupal/files/proceedings/presentations/o14_47.pdf)和wo2011/117399a1的对应描述而计算立体混响声解码矩阵。平移函数通过圆形谐波函数近似,并且随着立体混响声阶增大,以减小的误差匹配期望平移函数。具体地,对于在扬声器之间的前面区域,可以使用如正切定律或向量基幅度平移(vbap)的平移定律。对于超过扬声器位置的向后方向,使用具有来自这些方向的声音的轻微衰减的平移函数。

特殊情况是使用指向后方向的扬声器方向的心形图案的一半。

在本发明中,尤其在前面区域中利用更高阶立体混响声的更高空间分辨率,并且后方向中的负旁瓣的衰减随着立体混响声阶增大而增大。本发明还可以用于具有多于两个被放置在半圆上的或小于半圆的圆的分段上的扬声器的扬声器设置。其还便于其中一些空间区域接收更多衰减的立体声的更艺术的缩混。这有益于创建使得对话能够更清晰易懂的改进的直接声音与漫音比(direct-sound-to-diffuse-soundratio)。

根据本发明的立体声解码器满足一些重要属性:在扬声器之间的前方向上的良好定位,在得到的平移函数中仅存在较小负旁瓣,以及后方向的轻微衰减。其还使能当聆听双通道版本时可能在其他情况下被视为干扰或令人分心的空间区域的衰减或屏蔽。

与wo2011/117399a1相比,逐个圆形分段地定义期望平移函数,并且在扬声器位置之间的前面区域,可以使用公知的平移处理(例如,vbap或正切定律),同时后方向可以轻微衰减。当使用一阶立体混响声解码器时这种属性是不可行的。

原则上,本发明方法适用于从更高阶立体混响声音频信号a(t)解码立体声扬声器信号l(t),所述方法包括下列步骤:

-从左和右扬声器的方位角值和从圆上的虚拟采样点的数目s计算包含全部虚拟采样点的期望平移函数的矩阵g,

其中以及gl(φ)和gr(φ)元素是s个不同采样点的平移函数;

-确定所述立体混响声音频信号a(t)的阶n;

-从所述数目s和从所述阶n计算模式矩阵ξ和所述模式矩阵ξ的对应伪逆ξ+,其中ξ=[y*(φ1),y*(φ2),...,y*(φs)]和是所述立体混响声音频信号a(t)的圆形谐波向量y(φ)=[y-n(φ),...,y0(φ),...,yn(φ)]t的复数共轭,并且ym(φ)是圆形谐波函数;

-从所述矩阵g和ξ+计算解码矩阵d=gξ+

-计算扬声器信号l(t)=da(t)。

原则上,本发明方法适用于确定可以用于从2d更高阶立体混响声音频信号a(t)解码立体声扬声器信号l(t)=da(t)的解码矩阵d,所述方法包括下列步骤:

-接收所述立体混响声音频信号a(t)的阶n;

-从左和右扬声器的期望方位角值(φl,φr)和从圆上的虚拟采样点的数目s计算包含全部虚拟采样点的期望平移函数的矩阵g,

其中以及gl(φ)和gr(φ)元素是s个不同采样点的平移函数;

-从所述数目s和从所述阶n计算模式矩阵ξ和所述模式矩阵ξ的对应伪逆ξ+,其中ξ=[y*(φ1),y*(φ2),...,y*(φs)]和是所述立体混响声音频信号a(t)的圆形谐波向量y(φ)=[y-n(φ),...,y0(φ),...,yn(φ)]t的复数共轭,并且ym(φ)是圆形谐波函数;

-从所述矩阵g和ξ+计算解码矩阵d=gξ+

原则上,本发明装置适用于从更高阶立体混响声音频信号a(t)解码立体声扬声器信号l(t),所述装置包括:

-被适配用于从左和右扬声器的方位角值和从圆上的虚拟采样点的数目s计算包含全部虚拟采样点的期望平移函数的矩阵g的部件,

其中以及gl(φ)和gr(φ)元素是s个不同采样点的平移函数;

-被适配用于确定所述立体混响声音频信号a(t)的阶n的部件;

-被适配用于从所述数目s和从所述阶n计算模式矩阵ξ和所述模式矩阵ξ的对应伪逆ξ+的部件,其中ξ=[y*(φ1),y*(φ2),...,y*(φs)]和是所述立体混响声音频信号a(t)的圆形谐波向量y(φ)=[y-n(φ),...,y0(φ),...,yn(φ)]t的复数共轭,并且ym(φ)是圆形谐波函数;

-被适配用于从所述矩阵g和ξ+计算解码矩阵d=gξ+的部件;

-被适配用于计算扬声器信号l(t)=da(t)的部件。

在相应的从属权利要求中公开本发明的有利的更多的实施例。

附图说明

参考附图描述本发明的示例实施例,其示出:

图1是期望平移函数,扬声器位置φl=30°,φr=-30°;

图2是作为极坐标图的期望平移函数,扬声器位置φl=30°,φr=-30°;

图3是n=4得到的平移函数,扬声器位置φl=30°,φr=-30°;

图4是作为极坐标图的n=4得到的期望平移函数,扬声器位置φl=30°,φr=-30°;

图5是根据本发明的处理的框图。

具体实施方式

在解码处理的第一步骤中,必须定义扬声器的位置。扬声器被假设为具有离聆听位置相同的距离,借此扬声器位置由它们的方位角定义。方位由φ表示并且逆时针地测量。左和右扬声器的方位角为φl和φr,并且在对称设置中φr=-φl。在下列描述中,全部角度值可以使用2π(弧度)或360°的整数倍的偏移解释。

要定义圆上的虚拟采样点。这些是在立体混响声解码处理中使用的虚拟源方向,并且对于这些方向,定义例如两个真实扬声器位置的期望平移函数值。虚拟采样点的数目由s表示,并且对应的方向围绕圆均匀分布,使得

s应大于2n+1,其中n表示立体混响声阶。实验示出有利的值为s=8n。

必须定义左和右扬声器的期望平移函数gl(φ)和gr(φ)。与来自wo2011/117399a1和上述batke/keiler的文章的方式相比,对于多个分段定义平移函数,其中对于多个分段使用不同的平移函数。例如,对于期望平移函数,使用三个分段:

a)对于两个扬声器之间的前方向,使用公知的平移定律,例如正切定律或等价地如在v.pulkki的《virtualsoundsourcepositioningusingvectorbaseamplitudepanning》(j.audioeng.society,45(6),第456–466页,1997年6月)中描述的向量基幅度平移(vbap)。

b)对于超过扬声器圆部分位置的方向,定义后方向的轻微衰减,借此平移函数的该部分在大约与扬声器位置相对的角度处逼近值零。

c)期望平移函数的剩余部分被设置为0,以便避免来自左扬声器上的右边的声音和来自右扬声器上的左边的声音的再现。

其中对于左扬声器由φl,0并且对于右扬声器由φr,0定义其中期望平移函数达到0的点和角度值。对于左和右扬声器,期望平移函数可以被表示为:

平移函数gl,1(φ)和gr,1(φ)定义扬声器位置之间的平移定律,而平移函数gl,2(φ)和gr,2(φ)通常定义向后方向的衰减。在交叉点处,应满足下列属性:

gl,2(φl)=gl,1(φl)(4)

gl,2(φl,0)=0(5)

gr,2(φr)=gr,1(φr)(6)

gr,2(φr,0)=0(7)

期望平移函数在虚拟采样点处采样。包含全部虚拟采样点的期望平移函数值的矩阵定义如下:

实数值或复数值立体混响声圆形谐波函数为ym(φ),其中m=-n,...,n,其中n为上述立体混响声阶。由球形谐波的方位相关部分表示圆形谐波,参见earlg.williams的《fourieracoustics》(appliedmathematicalsciences的卷93,academicpress,1999年)。

使用实数值圆形谐波

圆形谐波函数通常定义如下

其中和nm是取决于使用的归一化方案的缩放因子。

圆形谐波被组合在如下向量中组合

y(φ)=[y-n(φ),...,y0(φ),...,yn(φ)]t(11)

由(·)*表示的复数共轭,得到

虚拟采样点的模式矩阵定义如下

ξ=[y*(φ1),y*(φ2),...,y*(φs)](13)

得到的2d解码矩阵计算如下

d=gξ+(14)

其中ξ+矩阵ξ的伪逆。对于如在等式(1)中给出的均匀分布虚拟采样点,可以由作为ξ的伴随矩阵(转置和复数共轭)的ξh的缩放版本替换伪逆。在该情况下,解码矩阵为

d=αgξh(15)

其中缩放系数α取决于圆形谐波的归一化方案和设计方向的数目s。

表示时间实例t的扬声器采样信号的向量l(t)计算如下

l(t)=da(t)(16)

当使用3维更高阶立体混响声信号a(t)作为输入信号时,应用对2维空间的适当转换,得到转换后的立体混响声系数a’(t)。在该情况下,等式(16)被改变为l(t)=da(t)。

还可以定义矩阵d3d,其已经包括3d/2d转换并且被直接应用于3d立体混响声信号a(t)。

在下文中,描述立体声扬声器设置的平移函数的示例。在扬声器位置之间,使用根据等式(2)和等式(3)的平移函数gl,1(φ)和gr,1(φ)以及根据vbap的平移增益。这些平移函数通过其最大值在扬声器处的心形图案的一半继续。定义角度φl,0和φr,0,以便具有相对于扬声器位置的位置:

φl,0=φl+π(17)

φr,0=φr+π(18)

归一化平移增益满足gl,1(φl)=1和gr,1(φr)=1。指向φl和φr的心形图案定义如下:

对于解码的评估,得到的任意输入方向的平移函数可以如下获得

w=dγ(21)

其中υ为考虑的输入方向的模式矩阵。w为包含当应用立体混响声解码处理时使用的输入方向和使用的扬声器位置的平移加权的矩阵。

图1和图2分别描绘期望(即理论或完美)平移函数增益对线性角度刻度以及以极坐标图格式的增益。对于使用的输入方向,使用等式(21)计算得到的立体混响声解码的平移加权。图3和图4分别示出对于立体混响声阶n=4计算的对应的得到的平移函数对线性角度刻度以及以极坐标图格式的增益。

图3/4与图1/2的对比示出期望平移函数匹配良好并且得到的负旁瓣非常小。

在下文中,对于复数值球形和圆形谐波提供3d到2d转换的示例(对于实数值基础函数,其可以以类似方式进行)。3d立体混响声的球形谐波为:

其中n=0,…,n为阶索引,m=-n,…,n为度数索引,mn,m为取决于归一化方案的归一化因子,θ为倾角,并且为相关联的legendre函数。在对于3d情况给出立体混响声系数的情况下,2d系数计算如下

其中缩放因子

图5中,用于计算期望平移函数的步骤或阶段51接收左和右扬声器的方位角φl和φr的值以及虚拟采样点的数目s,并且如上所述从其计算包含全部虚拟采样点的期望平移函数值的矩阵g。在步骤/阶段52中从立体混响声信号a(t)推导阶n。在步骤/阶段53中基于等式11到13从s和n计算模式矩阵ξ。

步骤或阶段54计算矩阵ξ的伪逆ξ+。在步骤/阶段55中根据等式15从矩阵g和ξ+计算解码矩阵d。在步骤/阶段56中,使用解码矩阵d从立体混响声信号a(t)计算扬声器信号l(t)。在立体混响声输入信号a(t)为三维空间信号的情况下,可以在步骤或阶段57中进行3d到2d转换,并且步骤/阶段56接收2d立体混响声信号a’(t)。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1