对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置的制造方法

文档序号:9423299阅读:793来源:国知局
对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置的制造方法
【技术领域】
[0001] 本发明设及通过有区别地处理定向和环境信号分量对更高阶高保真度立体声响 复制表示进行压缩和解压缩的方法和装置。
【背景技术】
[0002] 更高阶高保真度立体声响复制(HOA)连同像波长合成(WF巧运样的其他技术或者 像22. 2运样的基于信道的方法一起提供表示=维声音的一种可能性。然而,相对于基于信 道的方法,HOA表示提供独立于具体扬声器设置的优点。然而,运个灵活性WHOA表示在特 殊的扬声器设置上回放所必需的解码处理为代价。与必需的扬声器的数量通常非常大的 WK方法相比,HOA还可W被呈现给包括仅几个扬声器的设置。HOA的另外的优点在于,对 于到头戴耳机的双耳呈现,也可W使用相同的表示而不用做任何修改。
[0003] HOA基于按照截断的球谐(S地erical Harmonics, SH)扩展的复谐平面波 (complex harmonic plane wave)幅度的空间密度的表示。每个扩展系数是角频率的函数, 其可W由时域函数等同地表示。因此,在不失一般性的情况下,完整的HOA声场表示实际上 可W被假设为包括0个时域函数,其中0标记扩展系数的数量。运些时域函数将等同地被 称作HOA系数序列或者称作HOA信道。
[0004]HOA表示的空间分辨率随着扩展的最大阶N的增长而提高。不幸地,扩展系数的数 量0随着阶N二次方地增长,具体地,0= (N+1)2。例如,使用阶N= 4的典型的HOA表示 需要0 = 25个HOA(扩展)系数。根据先前做出的考虑,给定期望的单信道采样率fs和每 个样本的位数Nb,用于传输册A表示的总比特率由0 ?fs?Nb确定。因此,WfS= 48曲Z的 采样率并且使用每个样本Nb= 16位来传输阶N= 4的HOA表示导致19. 2MBits/s的比特 率,运对于许多实际的应用(例如对于流传输)非常高。
[0005]HOA声场表示的压缩在专利申请EP12306569. 0和EP12305537. 8中提出。代 替单独地对HOA系数序列中的每一个进行感知编码,例如像在E.化lleriKl、I.Burnett、 A.Solvang和U.P.Svensson的"EncodingHi曲erOrderAmbisonicswithAAC"(第 124 届AES会议,阿姆斯特丹,2008年)中执行的那样,具体通过执行声场分析并且将给定的 HOA表示分解成定向和残余环境分量来试图减少被感知编码的信号的数量。定向分量通常 应当由可W被视为一般平面波函数的少量的支配定向信号来表示。残余环境HOA分量的阶 减小,因为假设在提取支配定向信号之后,更低阶的HOA系数承载大部分相关信息。

【发明内容】

[000引总么通过运样的操作,要被感知编码的册A系数序列的初始数量(N+1) 2被减少 至固定数量的D个支配定向信号W及表示具有截断的阶Nued<N的残余环境HOA分量的数 量(ru+i)2个册A系数序列,从而要编码的信号的数量是固定的,亦即D+(Nued+1)2。特别 地,该数量独立于在时帖(time化ame)k中的活动的支配(dominant)定向声源的实际检测 到的数量DactOO《D。运意味着,在时帖k中,其中活动的支配定向声源的实际检测到的数 量DactOO小于定向信号的最大允许数量D,要被感知编码的支配定向信号中的一些或者甚 至是全部为零。最后,运意味着运些信道根本不用于捕捉声场的相关信息。
[0007] 在该背景下,EP12306569. 0和EP12305537. 8会议录中的另外可能的弱点是用 于在每个时帖中确定活动的支配定向信号的数量的标准,因为不试图确定关于声场的相继 感知编码的活动的支配定向信号的最佳数量。例如,在EP12305537.8中,使用简单的功 率标准,也就是通过确定属于最大特征值的系数间相关矩阵的子空间的维度,来估计支配 声源的量。在EP12306569.0中,提出对支配定向声源的递增检测,其中如果来自各自方向 的平面波函数的功率关于第一定向信号足够高,则定向声源被认为是支配的。使用像在EP 12306569. 0和EP12305537. 8中那样的基于功率的标准可能导致关于声场的感知编码是 次优的定向环境分解(directional-ambientdecomposition)。
[0008] 本发明所要解决的问题是通过对当前的HOA音频信号内容确定如何分配到预先 确定的减少数量的信道、定向信号W及环境HOA分量的系数来改进HOA压缩。该问题由在 权利要求1和3中公开的方法来解决。使用运些方法的装置在权利要求2和4中公开。
[0009] 本发明在两个方面改进在EP12306569.0中提出的压缩处理。第一,更好地利用 由将被感知编码的给定数量的信道提供的带宽。在没有检测到支配声源信号的时帖中,最 初被保留用于支配定向信号的信道被用于W残余环境HOA分量的另外的HOA系数序列的形 式来捕捉关于环境分量的另外的信息。第二,考虑到利用给定数量的信道对给定HOA声场 表示进行感知编码的目标,关于该目的,适配用于确定要从HOA表示中提取的定向信号的 量的标准。确定定向信号的数量,使得经解码和重构的HOA表示提供最低的感知误差。该 标准比较由提取定向信号并且使用更少的HOA系数序列来描述残余环境HOA分量而引起 的建模误差,或者由不提取定向信号并且代替地使用另外的HOA系数序列来描述残余环境 HOA分量而引起的建模误差。该标准进一步针对两种情况考虑由定向信号和残余环境HOA 分量的HOA系数序列的感知编码引入的量化噪声的空间功率分布。
[0010] 为了实现上述处理,在开始HOA压缩之前,指定总数量I个信号(信道),与其相 比,HOA系数序列的最初数量0减少。假设环境HOA分量由最小数量Oked个HOA系数序列来 表示。在一些情况下,该最小数量可W是零。剩余的D=I-Oked个信道应当包含定向信号 或者环境HOA分量的另外的系数序列,取决于定向信号提取处理决定什么在感知上更有意 义。假设定向信号或者环境HOA分量系数序列到剩余的D个通道的分配可基于逐个帖(on 化ame-by-化amebasis)地改变。为了在接收侧重构声场,将关于分配的信息作为额外的边 信息(sideinformation)来传输。
[0011] 原则上,本发明的压缩方法适合于使用固定数量的感知编码对被标记为HOA的声 场的更高阶高保真度立体声响复制表示进行压缩,其使用HOA系数序列的输入时帖,所述 方法包括基于逐个帖地执行的下面的步骤:
[0012] -对当前帖估计支配方向的集合W及检测到的定向信号的索引的对应数据集;
[0013]-将所述当前帖的HOA系数序列分解成非固定数量的定向信号,其具有包含在支 配方向估计的所述集合中的各自方向并且具有所述定向信号的索引的各自数据集,其中所 述非固定数量小于所述固定数量,
[0014]W及由减少的数量的HOA系数序列W及所述减少的数量的残余环境HOA系数序列 的索引的对应数据集表示的残余环境HOA分量,所述减少的数量对应于所述固定数量与所 述非固定数量之间的差值;
[0015]-将所述定向信号W及所述残余环境HOA分量的HOA系数序列分配给数量对应于 所述固定数量的信道,其中对于所述分配,使用所述定向信号的索引的数据集W及所述减 少的数量的残余环境HOA系数序列的索引的数据集;
[0016]-对相关帖的信道进行感知编码,W便提供经编码的压缩帖。
[0017] 原则上,本发明的压缩装置适合于使用固定数量的感知编码对被标记为HOA的声 场的更高阶高保真度立体声响复制表示进行压缩,其使用HOA系数序列的输入时帖,所述 装置执行基于逐个帖的处理并且包括:
[0018]-适合于进行如下处理的部件:对当前帖估计支配方向的集合W及检测到的定向 信号的索引的对应数据集;
[0019]-适合于进行如下处理的部件:将所述当前帖的HOA系数序列分解成非固定数量 的定向信号,其具有包含在支配方向估计的所述集合中的各自方向并且具有所述定向信号 的索引的各自数据集,其中所述非固定数量小于所述固定数量,
[0020] W及由减少的数量的HOA系数序列W及所述减少的数量的残余环境HOA系数序列 的索引的对应数据集表示的残余环境HOA分量,所述减少的数量对应于所述固定数量与所 述非固定数量之间的差值;
[0021]-适合于进行如下处理的部件:将所述定向信号W及所述残余环境HOA分量的HOA 系数序列分配给数量对应于所述固定数量的信道,其中对于所述分配,使用所述定向信号 的索引的数据集W及所述减少的数量的残余环境HOA系数序列的索引的数据集;
[0022] -适合于进行如下处理的部件:对相关帖的信道进行感知编码,W便提供经编码 的压缩帖。
[0023] 原则上,本发明的解压缩方法适合于对根据上面的压缩方法压缩的更高阶高保真 度立体声响复制表示进行解压缩,所述解压缩包括步骤:
[0024]-对当前的经编码的压缩帖进行感知解码,W便提供信道的经感知解码的帖;
[0025]-使用检测到的定向信号的索引的数据集W及所选择的环境HOA系数序列的索引 的数据集,重新分布信道的经感知解码的帖,W便重新创建定向信号的对应帖W及残余环 境HOA分量的对应帖;
[0026]-使用检测到的定向信号的索引的数据集W及支配方向估计的集合,从定向信号 的所述帖W及从残余环境HOA分量的所述帖,重新组成HOA表示的当前经解压缩的帖,
[0027] 其中根据所述定向信号预测关于均匀分布的方向的定向信号,并且此后从定向信 号的所述帖、所述预测的信号W及所述残余环境HOA分量重新组成所述当前经解压缩的 帖。
[0028] 原则上,本发明的解压缩装置适合于对根据上面的压缩方法压缩的更高阶高保真 度立体声响复制表示进行解压缩,所述装置包括:
[0029] -适合于进行如下处理的部件:对当前的经编码的压缩帖进行感知解码,W便提 供信道的经感知解码的帖;
[0030]-适合于进行如下处理的部件:使用检测到的定向信号的索引的数据集W及所选 择的环境HOA系数序列的索引的数据集,重新分布信道的经感知解码的帖,W便重新创建 定向信号的对应帖W及残余环境HOA分量的对应帖;
[0031]-适合于进行如下处理的部件:使用检测到的定向信号的索引的数据集W及支配 方向估计的集合,从定向信号的所述帖W及从残余环境HOA分量的所述帖,重新组成HOA表
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1