立体声音频编码器和解码器的制造方法

文档序号:9383155阅读:410来源:国知局
立体声音频编码器和解码器的制造方法
【技术领域】
[0001]本公开在这里一般地涉及立体声音频编码。具体而言,它涉及用于包含下混和离散立体声编码的混合编码的解码器和编码器。
【背景技术】
[0002]在常规的立体声音频编码中,可能的编码方案包括在低比特率应用中使用的参数化立体声编码技术。在中间速率上,常常使用左/右(Left/Right,L/R)或中间/侧(Mid/Side,M/S)波形立体声编码。现有的分发格式和相关的编码技术可在它们的带宽效率的观点上得到提高,特别是在具有低比特率和中间比特率之间的比特率的应用中。
[0003]在Unified Speech and Aud1 Coding(USAC)标准中尝试提高立体声音频系统中的音频分发的效率。USAC标准与参数化立体声编码器技术组合地引入基于低带宽波形编码的立体声编码。但是,由USAC提出的方案使用参数化立体声参数以在改进的离散余弦变换(MDCT)域中引导立体声编码,从而比普通Μ/S或L/R编码更有效地完成一些事情。该方案的缺点在于,可能难以基于在正交镜像滤波器(QMF)域中提取和计算的参数化立体声参数得到在MDCT域中基于低带宽波形的立体声编码中的最佳输出。
[0004]鉴于以上,可能需要进一步的改善,以解决或至少减小以上讨论的缺点的一个或更多个。
【附图说明】
[0005]现在参照附图描述示例性实施例,其中,
[0006]图1是根据示例性实施例的解码系统的一般化框图;
[0007]图2示出图1中的解码系统的第一部分;
[0008]图3示出图1中的解码系统的第二部分;
[0009]图4不出图1中的解码系统的第三部分;
[0010]图5是根据第一示例性实施例的编码系统的一般化框图;
[0011]图6是根据第二示例性实施例的编码系统的一般化框图。
[0012]所有附图是示意性的,并且,为了阐明本公开,一般仅表示必要的部分,而其它的部分可能被省略或仅仅被建议。除非另外指示,否则,类似的附图标记在不同的附图中指的是类似的部分。
【具体实施方式】
_3] 1.概要一解码器
[0014]如这里使用的,左右编码(coding or encoding)意味着不在信号之间执行任何变换的情况下编码左(L)和右(R)立体声信号。
[0015]这里,和差(sum-and-difference)编码意味着,左和右立体声信号的和M被编码为一个信号(和),并且,左和右立体声信号之间的差S被编码为一个信号(差)。和差编码也可被称为中间侧编码。由此,左右形式和和差形式之间的关系是M = L+R和S = L-R0应当注意,当将左和右立体声信号变换成和差形式或者执行相反的变换时,只要沿两个方向的变换匹配,不同的归一化或缩放就是可能的。在本公开中,主要使用M = L+R和S =L-R,但是,使用不同的缩放、例如使用M = (L+R)/2和S = (L-R)/2的系统也同样很好地工作。
[0016]这里,下混互补(downmix-complemetary,dmx/comp)编码意味着,在编码之前根据加权参数a使左和右立体声信号经历矩阵乘法。dmx/comp编码由此也可被称为dmx/comp/a编码。下混互补形式、左右形式和和差形式之间的关系一般是dmx = L+R = M和comp = (l-a)L-(l+a)R = -aM+So注意,下混互补表示中的下混信号由此等于和差表示的和信号M。
[0017]这里,音频信号可以是纯音频信号、音频视觉信号或多媒体信号的音频部分或与元数据组合的这些信号中的任一个。
[0018]根据第一方面,示例性实施例提出用于基于输入信号解码立体声声道音频信号的方法、装置和计算机程序产品。提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。
[0019]根据示例性实施例,提供用于解码两个音频的解码器。解码器包括被配置为接收与两个音频信号的时间帧对应的第一信号和第二信号的接收级,其中,第一信号包含含有与直到第一分频频率(cross-over frequency)的频率对应的频谱数据的第一波形编码信号和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号,并且其中,第二信号包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。
[0020]解码器还包括接收级的下游的混合级。混合级被配置为检查第一和第二信号波形编码信号是否对于直到第一分频频率的所有频率为和差形式,并且,如果不是,那么将第一和第二波形编码信号变换成和差形式,使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号的组合,并且,第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号。
[0021]解码器还包括混合级的下游的被配置成上混第一和第二信号以产生立体声信号的左右声道的上混级,其中,对于低于第一分频频率的频率,上混级被配置为执行第一和第二信号的逆和差变换,并且,对于高于第一分频频率的频率,上混级被配置为执行第一信号的下混信号的参数化上混。
[0022]具有纯波形编码的较低频率即立体声音频信号的离散表示的优点可能在于,人耳对音频的具有低频率的部分更敏感。通过以更好的质量编码该部分,可以增大解码音频的整体效果。
[0023]具有第一信号的参数化立体声编码部分即波形编码下混信号和提到的立体声音频信号的离散表示的优点在于,与使用常规的参数化立体声方法相比,对某些比特率,可提高解码音频信号的质量。在约32?40千比特每秒(kbps)的比特率上,参数化立体声模型可饱和,即,解码音频信号的质量由参数化模型的缺点限制,而不是由于缺少编码比特。因此,对于从约32kbps起的比特率,在波形编码较低频率方面使用比特可能更有益。同时,使用第一信号的参数化立体声编码部分和分发的立体声音频信号的离散表示的混合方法在于,与使用在波形编码较低频率方面使用所有比特的方法和对剩余的频率使用频谱带复制(SBR)相比,这可对于例如低于48kbps的某些比特率提高解码音频的质量。
[0024]因此,解码器有利地用于解码二声道立体声音频信号。
[0025]根据另一实施例,在重叠加窗变换域中,执行在混合级中的将第一和第二波形编码信号变换成和差形式。重叠加窗变换域可例如是改进的离散余弦变换域(MDCT)域。这可能是有利的,原因是,在MDCT域中,很容易实现诸如左/右形式或dmx/comp形式的其它可用的音频分布格式向和差形式的变换。因此,可通过根据编码的信号的特性对低于第一分频频率的频率的至少一子集使用不同的格式来编码信号。这可允许提高编码质量和编码效果。
[0026]根据又一实施例,在正交镜像滤波器域即QMF域中执行上混级中的第一和第二信号的上混。执行上混,以产生左和右立体声信号。
[0027]根据另一实施例,波形编码下混信号包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据。高频重构(HFR)参数例如在接收级上通过解码器被接收并然后被发送到高频重构级,该HFR参数用于通过用高频重构参数执行高频重构来将第一信号的下混信号扩展到高于第二分频频率的频率范围。高频重构可例如包含执行频谱带复制SBR。
[0028]具有仅包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据的波形编码下混信号的优点在于,可减小立体声系统的需要的比特传送率。作为替代方案,可在波形编码较低频率方面使用通过具有带通滤波的下混信号而节省的比特,例如,这些频率的量化可更细,或者第一分频频率可增大。
[0029]由于如上面描述的那样人耳对音频信号的具有低频率的部分更敏感,因此,可在不降低解码音频信号的感觉音频质量的情况下通过高频重构重新创建诸如音频信号的具有高于第二分频频率的频率的部分的高频。
[0030]根据另一实施例,在执行第一和第二信号的上混之前,将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的,原因是,上混级将具有并输入具有与所有频率对应的频谱数据的和信号。
[0031]根据另一实施例,在将第一和第二波形编码信号变换成和差形式之后,将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的,原因是,给定下混信号与和差表示中的和信号对应,则高频重构级将具有有着以相同的形式即以和形式表示的与直到第二分频频率的频率对应的频谱数据的输入信号。
[0032]根据另一实施例,通过使用上混参数完成上混级中的上混。上混参数例如在接收级上通过解码器被接收并且发送到上混级。产生下混信号的去相关版本,并且,使下混信号和下混信号的去相关版本经历矩阵运算。矩阵运算的参数由上混参数给出。
[0033]根据另一实施例,在接收级上接收的第一和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码,其中,互补信号依赖于具有信号自适应性的加权参数a。波形编码的信号可由此根据信号的特性以不同的形式被编码,并且仍可通过解码器被解码。这样,给定系统的一定比特率
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1