音频解码系统和音频编码系统的制作方法_3

文档序号:9769250阅读:来源:国知局
br>[0075] 混合矩阵112适于接收输入信号X和去相关信号D1。混合矩阵112还适于形成来自 输入信号X的通道与来自去相关信号Dl的通道的双通道线性组合,W及输出该线性组合作 为双通道输出信号Y1。混合矩阵112适于使用参数组Pl来形成该线性组合,即,该线性组合 的至少一些系数(例如,所有系数)能够由混合参数组Pl控制。
[0076] 在图1所示的结构的一些示例实现中,去相关级111可W使用参数组Pl(或者使用 参数组Pl的子组)来形成去相关信号D1。例如,去相关级111可W包括适于形成输入信号X的 两个通道的中间线性组合Zl的预混矩阵113,其中,该中间线性组合Zl的至少一些系数(例 如,所有的系数)能够由混合参数组Pl中的一个或更多个参数控制。在本示例中,去相关级 111还可W包括去相关器114,去相关器114适于接收中间线性组合Zl W及基于中间线性组 合Zl输出去相关信号Dl。可W例如通过混响型效应来延迟、相移和/或处理去相关信号Dl。 本领域中已知若干去相关器设计。关于可W用作去相关器114的示例设计,参见例如专利文 件EPl 410 687 Bl和EPl 616 461 Bl。在一些示例实施方式中,中间线性组合Zl可W是单 通道信号,并且去相关器114可W输出单通道去相关信号D1。在其他实施方式中,中间线性 组合Zl可W是多通道信号,并且去相关器114可W包括若干子去相关器,每个子去相关器基 于中间线性组合Zl的相应通道来输出多通道去相关信号Dl的一个通道。
[0077] 具体地,去相关器114可W包括适于接收中间线性组合Zl的通道W及输出去相关 信号Dl的通道的一个或更多个无限脉冲响应格型滤波器。另外,去相关器114可W例如包括 伪迹衰减器,其被配置成检测中间线性组合Zl中的声音结尾,W及响应于该声音结尾来采 取校正动作。当输入信号X在具有活动音频内容的时间段之后变得静默时,人耳可能能够觉 察到输出信号Yl中的瞬变和/或其他伪迹。通过例如在输入信号X中的运中静默时段的开始 畏减中间首频f目号Zl,去相关器114可W减少去相关f目号Dl中W及输出f目号Yl中的瞬变和/ 或其他伪迹的影响。
[0078] 中间线性组合Zl可W被表示为应用于输入信号X的矩阵A的结果。去相关信号Dl可 W被表示为:
[0079] Dl=Dec(AX),
[0080]其中,Dec()表不由去相关器114执行的去相关。注意,在AX是多通道f目号的情况下 DecO表示按元素的去相关。输出信号Yl可W被表示为应用于输入信号X和去相关信号Dl的 将矩阵B的结果,即被表示为:
[0081] Yl-聪(二)
[0082] 在图1所示的结构的一些示例实现中,参数混合级110可W适于接收与多个子频带 相关联的混合参数组Pl的值,W及使用与对应子频带相关联的混合参数组Pl的值对输入信 号X和去相关信号Dl的子频带表示进行操作。类似地,预混矩阵113可W适于对输入信号X的 子频带表示进行操作。可W例如W变换格式(例如,使用正交镜像滤波QMF)接收输入信号X, W该变换格式将输入信号X表示在与变换相关联的子频带(例如,QMF子频带)中。所接收的 混合参数的值可W与相对于输入信号X的变换子频带而言具有不同的频率分辨率的子频带 相关联。在运种情况下,可W特别是通过将两个或更多个QMF子频带分组在一起并且对运两 个或更多个QMF子频带应用混合参数的相同值来将所接收的混合参数的值映射至适当的变 换子频带(例如,QMF子频带)。
[0083] 参数混合级110可W例如使用非均匀的子频带划分。例如,子频带可W反映人类听 觉系统的敏感度,对于人耳相对较敏感的、通常为较低频率和中间频率的频率范围,子频带 划分较精细。
[0084] 在一些示例实施方式中,参数混合级110可W适于接收具有第一时间分辨率的输 入信号X,其中输入信号X被W第一时间分辨率划分成包括常数数量的样本的时间帖(即,每 个帖中的样本数量相同)。在运种实施方式中,参数混合级110可W能够进行操作W在时间 帖期间接收混合参数组Pl中的每个混合参数的一个或更多个值(关于细节,请参见下面的 图2a至图2d的描述)。可W例如由音频解码系统100WMDCT编码格式(改进型离散余弦变换) 来接收输入信号X,并且时间帖可W是长度与MDCT变换的步幅对应的MDCT帖。
[0085] 用索引k指代当前子频带并且用索引n表示当前样本(例如,QMF样本),去相关信号 Dl和输出信号Yl可W表示为:
[0087] 在混合(和预混)期间被用作系数的矩阵A(n,k)和矩阵B(n,k)的元素可W例如由 用于对应的子频带和样本的混合参数组Pl的值来控制。在一些示例实施方式中,矩阵A(n, k)和矩阵B(n,k)可W被分别获得为矩阵E和矩阵F的时间插值版本。将在下面的不同场景中 描述矩阵E和矩阵F的示例。随后将结合图2a至图2d来描述用于根据矩阵E和矩阵F获得矩阵 A(n,k)和矩阵B(n,k)的不同时间插值方案。
[0088] 在第一场景中,输入信号X表示压缩格式的立体声音频信号。在输入信号X中,立体 声音频信号的左通道和右通道被编码为输入信号X中的伴有空(或者零/中性)通道的单通 道下混信号。假定本场景的下混信号被定位为输入信号X中的第一通道,则解码系统100可 W在预混矩阵113和混合矩阵112中分别使用矩阵
[00例E=(10似如。。對!苗篇2 .纖)
[0090]中给出的值来重构立体声音频信号。可W将上面的矩阵E和矩阵F分别看作要在预 混矩阵113和混合矩阵112中使用的更一般矩阵
[0092] 的示例实现。通过参数组Pl(al,m, 丫 1,丫 2)即能够被独立地指定的确切的四个 参数来参数化一般矩阵E和矩阵F。具体地,仅由参数组Pl(al,ei, 丫 1,丫 2)来控制使用矩阵 E在预混矩阵113中获得的中间线性组合Zl的系数,即,没有其他参数对预混矩阵113所使用 的系数的控制有贡献。
[0093] 在上面描述的第一场景中,混合参数组Pl是(al,m, 丫 1,丫 2),但是通过使用混合 参数值丫 1 = 1和丫 2 = 0简化了矩阵E和矩阵F。
[0094] 在图1所示的结构的实现中,混合参数组Pl的实际值可W与输入信号X-起由解码 系统100接收,例如与输入信号X-起编码在比特流中。可W例如在W下编码系统中确定混 合参数组Pl,在该编码系统中,可W基于立体声音频信号来产生输入信号X。参见例如结合 图7描述的编码器。
[00M]混合参数组Pl中的参数可W具有不同的作用,并且因此可W W不同的量化格式 (例如,使用不同的量化尺度)被接收。在上面的场景中,参数Oi和参数m控制信号分量在两 个输出信号通道之间的分配,而参数丫 1和参数丫 2控制输入信号X通道在输出信号Yl中的 相对贡献。因此,与参数Tl和参数T 2相比,可W对于al和m预期不同的统计。因此,可W W 与参数al和参数m不同的量化格式来接收参数丫 1和参数丫 2,而在一些示例实现中,可W W类似的量化格式来接收参数Oi和参数m。
[0096]在第二场景中,输入信号X是立体声音频信号的双通道表示,其中,对于交叉频率 W下的频带,立体声音频信号的左(1)通道和右(r)通道被编码为输入信号X中的和信号(1+ r)/2W及差信号(l-r)/2,并且对于交叉频率W上的频带,立体声音频信号的左(1)通道和 右(r)通道被编码为输入信号X中的伴随空(或者零/中性)通道的单通道下混信号。在该第 二场景中,解码系统100可W例如接收当前交叉频率的指示,并且对于交叉频率W上的频 带,可W使用与第一场景中相同的矩阵,即 ,,、、/(:!夺沒U/2 錢授'1/2 \
[0097] E=(i〇似如:::也…窃曲2授心A)。
[0098] 对于交叉频率W下的频带,可W使用混合级110的某种离散模式,其中矩阵
[0099] E=(l 〇m及F。。5
[0100] 被用于重构立体声音频信号。尽管对于交叉频率W下的频带可能不需要去相关, 但是针对交叉频率W下和W上的频带使用相同的矩阵E会是方便的。
[0101] 现在将结合图2a至图2d来描述用于分别根据矩阵E和矩阵F获得矩阵A(n,k)和矩 阵B(n,k)的不同的时间插值方案。应当注意,下面所描述的插值方案是从控制矩阵E和矩阵 F的混合参数值的方面来描述的。也可W构思出W下示例实施方式,其中,直接对矩阵元素 而不是针对控制矩阵元素的参数值来执行模拟插值方案(例如,线性插值)。
[0102] 在图1所示的示例实施方式的一些实现中,参数混合级110可W适于接收具有第一 时间分辨率的输入信号X,输入信号X被W第一时间分辨率划分成包括常数数量的样本(即, 每个帖包括相同数量的样本)的时间帖211至213、221至223、231至233和241至243。如图2a 所示,在一些示例实施方式中,参数混合级110可W能够进行操作W在时间帖212(或者图化 中的222)期间接收混合参数组P1中的每个混合参数的一个值214(或者图化中的224)。如图 2c所示,在一些示例实施方式中,参数混合级110可W能够进行操作W在时间帖232(或者图 2d中的242)期间接收混合参数组Pl中的每个混合参数的两个值234、235(或者图2d中的 244、245)。在一些实施方式中,参数混合级110可W能够进行操作W例如根据两个值234、 235是否可用或者根据指示要由参数混合级110接收的适当参数格式的某接收信号,来接收 一些帖212中的一个值214W及一些帖232中的两个值234、235。为清楚起见,应当指出,每个 参数值可W被接收/获得为值的向量,其中每个值与特定频带相关联。
[0103] 在图1所示的示例实施方式的一些实现中,参数混合级110可W能够进行操作W接 收具有第一时间分辨率(例如,每个时间帖一组或两组参数值)的混合参数组Pl,W及使用 时间插值W根据具有第一时间分辨率的混合参数组Pl产生具有第二时间分辨率(例如,在 每个时间帖中对于每个样本一组值)的一个或更多个混合参数的组。运在使用平滑插值的 图2a和图2c中被示出。在图2a中,在时间帖212的结尾处接收混合参数Pl的一组值214,并且 在运些值214与来自先前帖211的对应值215之间(对于帖索引的部分值,即,对于时间帖中 的样本)进行线性插值。在图2c中,接收混合参数Pl中的两组值234、235,其中一组在时间帖 232的中间处而另一组在时间帖232的结尾处。在来自先前帖231的最新一组值236与当前帖 232中的第一组接收值334之间进行线性插值,然后在当前帖232的第一组接收值234和第二 组接收值235之间进行线性插值。
[0104] 在图2b和图2d中示出了作为图2a和图2c所描述的平滑插值的替选方案的睹峭插 值。在图化中,在帖222中的位置225处接收一组值224。使用先前帖221的最新的值226直至 接收到新一组值224的位置225。在位置225处,丢弃旧值226并且使用新值224直至接收到新 一组值。在图2d中,在当前帖242中的位置246和位置247处分别接收到两组值244、245。使用 先前帖241的最新一组值248直至接收到第一组新值244的位置246。在位置246处,丢弃旧值 248并且使用第一组新值244直至接收到第二组值245的位置247。
[0105] 图3是根据第二示例实施方式的音频解码系统300的一般化框图。解码系统300包 括第一参数混合级110,其类型与图1所示的解码系统100的参数混合级110的相同。解码系 统300还包括第二参数混合级320,其功能与第一混合级110相同。第二参数混合级320适于 接收输入信号X和第二组混合参数P2,第二参数混合级320被配置成独立于由第一参数混合 级110接收的第一组混合参数Pl来接收第二组混合参数P2的值。与第一混合级110类似,第 二混合级320适于基于输入信号X和第二组混合参数P2来输出第二输出信号Y2。第二混合级 320包括适于基于输入信号X输出第二去相关信号D2的第二去相关级321。第二混合级320还 包括第二混合矩阵322,第二混合矩阵322适于:接收输入信号X和第二去相关信号D2;形成 来自输入信号和第二去相关信号D2的通道的第二双通道线性组合;W及输出该第二线性组 合作为第二双通道输出信号Y2。第二线性组合的至少一些系数(例如,所有系数)能够由第 二组混合参数P2来控制,并且第二组P2中的至少4个混合参数能够彼此独立地被指定。
[0106] 图3所示的第一参数混合级110和第二参数混合级320的功能等同。仅通过分别由 第一参数混合级110和第二参数混合级320接收的第一组参数Pl和第二组参数P2的值就能 够区分第一参数混合级110与第二参数混合级320。此外,第一参数混合级110和第二参数混 合级320并行地并且彼此独立地工作。
[0107] 由于图3中的解码系统300包括两个混合级110和320,每个混合级提供其自己的双 通道输出信号Yl和Y2,解码系统300可W基于双通道输入信号XW及参数组Pl和P2来输出总 共四个通道。与第一混合级110中的情况类似,第二去相关信号D2和第二输出信号Y2可W表 示为:
[010引 02(。,4)=06。(八(。,4巧(。,4)似及於(從妙。礙紙&);!.》巧。禹:、
[0109] 其中,用于根据矩阵E和矩阵F获得矩阵A(n,k)和矩阵B(n,k)的时间插值方案可W 与结合图2a至图2d描述的那些方案类似。应当注意,尽管相应的矩阵可W具有类似的结构 和/或参数化,但是不同的矩阵4(11,1〇、8(11,1〇、6和。通常可^分别用于第一混合级110和第 二混合级320。
[0110] 在图3所示的结构的示例场景中,要由解码系统300重构包括至少左通道1、左环绕 通道Is、右通道r和右环绕通道rs的多通道音频信号。解码系统300接收作为多通道音频信 号的下混表示的双通道输入信号X。第一混合级110接收第一组混合参数Pl(
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1