编码器系统、解码器系统、编码方法和解码方法_3

文档序号:9472491阅读:来源:国知局
原理的说明。可W理解,该实施例的修改和变 型对于本领域的其他技术人员是显然的。该解码器系统包括解复用器10,用于分离由感知 编码器3生成的PS参数5和音频比特流4。音频比特流4被馈送到感知立体声解码器11, 感知立体声解码器11可W选择性地对L/R编码比特流或M/S编码音频比特流解码。解码 器11的操作与编码器2的操作相反。与感知编码器3类似,感知解码器11优选地允许频 率变化和时间变化的解码方案。由编码器3进行L/R编码的一些频带由解码器11进行L/ R解码,而由编码器3进行M/S编码的其他频带由解码器11进行M/S解码。解码器11输 出先前被输入到感知编码器3的伪立体声信号Lp、Rp。从感知解码器11获得的伪立体声信 号Lp、Rp被L/R至M/S变换级12转换回缩混信号DMX和残余信号RES。在解码器侧的L/R 至M/S变换级12的操作与在编码器侧的变换级2的操作相反。优选地,变换级12根据下 式确定缩混信号D^枚和残余信号RES:
[0130] 在上式中,增益归一化因子g与编码器侧的增益归一化因子g相同,并且具有例如 ?、、、、、、、、% 值《记'、聲。 .化
[0131] 然后缩混信号DMX和残余信号RES由PS解码器13处理W获得最终的L和R输出 信号。可W通过2上混矩阵H来描述在用于使用残余的PS编码的解码处理中的上混步 骤,2 ? 2上混矩阵H将缩混信号DMX和残余信号RES转换回L和R声道:
[0132]
[0133]W上已经讨论了上混矩阵H的元素的计算。
[0134] 优选地,在过采样频域中执行在PS编码器1和PS解码器13中的PS编码和PS解 码处理。对于时间至频率的变换,例如,可W在PS编码器的上游使用具有QMF(正交镜像 滤波器)和奈奎斯特滤波器的复值混合滤波器组,诸如环绕MPEG标准(参见文件IS0/IEC 23003-1)中描述的滤波器组。使用因子2来对信号的复数QMF表示进行过采样,因为它是 复数值的而非实数值的。运允许时间和频率的自适应信号处理,而没有可听的失真伪像。运 样的混合滤波器组通常在低频处提供高频率分辨率(窄带),而在高频处,几个QMF频带被 成组为较宽的频带。论文"LowComplexityParametricStereoCodinginMPEG-4",H. Purnhagen,Proc.ofthe7thInt.ConferenceonDigitalAudioEffects值AFx' 04),Na pies,Italy,October5-8, 2004,pages163-168描述了混合滤波器组的一个实施例(参见 3. 2部分和图4)。该公开通过引用合并于此。在该文献中,假定48曲Z的采样率,并且64 频带QMF组的频带的(标称)带宽是37甜Z。然而,感知Bark频率标度对于500化W下的 频率请求大约100化的带宽。因此,可W借助于奈奎斯特滤波器组将前3个QMF频带划分 为更进一步窄的子带。第一QMF频带可W划分为4个子带(外加用于负频率的另外两个), 并且第二和第=QMF频带可W分别划分为两个频带。
[013引优选地,另一方面,在临界采样MDCT域(例如,如在AAC中所述)中执行自适应L/R或M/S编码,W便保证高效的量化信号表示。可W在时域中执行变换级2中缩混信号DMX 和残余信号RES向伪立体声信号Lp、Rp的转换,运是因为无论如何PS编码器1和感知编码 器3可W在时域中连接。同样,在解码系统中,感知立体声解码器11和PS解码器13优选 地在时域中连接。因此,也可W在时域中执行变换级12中伪立体声信号Lp、Rp向缩混信号 DMX和残余信号RES的转换。
[0136] 例如如图1中编码器3所示的自适应L/R或M/S立体声编码器通常是感知音频编 码器,该感知音频编码器包含屯、理声学模型,W使能在低比特流下的高编码效率。用于运样 的编码器的示例是AAC编码器,该AAC编码器与通过使用屯、理声学模型控制的时间和频率 变化的量化相组合地采用在临界采样MDCT域中的变换编码。而且,通常借助于使用屯、理声 学模型计算的感知赌测量来控制在L/R和M/S编码之间的时间和频率变化的选定。
[0137] 感知立体声编码器(诸如图1中的编码器3)对于伪L/R立体声信号(参见图1中 的Lp、Rp)操作。为了优化立体声编码器(特别是用于作出在L/R编码和M/S编码之间的正 确的选定)的编码效率,有益的是修改感知立体声编码器中的屯、理声学控制机制(包括在 L/R和M/S立体声编码之间选定的控制机制W及控制时间和频率变化的量化的控制机制), W便解决当生成最终的立体声输出信号LR时在解码器中应用的信号修改(伪L/R至DMX 和RES转换,其后是PS解码)。运些信号修改可W影响在屯、理声学控制机制中使用的双耳 掩蔽现象。因此,应当优选地适用运些屯、理声学控制机制。为此,可W有益的是,如果屯、理 声学控制机制不仅访问伪L/R信号(参见图1中的Lp、Rp),而且访问PS参数(参见图1中 的5)和/或原始立体声信号LR。屯、理声学控制机制对于PS参数和立体声信号LR的访 问在图1中由虚线指示。基于该信息,例如可W适用掩蔽阔值。
[013引用于优化屯、理声学控制的一种替选方法是使用检测器来扩大编码器系统,W形成 禁止级,该禁止级能够在适当时优选地W时间和频率变化的方式来有效地禁止PS编码。禁 止PS编码例如在预期L/R立体声编码有益时或在屯、理声学控制在对伪L/R信号高效地编 码上有问题时是适当的。可W通过W下方式设置缩混矩阵Hi来有效地禁止PS编码:其后 跟随变换(参见图1中的级2)的缩混矩阵Hi对应于单位矩阵(即,对应于全同运算)或 对应于单位矩阵乘W因子。例如,可W通过将PS参数IID和/或ICC强制为IID= 0地和 ICC= 0来有效地禁止PS编码。在该情况下,伪立体声信号Lp、Rp对应于如上所述的立体 声信号L、R。
[0139] 在图4中示出了用于控制PS参数修改的运样的检测器。在此,检测器20接收由 参数估计级9确定的PS参数5。当检测器没有禁止PS编码时,检测器20将PS参数传送到 缩混级8和复用器7,即,在该情况下,PS参数5对应于馈送到缩混级8的PS参数5'。在 检测器检测到PS编码不利并且应当禁止PS编码(对于一个或更多个频带)的情况下,检 测器修改所影响的PS参数5 (例如,将PS参数IID和/或ICC设置为IID= 0地和ICC= 0),并且将修改的PS参数5'馈送到缩混级8。检测器也可W可选地考虑用于对PS参数修 改作出决定的左和右信号^R(参见图4中的虚线)。
[0140] 在下面的图中,术语QMF(正交镜像滤波器或滤波器组)还包括与奈奎斯特滤波器 组组合的QMF子带滤波器组,即混合滤波器组结构。此外,在下面的说明中的所有值可W是 频率相关的,例如,可W对于不同的频率范围提取不同的缩混和上混矩阵。此外,残余编码 可W仅覆盖所使用的音频频率范围的一部分(即,仅对于所使用的音频频率范围的一部分 进行残余信号编码)。如下概述的缩混的方面可W对于一些频率范围出现在QMF域中(例 如,根据现有技术),而对于其他频率范围,例如在复数QMF域中仅处理相位方面,而在实数 值MDCT域中处理幅度变换。
[0141] 在图5中,图示了传统的PS编码器系统。首先,通过具有M个子带的复数QMF30、 例如具有M= 64个子带的QMF来分析立体声声道LR的每一个。子带信号用于在PS编码 器31中估计PS参数5和缩混信号DMX。缩混信号D^枚用于在SBR(频段复制)编码器32 中估计SBR参数33。SBR编码器32可能与噪声和音调测量相组合地提取用于表示原始高 频带信号的频谱包络的SBR参数33。与PS编码器31相反,SBR编码器32不影响传送到核 屯、编码器34的信号。使用具有N个子带的逆QMF35来合成PS编码器31的缩混信号DMX。 例如,可W使用N= 32的复数QMF,其中,仅合成由PS编码器31和SBR编码器32使用的64 个子带中的32个最低的子带。因此,通过针对相同的帖大小使用半数的子带,获得与输入 相比一半带宽的时域信号,并且将其传送到核屯、编码器34中。由于减小的带宽,采样率可 W减半(未示出)。核屯、编码器34执行单声道输入信号的感知编码W生成比特流36。PS 参数5被复用器(未示出)嵌入比特流36中。
[0142] 图6示出了将使用残余的PS编码与立体声核屯、编码器48组合的编码器系统的另 一个实施例,立体声核屯、编码器48能够自适应地L/R或M/S感知立体声编码。该实施例仅 是本申请的原理的说明。可W理解,该实施例的修改和变型对于本领域的其他技术人员是 显然的。复数QMF30W与结合图5所述的类似的方式来分析用于表示左和由原始声道的 输入声道^R。与图5中的PS编码器31相比,图6中的PS编码器41不仅输出缩混信号 DMX,而且输出残余信号RES。SBR编码器32使用缩混信号DMX来确定缩混信号DM的SBR 参数33。在变换级2中固定向缩混信号DM和残余信号RES应用DMX/RSE至伪L/R变换 (即,M/S至L/R变换)。图6中的变换级2对应于图1中的变换级2。变换级2创建粉。 编码器48要操作的"伪"左和右声道信号Lp、Rp。在该实施例中,在滤波器组35的子带合 成之前,在QMF域中应用逆L/R至M/S变换。优选地,用于合成的子带的数量N(例如,N= 32)对应于用于分析的子带的数量M(例如,M= 64)的一半,并且核屯、编码器48W采样率 的一半来运行。应当注意,在编码器中使用用于QMF分析的64个子带声道和用于合成的32 个子带没有限制,根据核屯、编码器48接收的信号期望什么采样率,其他值也是可能的。核 屯、立体声编码器48执行滤波器组35的信号的感知编码W生成比特流信号46。PS参数5被 复用器(未示出)嵌入在比特流信号46中。可选地,核屯、编码器48可W使用PS参数和/ 或原始L/R输入信号。运样的信息向核屯、编码器48指示PS编码器41如何旋转立体声空 间。该信息可W引导核屯、编码器48如何W感知最佳的方式来控制量化。在图6中通过虚 线指示运一点。
[0143]图7示出了与图6中的实施例类似的编码器系统的另一个实施例。与图6的实施 例相比,在图7中,SBR编码器42连接在PS编码器41的上游。在图7中,SBR编码器42已 经移动到PS编码器41之前,因此对左和右声道(在此:在QMF域中)操作,而不是像在图 6中那样对缩混信号DMX操作。
[0144] 由于SBR编码器42的重新布置,PS编码器41可W被配置为不对输入信号的全带 宽操作,而是例如仅对SBR交叉频率之下的频率范围操作。在图7中,SBR参数43在用于 SBR范围的立体声中,并且来自将在下面结合图15描述的对应的PS解码器的输出产生SBR 解码器要操作的立体声源频率范围。运种修改、即在编码器系统中将SBR编码器模块42连 接到PS编码器模块41的上游并且对应地在解码器系统中将SBR解码器模块放置在PS解 码器模块之后(参见图15)具有下述益处:可W减少用于生成立体声输出的去相关信号的 使用。请注意,在根本或对于特定的频带不存在残余信号的情况下,在PS解码器中代替地 使用缩混信号DMX的去相关版本。然而,基于去相关信号的重建降低了音频质量。因此,减 少去相关信号的使用提高了音频质量。
[0145]现在将参照图8a至8d更详细地描述与图6中的实施例相比图7中的实施例的运 个优点。
[0146] 在图8a中,可视化两个输出声道^R(在解码器侧)之一的时间频率表示。在图 8a的情况下,使用编码器,其中,将PS编码模块置于诸如图5和图6中编码器的SBR编码 模块之前(在解码器中,将PS解码器置于SBR解码器之后,参见图14)。而且,仅在低带宽 频率范围50中对残余编码,该频率范围小于核屯、编码器的频率范围51。从图8a中的声谱 可视图显然可W看出,其中要由PS解码器使用的去相关信号的频率范围52覆盖除了通过 使用残余信号而覆盖的较低频率范围50之外的所有频率范围。而且,SBR覆盖起始比去相 关信号的频率范围显著高的频率范围53。因此,整个频率范围分为下面的频率范围:在低 频范围中(参见图8a中的范围50),使用波形编码;在中频范围中(参见频率范围51和52 的交集),使用与去相关信号组合的波形编码;并且,在高频范围中(参见频率范围53),与 由PS解码器产生的去相关信号组合使用从低频再生的SBR再生信号。
[0147] 在图8b中,对于在编码器系统中当SBR编码器连接到PS编码器的上游(并且,在 解码器系统中,SBR解码器位于PS解码器之后)时的情况,可视化两个输出声道^R(在解 码器侧)之一的时间频率表示。在图8b中,示出了低比特率情况,并且残余信号带宽60 (其 中,执行残余编码)小于核屯、编码器61的带宽。因为SBR解码处理在PS解码器后的解码器 侧运行(参见图15),所W用于低频的残余信号也用于SBR范围63的至少一部分高频(参 见频率范围64)的重建。
[014引当运行于其中残余信号带宽接近或等于核屯、编码器带宽的中间比特率时,该优点 变得更明显。在该情况下,图8a的时间频率表示(其中,使用图6中所示的PS编码和SBR 编码的顺序)导致图8c中所示的时间频率表示。在图8c中,残余信号RES实质上覆盖核 屯、编码器的整个低频带范围51 ;在SBR频率范围53中,通过PS解码器来使用去相关信号。 在图8d中,可视化了在编码/解码模块的优选顺序(即,SBR编码在PS编码之前作用于立 体声信号,如图7中所示)的情况下的时间频率表示。在此,PS解码模块在解码器中的SBR 解码模块之前运行,如图15中所示。因此,残余信号是用于高频重建的低频带的一部分。当 残余信号带宽等于单声道缩混信号带宽时,不需要去相关信号信息来对输出信号解码(参 见图8d中加阴影的全频率范围)。
[0149] 在图9a中,示出了在MDCT变换域中具有自适应地可选择的L/R或M/S立体声编 码的立体声核屯、编码器48的一个实施例。运样的立体声编码器48可W用在图6和7中。 可W将如图5中所示的单声道核屯、编码器34当作图9a中的立体声核屯、编码器48的特殊 情况,其中,仅处理单个单声道输入声道(即,其中如图9a中的虚线所示的第二输入声道不 存在)。
[0150] 在图9b中,示出了更一般化的编码器的一个实施例。对于单声道信号,可W在线 性预测域中的编码(参见块71)和在变换域中的编码(参见块48)之间切换编码。运种 类型的核屯、编码器引入了几种编码方法,可W根据输入信号的特性而自适应地使用运些方 法。在此,编码器可W选择使用AAC型变换编码器48 (可用于单声道和立体声信号,并且在 立体声信号的情况下能够自适应地选择L/R和M/S编码)或AMR-WB+(自适应多速率-宽 带加)型核屯、编码器71 (仅可用于单声道信号)来对信号编码。AMR-WB+核屯、编码器71评 估线性预测器72的残余,并且继而也在线性预测残余的变换编码方法或用于对线性预测 残余编码的标准语音编码器ACELP(代数码激励线性预测)方法之间选择。为了在AAC型 变换编码器48和AMR-WB+型核屯、编码器71之间选定,使用模式选定级73,其基于在编码器 48和71之间的输入信号来选定。
[0151] 编码器48是基于立体声AAC型MDCT的编码器。当模式选定73控制输入信号W 使用基于MDCT的编码时,由基于AAC的MDCT编码器48对单声道输入信号或立体声输入信 号编码。MDCT编码器48在MDCT级74中进行一个或两个信号的MDCT分析。此外,在立体 声信号的情况下,在量化和编码之前,在级75中执行在频带基础上的M/S或L/R选定。L/R 立体声编码或M/S立体声编码能够W频率变化的方式选择。级75也执行L/R至M/S变换。 如果对于特定的频带选定M/S编码,则级75输出针对该频带的M/S信号。否则,级75输出 针对该频带的L/R信号。
[0152] 因此,当使用变换编码模式时,对于立体声可W使用基础核屯、编码器的立体声编 码功能的全效率。
[0153] 当模式选定73将单声道信号控制到线性预测域编码器71时,随后通过块72中的 线性预测分析来分析单声道信号。随后,进行要通过在MDCT域中运行的时域ACELP型编码 器76还是TCX型编码器77 (变换码激励)来对LP残余编码的选定。线性预测域编码器71 没有任何固有的立体声编码能力。因此,为了允许使用线性预测域编码器71对立体声信号 编码,可W使用与图5中
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1