编码器系统、解码器系统、编码方法和解码方法

文档序号：9472491阅读：640来源：国知局

编码器系统、解码器系统、编码方法和解码方法
【专利说明】
[0001] 本发明申请为申请日为2010年3月5日并于2011年9月15日进入中国国家阶段的发明名称为"基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码"的第201080012247. 5号发明专利申请的分案申请。
技术领域
[0002] 本申请设及音频编码，具体地，设及组合基于参数和波形的编码技术的立体声音频编码。
【背景技术】
[0003] 立体声信号的左（L)和右佩声道的联合编码与L和R的独立编码相比，使得能够更高效的编码。用于联合立体声编码的常见方法是中央/侧边（M/巧编码。在此，通过相加L和R信号来形成中央（M)信号，例如，M信号可W具有形式
[0004]
[0005] 同样，通过相减两个声道L和R而形成侧边（巧信号，例如，S信号可W具有形式
[0006]
[0007] 在M/S编码的情况下，对M和S信号而不是L和R信号进行编码。
[000引在MPEG(移动图像专家组）AAC(高级音频编码）标准（参见标准文件IS0/IEC13818-7)中，可WW时间变化和频率变化的方式来选择L/R立体声编码和M/S立体声编码。因此，立体声编码器可W对于立体声信号的一些频带应用L/R编码，而M/S编码用于对立体声信号（频率变化的）的其他频带进行编码。而且，编码器可W在时间上在L/R和M/S编码之间切换（时间变化的）。在MPEGAAC中，在频域中，更具体地在MDCT(改进型的离散余弦变换）域中执行立体声编码。运允许W频率和时间变化的方式来自适应地选择L/R或 M/S编码。在L/R和M/S立体声编码之间的选定可W基于评估侧边信号：当侧边信号的能量较低时，M/S立体声编码更高效，从而应当被使用。或者，对于在两种立体声编码方案之间的选定，可W试验两种编码方案，并且选择可W基于产生的量化工作（effort)、即所观察的感知赌。
[0009] 一种对于联合立体声编码的替代方法是参数立体声（P巧编码。在此，在使用诸如AAC编码器的传统音频编码器对缩混信号编码后，立体声信号作为单声道缩混信号传送。缩混信号是L和R声道的叠加。单声道缩混信号与附加的时间变化和频率变化的PS 参数组合传送，该PS参数例如是声道间（即，在L和R之间）强度差IID和声道间交叉相关（ICC)。在解码器中，基于解码的缩混信号和参数立体声参数，重建近似于原始立体声信号的感知立体声图像的立体声信号。为了重建，通过去相关器来生成缩混信号的去相关版本。通过适当的全通滤波器来实现运样的去相关器。在下文中描述了PS编码和解码： "Low Complexity Parametric Stereo Coding in MPEG-4",比Purnhagen, Proc. Of the 7th Int. Conference on Digital Audio Effects (DAFx ' 04), Naples, Italy, October 5-8, 2004, pagesl63-168。该文档的公开通过引用合并于此。
[0010] 环绕MPEG标准（参见文件IS0/IEC23003-1)利用PS编码的概念。在环绕MPEG 解码器中，基于较少的输入声道和控制参数来创建多个输出声道。通过级联参数立体声模块来构造环绕MPEG解码器和编码器，该模块在环绕MPEG中被称为用于解码器的0TT模块 (一对二模块）和用于编码器的R-0TT模块（逆一对二模块）。0TT模块通过伴随PS参数的单个输入声道（缩混信号）来确定两个输出声道。0TT模块对应于PS解码器，R-0TT模块对应于PS编码器。可W通过使用在解码器侧具有单个0TT模块和在编码器侧具有单个 R-0TT模块的环绕MPEG来实现参数立体声；运也被称为"环绕MPEG2-1-2"模式。比特流语法可W不同，但是基础理论和信号处理是相同的。因此，W下对于PS的所有引用还包括"环绕MPEG2-1-2 "或基于环绕MPEG的参数立体声。
[0011] 在PS编码器（例如，在环绕MPEGPS编码器中），除了缩混信号之外，可W确定和发送残余信号（RE巧。运样的残余信号指示与通过其缩混和PS参数来表示原始声道相关联的误差。在解码器中，可W使用残余信号代替缩混信号的去相关版本。运允许更好地重建原始声道L和R的波形。例如，在环绕MPEG标准（参见文件IS0/IEC23003-1)中和在下文中描述了附加的残余信号的使用："MPEGSurround-TheIS0/MPEGStandardforEfficient andCompatibleMulti-ChannelAudioCoding,J.Herreetal. ,AudioEngineering ConventionPaper7084,122ndConvention,May5-8, 2007。两个文档的公开、特别是其中对于残余信号的评论通过引用合并于此。
[0012] 使用残余的PS编码对于联合立体声编码而言是比M/S编码更一般的方法：当将 L/R信号变换为M/S信号时，M/S编码执行信号旋转。此外，当将L/R信号变换为缩混和残余信号时，使用残余的PS编码执行信号旋转。然而，在后一种情况下，信号旋转是可变的，并且依赖于PS参数。由于使用残余的PS编码的更一般的方法，使用残余的PS编码允许对像拼接的单声道信号那样的某些类型的信号进行比M/S编码更高效的编码。因此，所提出的编码器允许将参数立体声编码技术与基于波形的立体声编码技术高效地组合。
[0013] 经常地，诸如MPEGAAC感知立体声编码器的感知立体声编码器可W在L/R立体声编码和M/S立体声编码之间选定，其中，在后一种情况下，基于立体声信号生成中央/侧边信号。运样的选择可W是频率变化的，即，对于一些频带，可W使用L/R立体声编码，而对于其他频带，可W使用M/S立体声编码。
[0014] 在L和R声道实质上是独立信号的情况下，运样的感知立体声编码器通常不使用 M/S立体声编码，因为在该情况下，与L/R立体声编码相比，运样的编码方案不提供任何编码增益。编码器将退回普通的L/R立体声编码，实质上独立地处理L和R。
[0015] 在相同的情况下，PS编码器系统创建包含L和R声道的缩混信号，运防止了L和 R声道的独立处理。对于使用残余信号的PS编码，运可W带来与立体声编码相比而言较为低效的编码，在立体声编码中，L/R立体声编码或M/S立体声编码是自适应地可选择的。
[0016] 因此，存在下述情况，其中，PS编码器胜过在L/R立体声编码和M/S立体声编码之间自适应选择的感知立体声编码器，而在其他情况下，后一种编码器胜过PS编码器。

【发明内容】

[0017] 本申请描述了基于将使用残余的PS编码与自适应L/R或M/S感知立体声编码（例如，在MDCT域中的AAC感知联合立体声编码）组合的思想的一种音频编码器系统和一种编码方法。运允许组合自适应L/R或M/S立体声编码（例如，在MPEGAAC中使用）的优点和使用残余信号的PS编码（例如，在环绕MPEG中使用）的优点。而且，本申请描述了对应的音频解码器系统和解码方法。
[0018] 本申请的第一方面设及一种编码器系统，用于将立体声信号编码为比特流信号。根据所述编码器系统的一个实施例，所述编码器系统包括缩混级，用于基于所述立体声信号来生成缩混信号和残余信号。所述残余信号可W覆盖所使用的音频频率范围的全部或仅一部分。另外，所述编码器系统包括参数确定级，用于确定PS参数，诸如声道间强度差和声道间交叉相关。优选地，所述PS参数是频率变化的。运样的缩混级和参数确定级通常是PS 编码器的一部分。
[0019] 另外，所述编码器系统包括在所述缩混级的下游的感知编码装置，其中，能够选择两个编码方案：
[0020] -基于所述缩混信号和所述残余信号的和W及基于所述缩混信号和所述残余信号的差的编码，或者
[0021] -基于所述缩混信号和基于所述残余信号的编码。
[0022] 应当注意，在编码基于所述缩混信号和所述残余信号的情况下，可W对所述缩混信号和所述残余信号编码，或可W对与其成比例的信号编码。在编码基于和与差的情况下，则可W对所述和与差编码，或可W对与其成比例的信号编码。
[0023] 所述选择可W是频率变化的（和时间变化的），即，对于第一频带，可W选择编码基于和信号与差信号，而对于第二频带，可W选择编码基于所述缩混信号和基于所述残余信号。
[0024] 运样的编码器系统具有允许在L/R立体声编码和使用残余的PS编码之间切换 (优选地W频率变化的方式）的优点：如果所述感知编码装置选择（对于特定频带或对于整个使用的频率范围）基于缩混和残余信号的编码，则所述编码系统表现为像使用利用残余的标准PS编码的系统那样。然而，如果所述感知编码装置选择（对于特定频带或对于整个所使用的频率范围）基于所述缩混信号和所述残余信号的和信号W及基于所述缩混信号和所述残余信号的差信号，则在特定的情况下，所述和与差操作实质上补偿了在前的缩混操作（除了可能不同的增益因子），W使得整个系统可W实际上执行整个立体声信号或针对其频带的L/R编码。例如，当所述立体声信号的L和R声道是独立的并且具有相同的电平时，运样的情况出现，如下详细所述。
[00巧]优选地，所述编码方案的适用是时间和频率相关的。因此，优选地，通过L/R编码方案来对所述立体声信号的一些频带编码，而通过使用残余的PS编码方案来对所述立体声信号的其他频带编码。
[0026] 应当注意，在如上所述的编码基于缩混信号并且基于残余信号的情况下，可W通过对于缩混信号和残余信号的两个相逆（除了可能不同的增益因子）的串行操作来形成输入到核屯、编码器的实际信号。例如，缩混信号和残余信号被馈送到M/S至L/R变换级，然后该变换级的输出被馈送到L/R至M/S变换级。产生的信号（然后用于编码）对应于缩混信号和残余信号（除了可能不同的增益因子之外）。
[0027] 下面的实施例利用运种思想。根据所述编码器系统的一个实施例，所述编码器系统包括如上所述的缩混级和参数确定级。而且，所述编码器系统包括变换级（例如，作为如上所述的编码装置的一部分）。变换级通过执行缩混信号和残余信号的变换来生成伪L/R 立体声信号。变换级优选地执行和与差变换，其中，对所述缩混信号和所述残余信号求和W 生成所述伪立体声信号的一个声道（可能所述和也乘W因子），并且彼此相减W生成所述伪立体声信号的另一个声道（可能所述差也乘W因子）。优选地，所述伪立体声信号的第一声道（例如，伪左声道）与所述缩混和残余信号的和成比例，而第二声道（例如，伪右声道）与所述缩混和残余信号的差成比例。因此，来自所述PS编码器的缩混信号DMX和残余信号RES可W根据下式转换为伪立体声信号Lp、化：
[0028] Lp=g〇)MX+RE巧
[0029] Rp=g〇)MX-RE巧
[0030] 在上式中，增益归一化因子g具有例如值勞。
[0031] 所述伪立体声信号优选地由感知立体声编码器（例如，作为所述编码装置的一部分）处理。对于编码，能够选择L/R立体声编码或M/S立体声编码。自适应L/R和M/S感知立体声编码器可W是基于AAC的编码器。优选地，在L/R立体声编码和M/S立体声编码之间的选择是频率变化的；因此，如上所述，所述选择可W对于不同频带变化。而且，在L/R 编码和M/S编码之间的选择优选地是时间变化的。优选地由所述感知立体声编码器进行在 L/R编码和M/S编码之间的选定。
[0032] 具有M/S编码的选项的运样的感知编码器可W基于所述伪立体声L/R信号来内部计算（伪）M和S信号（在时域或在所选择的频带中）。运样的伪M和S信号对应于缩混和残余信号（除了可能不同的增益因子）。因此，如果所述感知立体声编码器选择M/S编码，则它实际上对所述缩混和残余信号（它们对应于所述伪M和S信号）编码，就像在使用利用残余的标准PS编码的系统中进行的那样。
[0033] 而且，在特殊情况下，所述变换级实质上补偿在前的缩混操作（除了可能不同的增益因子之外），W使得整个编码器系统可W实际上执行整个立体声信号的L/R编码或对于其频带的L/R编码（如果在感知编码器中选择L/R编码）。运是例如在所述立体声信号的L和R声道是独立的并且具有相同电平时的情形，如下将详细所述。因此，如果对于给定频带所述立体声信号的左和右声道实质上是独立的并且具有实质上相同的电平，则对于该频带，所述伪立体声信号实质上与所述立体声信号对应或成比例。
[0034] 因此，所述编码器系统实际上允许在L/R立体声编码和使用残余的PS编码之间切换，W便能够适应于给定立体声输入信号的属性。优选地，所述编码方案的适用是时间和频率相关的。因此，优选地，通过L/R编码方案来对所述立体声信号的一些频带编码，而通过使用残余的PS编码方案来对立体声信号的其他频带编码。应当注意，M/S编码实质上是使用残余的PS编码的特殊情况（因为，L/R至M/S变换是PS缩混操作的特殊情况），因此，编码器系统也可W执行整体的M/S编码。
[0035] 具有在所述PS编码器下游和所述L/R或M/S感知立体声编码器上游的变换级的所述实施例具有可W使用传统PS编码器和传统感知编码器的优点。尽管如此，由于此处的特殊使用，可W适用所述PS编码器或所述感知编码器。
[0036] 新的概念通过使能PS编码和联合立体声编码的高效组合改善了立体声编码的性能。
[0037] 根据一个替选实施例，如上所述的编码装置包括变换级，用于对于一个或更多个频带（例如，对于整个使用的频率范围或仅对于一个频率范围）基于所述缩混信号和所述残余信号来执行和与差变换。可W在频域或时域中执行所述变换。所述变换级生成针对所述一个或更多个频带的伪左/右立体声信号。所述伪立体声信号的一个声道对应于所述和，并且另一个声道对应于所述差。
[003引因此，在编码基于所述和与差信号的情况下，所述变换级的输出可W用于编码，而在编码基于所述缩混信号和所述残余信号的情况下，在所述编码级的上游的信号可W用于编码。因此，该实施例不对所述缩混信号和残余信号使用两个串行的和与差变换，产生所述缩混信号和残余信号（除了可能不同的增益因子之外）。
[0039] 当基于所述缩混信号和残余信号来选择编码时，选择立体声信号的参数立体声编码。当基于所述和与差来选择编码时（即，基于伪立体声信号的编码），选择立体声信号的 L/R编码。
[0040] 所述变换级可W是作为具有在L/R和M/S立体声编码之间的自适应选择的感知编码器的一部分的L/R至M/S变换级（与传统的L/R至M/S变换级相比，可能增益因子不同）。应当注意，在L/R和M/S立体声编码之间的选定应当反相。因此，当所述选定装置选定M/S感知解码时，选择基于缩混信号和残余信号的编码（即，编码信号不通过变换级），而当所述选定装置选定L/R感知解码时，选择基于由所述变换级生成的所述伪立体声信号的编码（即，编码信号通过变换级）。
[0041] 根据如上所述的实施例的任何一个所述的编码器系统可W包括附加的SBR(频段复制）编码器。SBR是HFR(高频重建）的一种形式。SBR编码器确定用于在解码器中音频信号的较高频范围的重建的侧边信息。感知编码器仅对较低频率范围编码，由此减小比特率。优选地，所述SBR编码器连接到所述PS编码器的上游。因此，所述SBR编码器可W在立体声域中，并且生成用于立体声信号的SBR参数。将结合附图对此进行详细讨论。
[0042] 优选地，所述PS编码器（即，缩混级和参数确定级）在过采样频域中运行（如下所述的PS解码器也同样优选地在过采样频域中运行）。对于时间至频率变换，例如，可W在 PS编码器上游使用具有QMF(正交镜像滤波器）和奈奎斯特滤波器的复值混合滤波器组，如在环绕MPEG标准中所述（参见文件IS0/IEC23003-1)。运允许时间和频率自适应信号处理，而无可听的失真伪像。另一方面，优选地，在临界采样MDCT域（例如，如在AAC中所述）中执行自适应L/R或M/S编码，W便保证高效的量化信号表示。

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：海科·普尔哈根;蓬图斯·卡尔森;克里斯托弗·薛林;
技术所有人：杜比国际公司;
我是此专利的发明人