对编码的音频信号进行解码的设备和方法

文档序号:2823149阅读:263来源:国知局
专利名称:对编码的音频信号进行解码的设备和方法
技术领域
本发明涉及对编码的音频信号进行解码的设备及方法、用于编码的设备、用于编 码的方法及音频信号。
背景技术
在现有技术中,诸如MP3或AAC的频域编码方案是已知的。这些频域编码器基于 时域/频域转换、随后的量化阶段,在阶段,使用来自心理声学模块的信息控制量化误差、 及编码阶段,在阶段,使用代码表对量化的频谱系数及对应的旁侧信息进行熵编码。另一方面,如在3GPP TS 26. 290中描述的AMR-WB+极为适于语音处理的编码器。 这种语音编码方案执行滤波时域信号的线性预测(LP)。这种LP滤波源于对输入时域信号 的线性预测分析。然后,所产生的LP滤波器系数被编码且作为旁侧信息予以传送。过程已 知为线性预测编码(LPC)。在滤波器的输出处,使用ACELP编码器的综合分析阶段对已知为 激励信号的预测残差信号或预测误差信号进行编码,或可选择地使用变换编码器来编码, 变换编码器使用具有交迭的傅利叶变换。在ACELP编码和被称为TCX编码的变换编码的激 励编码之间的决策使用闭环或开环算法来实现。结合了 AAC编码方案与频谱带宽复制技术的高效率AAC的频域音频编码方案还可 结合于联合立体声或可称为“环绕MPEG”的多声道编码工具。另一方面,诸如AMR-WB+的语 音编码器还具有高频增强阶段及立体声功能。频谱带复制(SBR)包括附加到MP3及高阶音频编码(AAC)的受欢迎的感知音频的 增加的受欢迎程度的技术。SBR包括带宽扩展(BTO)的方法,在方法中,频谱的低带(基带 或核心带)使用现存的编码来编码,而高带(或高带)使用较少的参数予以粗略地参数化。 SBR利用低带与高带之间的相关性来预测从较低频带特征提取的高带信号。例如,在HE-AAC或AAC+SBR中使用SBR。在SBR中可能动态地改变交叉频率(BTO 起始频率)以及每帧参数组(包络)之数量的时间分辨率。AMR-WB+实施与经转换时域/频 域核心编码器相结合的时域带宽扩展,特别是为语音信号提供良好的音频质量。对AMR-WB+ 音频质量限制性的因素是音频带宽对于核心编解码器及为系统内部取样频率之四分之一 的BWE起始频率二者是共享的。尽管ACELP语音模型能够在完全带宽中极佳地模型化语音 信号,但是频域音频编码器不能为某些通常的音频信号传递良好质量。因而,语音编码方案 仅在低位速率下对语音信号显示了高质量,而在低位速率下对音乐信号显示了差质量。诸如HE-AAC之频域编码方案是有利的,因为它们显示了在低位速率下音乐信号 的高质量。然而,问题是在低位速率下语音信号的质量。因而,不同类别的音频信号要求不同特性的带宽扩展工具。

发明内容
本发明的目的是提供改良的编码/解码概念。本发明的目的由权利要求1的音频解码器、权利他要求13的音频解码方法、权利要求8的编码器、权利要求14的编码方法、权利要求15的编码信号或权利要求16的计算 机程序予以实现。本发明是基于下述发现交叉频率或BWE起始频率是影响音频质量的参数。尽管 时域(语音)编解码器通常以给定的取样速率来编码整个频率范围,但是音频带宽是对变 换式编码器(例如音乐编码器)的调谐参数,随着用以编码的频谱线的总数的降低,将同时 增加用于编码的每一频谱线的位数,这意味着达到质量对音频带宽的折衷。因此,在新的方 法中,具有可变音频带宽的不同核心编码器与具有共享BffE模块的转换系统相结合,其中 BffE模块必须考虑不同的音频带宽。可用直接的方式来找出所有核心编码器带宽的最低带宽且用此作为BffE起始频 率,但这将恶化所感知的音频质量。而且,因为在具有与BffE起始频率相比较高的带宽的 时间部分中核心编码器起作用,一些频率区域将由核心编码器以及引入冗余的BffE表现两 次,所以编码效率将被降低。因而,较好的解决方案是使BffE起始频率适应于所使用的核心 编码器的音频带宽。因此,根据本发明之实施例,音频编码系统将带宽扩展工具与信号相依核心编码 器(例如经转换的语音/音频编码器)相结合,其中交叉频率包括可变的参数。控制不同 核心编码模式之间转换的信号分类器输出还可用以转换BffE系统的诸如时间分辨率与抹 去(smearing)、频谱分辨率与交叉频率的特性。因而,本发明的一方面是用于编码的音频信号的音频解码器,编码的音频信号包 括根据第一编码算法编码的第一部分,根据第二编码算法编码的第二部分,用于第一部分 及第二部分的BWE参数,指示第一解码算法或第二解码算法的编码模式信息,音频解码器 包括第一解码器、第二解码器、BWE模块及控制器。第一解码器根据用于编码的信号的第一 时间部分的第一解码算法解码第一部分,以获得第一解码的信号。第二解码器根据用于编 码的信号的第二时间部分的第二解码算法解码第二部分,以获得第二解码的信号。BffE模块 具有可控制的交叉频率且使用第一解码的信号及用于第一部分的BWE参数来执行带宽扩 展算法,且使用第二解码的信号及用于第二部分的带宽扩展参数来执行带宽扩展算法。控 制器根据编码模式信息来控制BWE模块的交叉频率。根据本发明的另一方面,编码音频信号的设备包括第一及第二编码器、决策模块 及BffE模块。第一编码器根据第一编码算法来编码,第一编码算法具有第一频率带宽。第二 编码器根据第二编码算法来编码,第二编码算法具有较第一频率带宽小的第二频率带宽。 决策模块指示用于音频信号的第一部分的第一编码算法及用于音频信号的第二部分的第 二编码算法,第二部分不同于第一部分。带宽扩展模块计算用于音频信号的BffE参数,其中 BWE模块由决策模块控制来为不包括在音频信号的第一部分中的第一频率带宽的频带且不 包括在音频信号的第二部分中的第二频率带宽的频带计算BWE参数。与本发明的实施例相反,现有技术中的SBR仅应用于导致下面缺点的非转换音频 编解码器中。可动态地施加时间分辨率以及交叉频率二者,但是诸如3GPP的规范中,通常 仅对瞬间的时间分辨率进行改变(如响板)。另外,当位速率依赖调谐参数时,可在较高速 率下选择较细微整体时间分辨率。没有明显的分类被执行来判定时间分辨率或控制时间分 辨率的决策阈值,以及判定例如静止的、音调音乐对语音的最佳匹配的信号类型。本发明的 实施例克服了这些缺点。实施例特别允许采用的交叉频率与对所使用的核心编码器的弹性选择相结合,以便编码的信号提供相对比于现有技术的编码器/解码器明显较高的感知质量。


下面,参考附图来描述本发明的优选实施例,其中图1显示了本发明第一方面的用于解码的设备的方块图;图2显示了本发明第一方面的用于编码的设备的方块图;图3显示了详细的编码方案的方块图;图4显示了详细的解码方案的方块图;图5显示了本发明第二方面的编码方案的方块图;图6显示了本发明第二方面的解码方案的示意图;图7示出了提供短期预测信息及预测误差信号的编码器侧的LPC阶段;图8示出了用于产生加权信号的LPC装置的又一实施例;图9a_9b显示了包括导致音频信号的不同时间分辨率的音频/语音开关的编码 器;及图10示出了编码的音频信号的示意图。
具体实施例方式图1显示用以将编码的音频信号102解码的解码器设备100。解码的音频信号102 包括根据第一编码算法编码的第一部分104a、根据第二编码算法编码的第二部分104b、第 一时间部分10 及第二时间部分104b的BWE参数106及为各个时间部分指示第一解码算 法或第二解码算法的编码模式信息108。用以解码的设备100包括第一解码器110a、第二解 码器110b、BTO模块130及控制器140。第一解码器IlOa适用于根据用于编码的信号102 的第一时间部分的第一解码算法来解码第一部分104a,以获得第一解码的信号114a。第二 解码器IlOb根据用于编码的信号的第二时间部分的第二解码算法来解码第二部分104b, 以获得第二解码的信号114b。BWE模块130具有调整BWE模块130的性能的可控制的交叉 频率fx。BWE模块130执行带宽扩展算法,以基于第一解码的信号IHa及第一部分的BWE 参数106在高频率带中产生音频信号的分量,并基于第二解码的信号114b及第二部分的带 宽扩展参数106在高频率带中产生音频信号的分量。控制器140根据编码模式信息108来 控制BWE模块130的交叉频率fx。BffE模块130还可包括将低频履带与高频率带的音频信号分量相结合的结合器且 输出所产生的音频信号105。例如,编码模式信息108指示编码的音频信号102的哪个时间部分由哪种编码算 法编码。此信息可同时识别用于不同时间部分的解码器。此外,编码模式信息108可控制 开关以在不同时间部分的不同解码器之间转换。因此,交叉频率fx是根据所使用的解码器予以调整的可调整的参数,其可包括例 如作为第一解码器IlOa的语音解码器及作为第二解码器IlOb的音频解码器。如上所述,语 音解码器的交叉频率(如对于基于LPC的范例)可高于用于音频解码器(例如对于音乐) 的交叉频率。因而,在另一实施例中,控制器220在时间部分之一(例如第二时间部分)内增加交叉频率fx或降低交叉频率fx,使得交叉频率可获改变而不改变解码算法。这意味着 交叉频率中的改变可与所使用的解码器中的改变不相关交叉频率可获改变而不改变所使 用的解码器或反之亦然,解码器可获改变而不改变交叉频率。BffE模块130还可包括由控制器140和/或由BWE参数106控制的开关,以便第一 解码的信号IHa在第一时间部分期间由BWE模块130来处理,且第二解码的信号114b在 第二时间部分期间由BWE模块130来处理。此开关可由交叉频率fx中的改变或由在编码 的音频信号102内的明确的位指示在各个时间部分期间所使用的编码算法来激活。在另外的实施例中,开关在第一和第二时间部分之间从第一解码器至第二解码器 转换,使得带宽扩展算法应用于第一解码的信号或应用于第二解码的信号。可选择地,带宽 扩展算法应用于第一和/或第二解码的信号,且开关放置在第一解码器和/或第二解码器 之后,使得略去带宽扩展信号之一。图2显示用于编码音频信号105的设备200的方块图。用于编码的设备200包括 第一编码器210a、第二编码器210b、决策模块220及带宽扩展模块(BTO模块)230。第一编 码器210a根据具有第一频率带宽的第一编码算法来编码。第二编码器210b根据具有小于 第一频率带宽的第二频率带宽的第二编码算法来编码。例如,第一编码器可是如LPC编码 器的语音编码器,而第二编码器210b可包括音频(音乐)编码器。决策模块220指示用于 音频信号105的第一部分20 的第一编码算法,且指示用于音频信号105的第二部分204b 的第二编码算法,其中第二时间部分不同于第一时间部分。第一部分20 可对应于第一时 间部分,且第二部分204b可对应于不同于第一时间部分的第二时间部分。BffE模块230计算音频信号105的BWE参数106,且由决策模块220控制以对不包 括在音频信号105的第一时间部分20 中的第一频率带宽的第一频带计算BWE参数106。 BffE模块230进一步对不包括在音频信号150的第二时间部分204b中的第二带宽的第二频 带计算BffE参数106。因此,第一(第二)频带包括在第一(第二)频率带宽之外且由交叉 频率fx限制于频谱的低端的音频信号105的频率分量。因而,第一或第二带宽由决策模块 220控制的可变交叉频率来定义。此外,BWE模块230可包括由决策模块220控制的开关。决策模块220可为给定的 时间部分确定较佳的编码算法且控制开关,使得在给定时间部分期间使用较佳的编码器。 所修改的编码模式信息108’包括对应的开关信号。而且,BffE模块230还可包括滤波器, 以在由可包括大约4kHz或5kHz的值的交叉频率fx分离的低/高频率带中获得音频信号 105的分量。最后,BTO 130还可包括分析工具,以确定OTE参数106。所修改的编码模式 信息108’可等效(或相等)于编码模式信息108。例如,编码模式信息108指示在编码的 音频信号105的比特流中各个时间部分所使用的编码算法。根据另外的实施例,决策模块220包括分析最初输入信号105且产生触发选择不 同编码模式的控制信息108的信号分类器工具。输入信号105分析的目的是对给定的输入 信号帧选择最佳的核心编码模式。信号分类器的输出还可(可选的)用以影响其它工具的 性能,例如环绕MPEG、增强SBR、时间扭曲滤波器组及其它。对信号分类器工具的输入包括 例如最初未修改的输入信号105,而且还可选地包括附加的实施依赖参数。信号分类器工具 的输出包括控制信号108,以控制核心编解码器(例如非LP滤波频域或LP滤波时域或频域 编码或其它编码算法)的选择。
根据实施例,交叉频率fx是与转换环决策相结合可调整的信号,以便使用不同的 编码算法。因而,简单的开关信号可仅是在交叉频率fx中的改变(跳跃)。此外,编码模式 信息108还可包括同时指示较佳编码方案(例如语音/音频/音乐)的交叉频率fx的改变。根据另外的实施例,决策模块220分析音频信号105或第一编码器210a的第一输 出或第二编码器210b的第二输出或通过解码与目标函数相关的第一编码器210a或第二编 码器210b的输出信号获得的信号。可选的,决策模块220以下述方式执行语音/音乐识别 相对于音乐决策偏爱于语音决策,即使当小于第一开关的帧的50%的部分是语音且大于第 一开关的帧的50%的部分是音乐,也采用语音决策。因而,决策模块220可包括分析工具, 该分析工具分析音频信号以决定音频信号是否主要为语音信号或主要为音乐信号,以便基 于结果,决策模块可决定哪个是将用于分析音频信号的时间部分的最佳编解码器。图1和2没有显示编码器/解码器的许多细节。编码器/解码器之可能的详细范 例显示于下面的附图中。除了图1的第一及第二解码器110a、b,还可以存在使用或不使用 其它编码算法的其他解码器。以同一方式,图2的编码器200还可包括可使用附加编码算 法的附加编码器。在下面,将更详细地解释具有两个编码器/解码器的范例。图3更详细地绘示具有两个串接开关的编码器。单声道信号、立体声信号或多声 道信号被输入到决策模块220并输入到图2的BWE模块230的部分的开关232。开关232 由决策模块220控制。可选的,决策模块220还可接收包括于单声道信号、立体声信号或多 声道信号中或至少与这一信号相关联的旁侧信息,其中信息是现有的,例如是在最初产生 单声道信号、立体声信号或多声道信号时所产生的。决策模块220启动开关232,以将信号提供给在图3的上部分支处所示的频率编码 部分210b或在图3的下部分支处所示的LPC域编码部分210a。频域编码分支的重要组件 是将共享预处理阶段输出信号(如稍后将讨论的)转换成频谱域中的频谱转换模块410。 频谱转换模块可包括MDCT算法、QMF、FFT算法、小波分析或诸如具有一定数量的滤波器组 声道的临界取样滤波器组的滤波器组,其中此滤波器组中的子带信号可以是实值信号或复 值信号。频谱转换模块410的输出使用可包括已知的AAC编码方案的处理模块的频谱音频 编码器421来编码。一般地,分支210b中的处理是基于感知式模型或信息汇聚模型的处理。因而,此 分支模型化接收声音的人类听觉系统。相反地,分支210a中的处理用以产生在激励、残差 或LPC域中的信号。一般地,分支210a中的处理是基于语音模型或信息产生模型的处理。 对于语音信号,此模型是产生声音的人类语音/声音产生系统的模型。然而,如果来自需要 不同声音产生模型的不同源的声音被编码时,那么分支210a中的处理可不同。除了所显示 的编码分支,另外的实施例包括附加的分支或核心编码器。例如,对于不同的源,可选地存 在不同的编码器,使得来自每个源的声音可由使用较佳的编码器予以编码。在下部编码分支210a中,重要的组件是输出用于控制LPC滤波器特性的LPC信息 的LPC装置510。此LPC信息被传送至解码器。LPC模块510的输出信号是由激励信号和 /或加权信号组成的LPC域信号。LPC装置一般地输出可能是在LPC域中的任何信号的LPC域信号或由将LPC滤波 器系数应用于音频信号所产生的任何其它信号。此外,LPC装置还可判定这些系数且还可量化/编码这些系数。决策模块220中的决策可是信号自适应,以便决策模块执行音乐/语音鉴别,以将 音乐信号输入上部分支210b和将语音信号输入下部分支210a的方式来控制开关232。在 实施例中,决策模块220将其决策信息提供给输出比特流,使得解码器可使用此决策信息 来执行正确的解码操作。例如,此决策信息可包括编码模式信息108,编码模式信息108包 括有关交叉频率fx或交叉频率fx的改变的信息。这种解码器示于图4中。频谱音频编码器421的信号输出在传送之后输入至频谱 音频解码器431。频谱音频解码器431的输出输入至时域转换器440(时域转换器一般地可 以是从第一至第二域的转换器)。相似地,图3的LPC域编码分支210a的输出被接收于解 码器侧且由组件531、533、534及532予以处理,以获得LPC激励信号。LPC激励信号输入至 LPC合成模块M0,LPC合成模块540接收由对应的LPC分析模块510所产生的LPC信息作 为另一输入。时域转换器440的输出和/或LPC合成模块540的输出输入至图1的BWE模 块130的部分的开关132。开关132经由例如由决策模块220所产生或诸如从外部由最初 单声道信号、立体声信号或多声道信号的产生器所提供的开关控制信号(诸如编码模式信 息108和/或BffE参数106)来控制。在图3中,至开关232及决策模块220的输入信号可是单声道信号、立体声信号、 多声道信号或通常地为任何音频信号。依据可来源于开关232的输入信号或来源于输入 至模块232的信号的最初音频信号的产生器的任何外部来源的决策,开关在频率编码分支 210b与LPC编码分支210a之间转换。频率编码分支210b包括频谱转换模块410及随后相 连接的量化/编码模块421。量化/编码模块可包括来自诸如ACC编码器的当代频域编码 器的已知的任何功能。此外,在量化/编码模块421中的量化操作可经由产生诸如心理声 学遮蔽阈值的心理声学信息的心理声学模块来予以控制,其中,此信息输入至模块421。在LPC编码分支210a中,开关输出信号经由产生LPC旁侧信息及LPC域信号的 LPC分析模块510来处理。激励编码器可包括附加开关,用于在LPC域中的量化/编码操 作522或正处理LPC频谱域中的值的量化/编码模块5M之间的LPC域信号进行进一步处 理。为此目的,频谱转换器523提供于量化/编码模块524的输入处。开关521依据例如 AMR-WB+技术规范中所描述的特定设置以开环形式或以闭环形式来控制。对于闭环控制模式,编码器另外包括对于LPC域信号的反向量化器/编码器531、 对于LPC频谱域信号的反向量化器/编码器533及对于项533的输出的反向频谱转换器 534。在第二编码分支的处理分支中编码的的及解码的的信号二者输入至开关控制装置 525。在开关控制装置525中,这两个输出信号予以相互比较及/或与目标函数相比较或目 标函数可基于二信号中失真的比较来计算,以便使用具有较低失真的信号来决定开关521 应采用哪一位置。可选择地,如果二个分支提供非固定的位速率,那么即使当此分支的失真 或感知失真低于另一分支的失真或感知失真(失真的范例可以是信号对噪声比)时可选择 提供较低位速率的分支。可选择地,目标函数可使用每个信号的失真及每个信号的位速率 及/或附加标准作为输入以找出对特定目的的最佳决策。例如,如果目的是位速率要尽可 能的低,那么目标函数将很大程度上依赖于组件531、534的二个信号输出的位速率。然而, 当主要目的是具有最好质量的某一位速率,那么开关控制525可丢弃在所允许的位速率之 上的各个信号,且当二个信号在所允许之位速率之下时,开关控制将选择具有较佳估计主观质量,即具有较少的量化/编码失真或较好的信号对噪声比的信号。根据实施例的解碼方案如前所述示于图4中。对于三个可能的输出信号类型的每 一类型,存在特定的解碼/再量化模块431、531或533。尽管模块431输出使用频率/时 间转换器440转换为时域的频率频谱,但是模块531输出LPC域信号,且项533输出LPC频 谱。为了确保至开关532的输入信号均在LPC域中,提供了 LPC频谱/LPC转换器534。开 关532的输出数据通过使用经由编码器侧所产生且传送的LPC信息控制的LPC合成模块 540转换回时域。接着,在模块540之后,为了依据输入至图3的编码方案的信号最终获得 诸如单声道信号、立体声信号或多声道信号的音频信号,二个分支具有根据开关控制信号 来转换的时域信息。图5及6显示编码器/解码器的另外的实施例,其中BWE阶段作为BWE模块130、 230的部分表现共享的处理单元。图5示出了编码方案,其中连接于开关232输入的共享预处理方案可包括产生联 合立体声参数及由下混频具有二个或更多个声道的信号的单声道信号作为输出的环绕/ 联合立体声模块101。一般地,在模块101的输出处的信号还可以是具有多个声道的信号, 但由于模块101的下混频功能,在模块101的输出处的声道数量将小于输入至模块101的 声道的数量。共享的预处理方案除了包括模块101之外,还包括带宽扩展模块230。在图5的实 施例中,模块101的输出输入至在其输出处输出如低频带信号或低通信号的限带信号的带 宽扩展模块230。较佳地,此信号也是(例如由二个因子)下降取样。另外,对于输入至模 块230的信号的高频带,如来自MPEG-4的HE-AAC简档的已知的频谱包络参数、反向滤波参 数、噪声基准参数等的带宽扩展参数106被产生且发送至比特流多路复用器800。较佳地,为了在例如音乐模式或语音模式之间决策,决策模块220接收输入至模 块101或输入至模块230的信号。在音乐模式中,上编码分支210b (图2中的第二编码器) 被选择,而在语音模式中,下编码分支210a被选择。较佳地,决策模块附加地控制联合立体 声模块101及/或带宽扩展模块230,以使这些模块的功能适应于特定的信号。因而,当决 策模块220判定输入信号的某一时间部分对应于如音乐模式的第一模式时,那么模块101 及/或模块230的特定特征可由决策模块220控制。可选择地,当决策模块220判定信号 对应于语音模式或一般地在第二 LPC域模式中,那么模块101及230的特定特征可根据决 策模块输出来控制。决策模块220还可产生控制信息108及/或还可传送至BWE模块230 且至比特流多任务器800的交叉频率fx,该交叉频率fx将被传送至解码器侧。较佳地,编码分支210b的频谱转换使用尤较佳地为时间扭曲MDCT操作的MDCT操 作来完成,其中强度或一般地扭曲强度可被控制在零与高扭曲强度之间。在零扭曲强度中, 模块411中的MDCT操作是在已知的直接MDCT操作。时间扭曲强度可与时间扭曲旁侧信息 一起作为旁侧信息被传送/输入至比特流多任务器800。在LPC编码分支中,LPC域编码器可包括计算间距增益、间距滞后及/或诸如码薄 索引及增益的码薄信息的ACELP核心526。已知的来自3GPPTS 26. 290的TCX模式包括在 变换域中感知加权信号的处理。傅利叶变换加权信号利用具有噪声因数量化得分裂多速率 格点量化(代数VQ)来量化。变换在10M、512或256个样本窗口中予以计算。激励信号 由经过反向加权滤波器的反向滤波经量化的加权信号而重新获得。TCX模式还可以经修改的形式予以使用,其中MDCT与扩大的交迭、缩放量化及用以将频谱线编码的算术编码器一 起使用。在“音乐”编码分支210b中,频谱转换器较佳地包括具有某些窗口函数的特别适 应的MDCT操作,其之后是可由单个矢量量化模块组成的量化/熵编码器模块,但是较佳地 是类似于在频域编码分支中(即图5的项421中)的量化器/编码器的组合的缩放量化器
/熵编码器。在“语音”编码分支210a中,LPC模块510之后是开关521,再之后是ACELP模块 526 或 TCX 模块 527。ACELP 描述于 3GPP TS 26. 190 中且 TCX 描述于 3GPP TS 26. 290 中。 一般地,ACELP模块5 接收由图7所描述的程序所计算出的LPC激励信号。TCX模块527 接收由图8所产生的加权信号。在图6中所说明的解码器侧,在模块537中的反向频谱变换之后,加权滤波 器的反向被应用,即(l-yzl/a-Ab/Y))。接着信号由(I-A(Z))予以滤波以转到 LPC激励域。因而,对LPC域模块534及TCF1模块537的转换包括反向变换及接着由
权利要求
1.一种用于对编码的音频信号(10 进行解码的设备(100),编码的音频信号(102) 包括根据第一编码算法编码的第一部分(10 )、根据第二编码算法编码的第二部分 (104b)、用于第一部分(104a)及第二部分(104b)的带宽扩展模块BffE参数(106)及指示 第一解码算法或第二解码算法的编码模式信息(108),包括第一解码器(110a),根据用于编码的信号(10 的第一时间部分的第一解码算法解码 第一部分(10 ),以获得第一解码的信号(114a);第二解码器(110b),根据用于编码的信号(10 的第二时间部分的第二解码算法解码 第二部分(104b),以获得第二解码的信号(114b);BffE模块(130),具有可控制的交叉频率fx,BffE模块(130)使用第一解码的信号 (114a)及用于第一部分(104a)的BffE参数(106)来执行带宽扩展算法,并使用第二解码的 信号(114b)及用于第二部分(104b)的BffE参数(106)来执行带宽扩展算法;及控制器(140),根据编码模式信息(108)控制用于BffE模块(130)的交叉频率(fx)。
2.根据权利要求1所述的解码的设备(100),还包括输入接口(900),用于输入编码的 音频信号(102)作为比特流。
3.根据权利要求1或2所述的解码的设备(100),其中,BffE模块(130)包括在第一和 第二时间部分之间从第一解码器(IlOa)切换至第二解码器(IlOb)的开关(132),使得带宽 扩展算法应用于第一解码的信号(114a)或应用于第二解码的信号(114b)。
4.根据权利要求3所述的解码的设备(100),其中,控制器(140)依赖于编码模式信息 (108)内所指示的解码算法来控制开关(132)。
5.根据前述权利要求之一所述的解码的设备(100),其中,BffE模块(130)对于第一解 码的信号(114a)的带宽扩展使用第一交叉频率(fxl)、对于第二解码的信号(114b)的带宽 扩展使用第二交叉频率(fx2),其中,第一交叉频率(fxl)高于第二交叉频率(fx2)。
6.根据前述权利要求之一所述的解码的设备(100),其中,控制器(140)在第一时间部 分内增加交叉频率(fx)或在第二时间部分内降低交叉频率(fx)。
7.根据前述权利要求之一所述的解码的设备(100),其中,第一解码器(IlOa)包括LPC 编码器,其中,第二解码器(IlOb)包括变换式编码器。
8.一种对音频信号(10 进行编码的设备000),包括第一编码器(210a),根据第一编码算法进行编码,第一编码算法具有第一频率带宽;第二编码器OlOb),根据第二编码算法进行编码,第二编码算法具有小于第一频率带 宽的第二频率带宽;决策模块020),用于指示音频信号(105)的第一部分的第一编码算法、用于指 示音频信号(10 的第二部分O04b)的第二编码算法,所述第二部分O04b)不同于第一 部分;以及带宽扩展模块BffE030),用于计算音频信号(10 的带宽扩展模块030),用于计算音 频信号(105)的BffE参数(106),其中,BffE模块Q30)由决策模块(220)控制,以计算不包 括音频信号(10 的第一部分O04a)中的第一频率带宽的频带和不包括音频信号(105) 的第二部分O04b)中的第二频率带宽的频带的BffE参数(106)。
9.根据权利要求8所述的编码的设备000),还包括输出接口(800),用于输出编码的 音频信号(102),编码的音频信号(10 包括根据第一编码算法编码的第一部分(10 )、根据第二编码算法编码的第二部分(104b)、用于第一部分(104a)及第二部分(104b)的BWE 参数(106)、以及指示第一解码算法或第二解码算法的编码模式信息(108)。
10.根据权利要求8或9所述的编码的设备000),其中,第一或第二带宽由可变的交 叉频率(fx)来定义,其中,决策模块(220)输出可变的交叉频率(fx)。
11.根据权利要求8至10之一所述的编码的设备000),其中,BffE模块(230)包括由 决策模块(220)控制的开关032),其中,所述开关(232)在第一与第二时间编码器QlOa、 210b)之间转换,使得音频信号(10 在不同的时间部分由第一或由第二编码器OlOa、 210b)编码。
12.根据权利要求8至11之一所述的编码的设备000),其中,决策模块(220)分析音 频信号(105)、第一编码器OlOa)的第一输出、第二编码器OlOb)的第二输出、由关于目标 函数而解码第一编码器OlOa)或第二编码器OlOb)的输出信号所获得的信号。
13.一种对编码的音频信号(10 进行解码的方法,编码的音频信号(10 包括根据第 一编码算法编码的第一部分(10 )、根据第二编码算法编码的第二部分(104b)、用于第一 部分(104a)及第二部分(104b)的带宽扩展模块BffE参数(106)及指示第一解码算法或第 二解码算法的编码模式信息(108),所述方法包括在编码的信号(102)的第一时间部分根据第一解码算法解码第一部分(10 ),以获得 第一解码的信号(114a);在编码的信号(10 的第二时间部分根据第二解码算法解码第二部分(104b),以获得 第二解码的信号(114b);BffE模块(130),具有可控制的交叉频率(fx),BffE模块(130) 使用第一解码的信号(114a)和第一部分(104a)的BffE参数(106)执行带宽扩展算法、 并使用第二解码的信号(114b)和第二部分(104b)的BffE参数(106)执行带宽扩展算法; 以及根据编码模式信息(108)控制BffE模块(130)的交叉频率(fx)。
14.一种对音频信号(10 进行编码的方法,包括步骤 根据第一编码算法进行编码,第一编码算法具有第一频率带宽;根据第二编码算法进行编码,第二编码算法具有小于第一频率带宽的第二频率带宽; 指示用于音频信号(105)的第一部分的第一编码算法和用于音频信号(105) 的第二部分O04b)的第二编码算法,所述第二部分O04b)不同于第一部分O04a);以及 计算用于音频信号(10 的带宽扩展模块BffE参数(106),以便计算不包括音频信号 (105)的第一部分中的第一频率带宽的频带和不包括音频信号(10 的第二部分 (204b)中的第二频率带宽的频带的BffE参数(106)。
15.一种编码的音频信号(102),包括第一部分(10 ),根据第一编码算法进行编码; 第二部分(104b),根据不同的第二编码算法进行编码; 带宽扩展参数(106),用于第一部分(104a)和第二部分(104b);及 编码模式信息(108),指示用于第一部分(104a)的第一交叉频率(fxl)或用于第二部 分(104b)的第二交叉频率(fx2)。
16.一种计算机程序,当计算机程序运行在计算机上时,执行权利要求13或14的方法。
全文摘要
一种对编码的音频信号进行解码的设备,编码的音频信号包括根据第一编码算法编码的第一部分、根据第二编码算法编码的第二部分、用于第一部分及第二部分的BWE参数及指示第一解码算法或第二解码算法的编码模式信息,设备包括第一解码器、第二解码器、BWE模块及控制器。第一解码器根据用于编码的信号的第一时间部分的第一解码算法将第一部分解码以获得第一解码的信号。第二解码器根据用于编码的信号的第二时间部分的第二解码算法将第二部分解碼以获得第二解码的信号。BWE模块具有可控制的交叉频率且使用第一解码的信号及用于第一部分的BWE参数来执行带宽扩展算法,并使用第二解码的信号及用于第二部分的带宽扩展参数来执行带宽扩展算法。控制器根据编码模式信息控制用于BWE模块的交叉频率。
文档编号G10L21/02GK102089814SQ200980126705
公开日2011年6月8日 申请日期2009年6月23日 优先权日2008年7月11日
发明者乌尔里赫·克里默, 伯恩哈德·格里尔, 哈拉尔德·波普, 尼古劳斯·雷特尔巴, 弗雷德里克·内格尔, 曼努埃尔·扬德尔, 维尔吉利奥·巴奇加卢波, 马克思·诺伊恩多夫, 马库斯·洛瓦索, 马库斯·穆尔特鲁斯, 马雷·盖尔 申请人:弗劳恩霍夫应用研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1