对参数音频对象编码运用残差概念的编码器、解码器、系统及方法

文档序号:8449281阅读:782来源:国知局
对参数音频对象编码运用残差概念的编码器、解码器、系统及方法
【技术领域】
[0001] 本发明涉及音频信号编码、解码及处理,具体地,涉及对参数音频对象编码运用残 差概念的编码器、解码器及方法。
【背景技术】
[0002] 近来,在音频编码(参见,例如,[BCC]、[JSC]、[SA0C]、[SA0C1]及[SA0C2])和通 知源分离(参见,例如,[ISS1]、[ISS2]、[ISS3]、[ISS4]、[ISS5]及[ISS6])领域中已提出 了一种参数技术,用于对包括多个音频对象的音频场景进行位速率高效传输/储存。这些 技术目的是基于附加旁侧信息(additional side information)来重建期望的输出音频场 景或期望的音频源对象,所述附加旁侧信息描述所传输和/或所储存的音频场景和/或该 音频场景中的音频源对象。
[0003] 图 5 描绘了 SAOC (SA0C =空间音频对象编码(Spatial Audio Ob ject Coding))系 统概况,其例不了使用 MPEG SA0C(MPEG=动画专家组(Moving Picture Experts Group)) 的实例的这种参数系统的原理(参见,例如,[SA0C]、[SA0C1]及[SA0C2])。
[0004] 一般处理以时间/频率选择性方式进行且可被描述如下:
[0005] SAOC编码器510(具体地,SAOC编码器510的旁侧信息估计器530)提取旁侧信息, 该旁侧信息描述最多32个输入音频对象信号S 1. .. S32的特性(以其最简单形式,描述音频 对象信号的对象功率的关系)。SAOC编码器510的混音器520使用缩混增益因子dp. .. d32,2 来缩混这些音频对象信号S1. .. S32,以获得单声道或双声道信号混合(即,一个或两个缩混 信号)。
[0006] 传输或储存该缩混信号(这些缩混信号)和旁侧信息。为此,可使用音频编码器 540编码该缩混音频信号(这些缩混信号)。音频编码器540可以是熟知的感知音频编码 器,例如,MPEG-I层II或III (aka. mp3)音频编码器、MPEG高级音频编码(AAC,Advanced Audio Coding)音频编码器等。
[0007] 在接收器侧,对应的音频解码器550 (例如,感知音频解码器,诸如MPEG-I层II或 III (aka. mp3)音频解码器、MPEG高级音频编码(AAC)音频解码器等)对已编码的缩混音频 信号进行解码。
[0008] SAOC解码器560概念上试图使用传输的和/或储存的旁侧信息,例如通过使用 虚拟对象分离器570,从一个或两个缩混信号恢复原始(音频)对象信号("对象分离")。 然后通过SAOC解码器560的再现器(renderer) 580使用再现(rendering)矩阵(由系数 ri,l. · · r32,6描述)将这些估计的(音频)对象信号S l,est· · · s32,est混音成由最多6个音频输 出声道yust... 76,&表示的目标场景。输出可为单声道、双声道立体声或5. 1多声道目标 场景(例如,一个、两个或六个音频输出信号)。
[0009] 归因于在解码侧对音频对象的参数估计的潜在限制;在大多数情况下,不能完美 地产生期望的目标输出场景。在极端操作点(例如,一个音频对象的单独播放),该处理常 常不再能达成足够的主观声音。为此,已通过引入增强式音频对象(EAO, Enhanced Audio Object)来扩展SAOC方案(参见,例如,[Dfx],此外,参见,例如,[SA0C])。被编码为EAO的 音频对象展现出与编码于同一缩混信号中的其它(普通)非增强式音频对象(非ΕΑ0)有 所增加的分离能力,其代价为旁侧信息速率有所增加。EAO概念针对每一 EAO考虑参数模式 的预测误差(残差信号)。
[0010] 图6描绘了在编码器侧的残差估计,其示意性地例示了针对每一 EAO对残差信号 的计算。在SAOC编码器中,使用所提取参数旁侧信息(PSI,Parametric Side Information) 及原始源信号估计残差信号(至多为4个ΕΑ0),对这些残差信号进行波形编码且将其作为 非参数残差旁侧信息(RSI,Residual Side Information)包括于SAOC位串流中。更详细而 言,用于EAO的PSI SAOC解码器610从缩混X产生估计音频对象信号sest,EM。RSI产生单元 620然后基于所产生的估计音频对象信号s est,EM并且基于原始EAO音频对象信号s i,…,S4 产生至多四个残差信号Sms ksi u ...^
[0011] 图7描绘了具有EAO支持的SAOC解码器的基本结构,其例示了整合于SAOC解码/ 转码链(转码=数据从一种编码至另一种编码的转换)中的EAO处理方案的概念性概述。
[0012] 由CPC估计单元710从参数旁侧信息(PSI)导出缩混信号导向式参数(即,声道 预测系数(CPC,Channel Prediction Coefficient))。
[0013] 将CPC与缩混信号一起馈送至2至N方框(TTN方框)720中。TTN方框720概念 上试图从所传输的缩混信号(X)估计EA0( Sest,EM)并且试图提供仅由非EAO组成的估计的 非 EAO 缩混(Xest,nmEAQ)。
[0014] RSI处理单元730使用传输的和/或储存(且解码)的残差信号(s_,KSI)来增强 对EA0(s est,EA())的估计和对仅非EAO对象的对应缩混(Xmhem)。
[0015] 根据目前技术水平,在下一步骤中,RSI处理单元730将非EAO缩混信号(X_EAQ) 馈送至SAOC缩混处理器(PSI解码单元)740中,以估计非EAO对象s est,_EM。PSI解码单 元740将估计的非EAO音频对象sest,_ EA〇传递至再现单元750。此外,RSI处理单元将增强 的EAOL w直接馈送至再现单元750中。再现单元750然后基于估计的非EAO音频对 象sest,nmEA()且基于增强的EAGiW产生单声道或立体声输出信号。
[0016] 现有技术的系统有以下缺点:
[0017] 在应用残差信号在SAOC解码器中计算EAO之前,必须从传输的/储存的参数旁侧 信息计算缩混导向式CPC。
[0018] 所有缩混信号必须在SAOC残差概念内进行处理,而与其对EAO处理是否有用无 关。
[0019] 由于TTN方框的限制,SAOC残差概念仅可与单声道或双声道信号混合一起使用。 EAO残差概念无法结合多声道混合(例如,5. 1多声道混合)来使用。
[0020] 此外,由于其估计的对应计算复杂性,SAOC EAO对EAO的数目设置了限制(即,至 多4个)。
[0021] 由于这些限制,SAOC EAO残差处理概念无法应用于多声道(例如5. 1)缩混信号 或用于超过4个EAO。
[0022] 因此,如果能提供音频信号编码、音频信号解码及音频信号处理的改进概念,则将 很受欢迎。

【发明内容】

[0023] 本发明的一个目标是提供针对音频信号编码、音频信号解码以及音频信号处理的 改进概念。本发明的目标是通过以下手段来解决:根据权利要求1的解码器、根据权利要求 11的残差信号产生器、根据权利要求19的编码器、根据权利要求21的系统、根据权利要求 22的已编码信号、根据权利要求23的方法、根据权利要求24的方法以及根据权利要求25 的计算机程序。
[0024] 提供了一种解码器。该解码器包括参数解码单元,该参数解码单元用于通过升混 三个或更多个缩混信号来产生
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1