基于对象的音频编码系统中利用旁路音频对象信号的通知响度估计的解码器、编码器及方法

文档序号:9422874阅读:312来源:国知局
基于对象的音频编码系统中利用旁路音频对象信号的通知响度估计的解码器、编码器及方法
【专利说明】基于对象的音频编码系统中利用旁路音频对象信号的通知 响度估计的解码器、编码器及方法
[0001] 本发明设及音频信号编码、处理及解码,特别地,设及用于基于对象的音频编码系 统中的通知响度估计的解码器、编码器及方法。
[0002] 近来,在音频编码怔CC、JSC、SA0C、SA0C1、SA0C2]及通知源分离[ISS1、ISS2、 ISS3、ISS4、ISS5、ISS6]的领域中已提出用于包括多个音频对象信号的音频场景的具比特 率效益的传输/储存的参数技术。运些技术旨在基于描述所传输/储存的音频场景和/或 该音频场景中的源对象的附加边信息(sidein化rmation)来重构希望的输出音频场景或 音频源对象。此重构使用通知源分离方案而发生于解码器中。可W对重构的对象进行组合 W产生输出音频场景。取决于组合对象的方式,输出场景的感知响度可W不同。
[0003] 在TV及无线电广播中,可基于各个方面诸如峰值信号水平或响度水平来规范化 各个节目的音轨的音量水平。取决于信号的动态特性,具有相同峰值水平的两个信号可能 具有大不相同的感知响度水平。现在,在节目或频道之间切换,信号响度的差异非常恼人, 且已成为终端用户对广播的抱怨的主要来源。
[0004] 在现有技术中,已提出使用基于感知信号响度的测量将所有频道上的所有节目类 似地规范化至共同基准水平。在欧洲的一个此种推荐为邸U推荐R128圧脚](后文称为 R128)。
[0005] 该推荐称,"节目响度",例如一个节目(或一个广告或某其他有意义的节目实体) 的平均响度应等于指定水平(允许有小的偏差)。当愈来愈多的广播台符合此推荐及所要 求的规范化时,应最小化节目及频道之间的平均响度的差异。
[0006] 可WW若干方式进行响度估计。存在用于估计音频信号的感知响度的若干数学模 型。邸U推荐R128依赖于口U-RBS. 1770(后文称为BS. 1770)(参见[ITU])中提出的模型 用于响度估计。
[0007] 如前所述,例如根据邸U推荐R128,节目响度例如一个节目的平均响度应等于指 定水平,允许有小的偏差。然而,运导致了进行音频呈现时的显著问题,迄今在现有技术中 仍未解决。在解码器侧进行音频呈现对所接收音频输入信号的总体/总响度具有显著影 响。然而,尽管进行场景呈现,所接收音频信号的总响度应保持相同。
[0008] 当前,对于此问题不存在特定的解码器侧解决方案。
[0009] EP2 146 522Al(圧門)设及使用基于对象的元数据产生音频输出信号的构思。 其生成表示至少两个不同音频对象信号的叠加的至少一个音频输出信号,但未提供对此问 题的解决方案。
[0010] WO2008/035275A2(怔RE])描述了一种包括编码器的音频系统,该编码器在编码 单元中编码音频对象,该编码单元产生下混音频信号及表示多个音频对象的参数数据。该 下混音频信号及参数数据被传输至包括解码单元及呈现单元的解码器,该解码单元产生音 频对象的近似复本且该呈现单元根据该音频对象产生输出信号。此外,该解码器含有用于 产生被发送至编码器的编码修改数据的处理器。然后,该编码器响应于该编码修改数据而 修改该音频对象的编码,且特别是修改该参数数据。该方法允许由解码器控制对音频对象 的操纵但完全或部分地由编码器进行对音频对象的操纵。因此,可对实际的独立的音频对 象而非对近似复本进行操纵,藉此提高效能。
[0011] EP2 146 522Al([SC田)公开了一种用于产生表示至少两个不同音频对象的叠 加的至少一个音频输出信号的设备,其包括用于处理音频输入信号W提供音频输入信号的 对象表示的处理器,其中此对象表示可通过使用对象下混信号对原始对象进行参数导引近 似而产生。对象操纵器使用设及各个音频对象的基于音频对象的元数据来单独地操纵对 象,W获得经操纵的音频对象。使用对象混合器对经操纵的音频对象进行混合W取决于特 定呈现设定而最终获得具有一个或若干个声道信号的音频输出信号。
[0012] WO2008/046531Al(圧NG])描述了一种使用多个音频对象生成编码对象信号的 音频对象编码器,其包含:下混信息产生器,其用于产生指示多个音频对象至至少两个下混 声道的分配的下混信息;音频对象参数产生器,其用于产生音频对象的对象参数;W及输 出接口,其用于使用该下混信息及对象参数来产生导入的音频输出信号。音频合成器使用 下混信息来产生可用于建立预定义音频输出配置的多个输出声道的输出数据。
[0013] 希望的是无延迟地具有对输出平均响度或平均响度改变的准确估计,且当节目不 改变或呈现场景不改变时,平均响度估计也应该保持静态。
[0014] 本发明的目标是提供改进的音频信号编码、处理及解码构思。本发明的目标通过 W下来解决:根据权利要求1所述的解码器、根据权利要求9所述的编码器、根据权利要求 11所述的系统、根据权利要求12所述的方法、根据权利要求13所述的方法及根据权利要求 15所述的计算机程序。
[0015] 提供了用于估计基于对象的音频编码系统中的输出的响度的通知方式。所提供的 构思依赖于关于待提供至解码器的音频混合中的对象的响度的信息。解码器使用此信息连 同呈现信息用于估计输出信号的响度。例如,此举允许接着估计默认下混与呈现的输出之 间的响度差异。接着可W补偿该差异W无关于呈现信息而获得输出中的大致恒定的响度。 解码器中的响度估计W全参数方式发生,且与基于信号的响度估计构思相比,其在计算上 非常轻便且准确。
[0016] 提供了用于使用纯参数概念获得关于特定输出场景的响度的信息的构思,其因此 允许在不进行解码器中的明确的基于信号的响度估计的情况下进行响度处理。此外,描述 了通过MPEG[SA0幻标准化的空间音频对象编码(SAOC)的特定技术,但所提供的构思亦可 结合其他音频对象编码技术来使用。
[0017] 提供了用于产生包括一个或更多个音频输出声道的音频输出信号的解码器。该解 码器包括接收接口,该接收接口用于接收包括多个音频对象信号的音频输入信号,用于接 收关于该音频对象信号的响度信息,且用于接收指示该音频对象信号中的一个或更多个应 放大还是衰减的呈现信息。此外,该解码器包括用于产生该音频输出信号的一个或更多个 音频输出声道的信号处理器。该信号处理器被配置成取决于该响度信息且取决于该呈现信 息来确定响度补偿值。此外,该信号处理器被配置成取决于该呈现信息且取决于该响度补 偿值而自该音频输入信号产生该音频输出信号的所述一个或更多个音频输出声道。
[0018] 根据一实施方式,该信号处理器可被配置成取决于该呈现信息且取决于该响度补 偿值而自该音频输入信号产生该音频输出信号的一个或更多个音频输出声道,使得该音频 输出信号的响度等于该音频输入信号的响度,或使得该音频输出信号的响度比经修改音频 信号的响度更接近于该音频输入信号的响度,该经修改音频信号是通过根据该呈现信息放 大或衰减该音频输入信号的音频对象信号而修改该音频输入信号来产生。
[0019] 根据另一实施方式,可将音频输入信号的音频对象信号中的每个指派给两个或更 多个组中的确切的一个组,其中所述两个或更多个组中的每个可包括该音频输入信号的音 频对象信号中的一个或更多个。在此实施方式中,该接收接口可被配置成接收所述两个或 更多个组中的每一个组的响度值作为响度信息,其中该响度值指示该组的所述一个或更多 个音频对象信号的原始总响度。此外,该接收接口可被配置成接收针对所述两个或更多个 组中的至少一个组通过指示该组的一个或更多个音频对象信号的经修改总响度而指示应 放大衰减该组的所述一个或更多个音频对象信号的呈现信息。此外,在此实施方式中,该信 号处理器可被配置成取决于所述两个或更多个组中的所述至少一个组中的每个的经修改 总响度且取决于所述两个或更多个组中的每个的原始总响度来确定该响度补偿值。此外, 该信号处理器可被配置成取决于所述两个或更多个组中的所述至少一个组中的每个的经 修改总响度且取决于该响度补偿值而自该音频输入信号产生该音频输出信号的一个或更 多个音频输出声道。
[0020] 在特定实施方式中,所述两个或更多个组中的至少一个组可包括该音频对象信号 中的两者或更多。
[0021] 此外,提供了一种编码器。该编码器包括基于对象的编码单元,该基于对象的编码 单元用于编码多个音频对象信号W获得包括所述多个音频对象信号的编码音频信号。此 夕F,该编码器包括用于编码关于该音频对象信号的响度信息的对象响度编码单元。该响度 信息包括一个或更多个响度值,其中所述一个或更多个响度值中的每个取决于该音频对象 信号中的一个或更多个。
[0022] 根据一实施方式,可将编码音频信号的音频对象信号中的每个指派给两个或更多 个组中的确切的一个组,其中所述两个或更多个组中的每个包括该编码音频信号的音频对 象信号中的一个或更多个。该对象响度编码单元可被配置成通过确定所述两个或更多个组 中的每一个组的响度值来确定该响度信息的所述一个或更多个响度值,其中该组的响度值 指示该组的所述一个或更多个音频对象信号的原始总响度。
[0023] 此外,提供了一种系统。该系统包括根据上述实施方式中的一个的编码器,该编码 器用于编码多个音频对象信号W获得包括该多个音频对象信号的编码音频信号,且用于编 码关于该音频对象信号的响度信息。此外,该系统包括根据上述实施方式中的一个的解码 器,该解码器用于产生包括一个或更多个音频输出声道的音频输出信号。该解码器被配置 成接收作为音频输入信号的编码音频信号及响度信息。此外,该解码器被配置成还接收呈 现信息。此外,该解码器被配置成取决于该响度信息且取决于该呈现信息来确定响度补偿 值。此外,该解码器被配置成取决于该呈现信息且取决于该响度补偿值而自该音频输入信 号产生该音频输出信号的所述一个或更多个音频输出声道。
[0024] 此外,提供了一种用于产生包括一个或更多个音频输出声道的音频输出信号的方 法。该方法包括:
[0025] -接收包括多个音频对象信号的音频输入信号。
[0026] -接收关于该音频对象信号的响度信息。
[0027] -接收指示该音频对象信号中的一个或更多个是否应放大或衰减的呈现信息。
[0028] -取决于该响度信息且取决于该呈现信息来确定响度补偿值。及:
[0029] -取决于该呈现信息且取决于该响度补偿值而自该音频输入信号产生该音频输出 信号的所述一个或更多个音频输出声道。
[0030] 此外,提供了一种用于编码的方法。该方法包括:
[0031] -编码包括多个音频对象信号的音频输入信号。及:
[0032] -编码关于该音频对象信号的响度信息,其中该响度信息包括一个或更多个响度 值,其中所述一个或更多个响度值中的每个取决于该音频对象信号中的一个或更多个。
[0033] 此外,提供了一种用于在计算机或信号处理器上执行时实施上述方法的计算机程 序。
[0034] 在所附权利要求中提供了优选实施方式。
[0035] 下文中,参考附图更详细地描述了本发明的实施方式,在附图中:
[0036] 图1图示了根据一实施方式的用于产生包括一个或更多个音频输出声道的音频 输出信号的解码器,
[0037] 图2图示了根据一实施方式的编码器,
[0038] 图3图示了根据一实施方式的系统,
[0039] 图4图示了包括SAOC编码器及SAOC解码器的空间音频对象编码系统,
[0040] 图5图示了包括边信息解码器、对象分离器及呈现器的SAOC解码器,
[0041] 图6图示了对响度改变的输出信号响度估计的特征,
[0042] 图7描绘根据一实施方式的通知响度估计,其图示了根据一实施方式的编码器及 解码器的组件,
[0043] 图8图示了根据另一实施方式的编码器,
[0044] 图9图示了根据一实施方式的关于包括旁路声道的SAOC对话增强的编码器及解 码器,
[0045] 图10描绘使用W参数方式估计响度改变的所提供构思来测量响度改变及其结果 的第一图解,
[0046] 图11描绘使用W参数方式估计响度改变的所提供构思来测量响度改变及其结果 的第二图解,W及
[0047] 图12图示了用于进行响度补偿的另一实施方式。
[0048] 在详细描述优选实施方式之前,描述响度估计、空间音频对象编码(SAOC)及对话 增强值巧。
[0049] 首先,描述响度估计。
[0050] 如之前所述,E脚推荐R128依赖于口U-RBS. 1770中提出的模型来进行响度估计。 虽然将此测量用作示例,但下文所描述的构思亦可应用于其他响度测量。
[005。 根据BS. 1770的响度估计操作相对简单,且基于W下主要步骤[ITU]:
[0052] -用K滤波器(倾斜型滤波器与高通滤波器的组合)对输入信号Xi(或多声道信 号情况下的信号)进行滤波W获得信号yi。
[0053] -计算信号的均方能量Z1。
[0054] -在多声道信号的情况下,应用声道权重Gi,且对经加权信号进行求和。则将信号 响度定义为
[00 巧]
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1