用于在不同回放设备之间优化响度和动态范围的系统和方法_6

文档序号:9221899阅读:来源:国知局
00可代表语音而曲线602可代表标准电容内容。如图15所示,与电影内容相比,语音内容所经受的增益量更大。图15是用于某些类型的音频内容的代表性简档曲线的示例,并且其它简档也可被使用。如图15所示的简档特性的某些方面被用于得出用于优化系统的相关参数。在一个实施例中,这些参数包括:空带宽、剪切比、提升比、最大提升量、FS上升、FS衰减、迟滞、峰值限制和目标水平响度。根据应用要求和系统约束,作为这些参数中的至少一些参数的附加或替代,还可使用其它参数。
[0116]图16是示出根据一个实施例的用于在回放设备和应用之间优化响度和动态范围的方法的流程图。尽管附图示出了响度和动态范围优化在编码器处执行,但是类似优化可在其它音频处理单元(例如,预处理器、解码器和后处理器)处执行。如处理620中所示,方法以编码器级接收来自源的输入信号(603)开始。编码器或预处理组件然后确定原信号是否已经受了实现目标响度和/或动态范围的处理(604)。目标响度对应于长期响度并且可在外部或内部定义。如果源信号没有经受实现目标响度和/或动态范围的处理,则该系统执行适当的响度和/或动态范围控制操作(608);否则,如果源信号经受了此响度和/或动态范围控制操作,则系统进入旁路模式以跳过此响度和/或动态范围控制操作,与允许原始处理指示适当的长期限度和/或动态范围¢06)。旁路模式606或者执行的模式608中的任一个的适当增益值(可以是单个宽带增益值或者依赖于频率的多带增益值)然后在解码器中被应用(612)。
[0117]位流格式
[0118]如前文所提及的,用于优化响度和动态范围的系统采用了安全的可扩展的元数据格式,以确保在编码器和解码器之间或者在源和呈现/回放设备之间在位流中传输的元数据和音频内容在经网络或者其它专有设备、诸如服务提供者界面等传输期间没有相互分离或者被中断。位流提供了如下机制,用于用信号告知编码器和/或解码器组件以通过合适的简档信息改变音频信号的响度和动态范围以适合音频内容和输出设备特性。在一个实施例中,系统被配置为确定要在编码器和解码器之间传输的低位率编码位流,并且通过元数据编码的响度信息包括一个或多个输出简档的特性。用于根据一个实施例的响度和动态范围优化系统的位流格式的描述如下。
[0119]AC-3编码位流包括元数据,以及音频内容的I到6个通道。音频内容是已经使用感知音频编码被压缩的音频数据。元数据包括若干音频元数据参数,它们预期用于改变传递至收听环境的节目的声音。AC-3编码音频位流的每一帧含有关于数字音频的1536个帧的音频内容和元数据。对于48kHz的采样率,这代表32毫秒的数字音频或者音频每秒31.25帧。
[0120]E-AC-3编码音频位流的每一帧,根据帧含有I个、2个、3个还是6个音频数据块,含有关于数字音频的256、512、768或者1536个帧的音频内容和元数据。对于48kHz的采样率,这分别代表5.333、10.667、16或32毫秒的数字音频或者分别代表音频每秒189.9、93.75,62.5 或 31.25 帧。
[0121]如图4所指示的,每个AC-3帧被分成区段(分段),包括同步信息(SI)区段,其含有(如图5所示)同步字(SW)和两个误差校正字中的第一个(CRCl);位流信息(BSI)区段,其含有大部分元数据;六个音频块(ΑΒ0到AB5),含有数据压缩音频内容(并且也可包含元数据);废弃位(WI),含有在音频内容被压缩之后被遗留的任何不使用的位;辅助(AUX)信息区段,其含有更多的元数据;以及两个误差校正字中的第二个(CRC2)。
[0122]如图7所示,每个E-AC-3帧被分成区段(分段),包括同步信息(SI)区段,其含有(如图5所示)同步字(SW);位流信息(BSI)区段,其含有大部分元数据;1到6个之间的音频块(ΑΒ0到AB5),含有数据压缩音频内容(并且也可包含元数据);废弃位(WI),含有在音频内容被压缩之后被遗留的任何不使用的位;辅助(AUX)信息区段,其含有更多的元数据;以及误差校正字(CRC)。
[0123]在AC_3(或者E-AC-3)位流中,存在被具体预期用于改变传递至收听环境的节目的声音的若干音频元数据参数。元数据参数之一是对话归一参数,其被包含在BSI分段中。
[0124]如图6所示,AC-3帧的BSI分段包括指示节目的对话归一值的5位参数(“dialnorm”)。如果AC-3帧的音频编码模式(“acmod”)是“0”,指示双单声或者“ 1+1”通道配置,则指示在同一 AC-3帧中运送的第二音频节目的对话归一值的5位参数(“dialnorm2”)被包括。
[0125]BSI分段还包括标记(“addbsie”),其指示在“addbsie”位之后存在(或者不存在)附加位流信息,参数(“&(1(11^11”),其指示在“&(1(11^11”值之后的任何附加位流信息的长度,以及在“addbsil”值之后的高达64位的附加位流信息(“addbsi”)。BSI分段可包括在图6中未具体示出的其它元数据值。
[0126]文中所述的一个或多个实施例的各方面可在如下音频系统中实现,该音频系统处理用于经包括执行软件指令的一个或多个计算机或处理设备的网络传输的音频信号。所述任何实施例可单独使用或者以任何组合相互结合地使用。尽管已经由于现有技术的各种缺陷而构想了各种实施例(它们已经在说明书的一个或多个地方被讨论或提及),但是实施例不必然解决这些缺陷中的任一个。换句话说,不同的实施例可解决可能在说明书中讨论的不同缺陷。一些实施例可仅部分地解决可在说明书中被讨论的一些缺陷或者仅仅一个缺陷,而一些实施例可能不解决这些缺陷中的任一个。
[0127]文中描述的系统的各个方面可在用于处理数字或数字化音频文件的合适的基于计算机的声音处理网络环境中被实现。自适应音频系统的部分可包括一个或多个网络,该网络包含任何希望数量的个体机器,包括用于缓冲并且路由在计算机之间传输的数据的一个或多个路由器(未示出)。这样的网络可基于各种不同的计算机协议被构建,并且可以是因特网、广域网(WAN)、局域网(LAN)或者它们的任何组合。
[0128]组件、块、处理或者其它功能组件中的一个或多个可通过控制系统的基于处理器的计算设备的执行的计算机程序来实现。还应指出,在它们的行为、寄存器传递、逻辑组分和/或其它特性方面,文中公开的各种功能可使用硬件、固件和/或体现在各种机器可读或计算机可读介质中数据和/或指令的任何数量的组合来实现。这样的格式化数据和/或指令体现于其中的计算机可读介质包括但不局限于各种形式的物理(非暂态)、非易失性存储介质,诸如光学、磁性或半导体存储介质。
[0129]除非文中清楚要求,否则在说明书和权利要求书的上下文中,属于“包含”、“包括”等应在与排他性或详尽性意义相反的包含性意义上被解释;即在“包括但不限于”的意义上被解释。使用单数或复数的词语也分别包括多数或单数。另外,“文中”、“下文”、“以上”、“以下”和类似词语是在整体上提及本申请,而不是本申请的任何特定部分。当在提及两个或更多个项目的列表时使用词语“或者”时,该词语涵盖词语的以下的所有解释:列表中的项目中的任一个、列表中的所有项目或者列表中的项目的任何组合。
[0130]尽管一个或多个实现已经作为示例并且根据具体实施例被描述,但是应理解,一个或多个实现不局限于所公开的实施例。相反,其预期涵盖本领域技术人员将显而易见的各种修改和类似布置。因此,随附权利要求的范围应被给予最宽泛的解释以便涵盖所有这样的修改和类似布置。
【主权项】
1.一种方法,包括: 在位流中接收与音频数据相关联的元数据; 分析位流中的元数据以确定在位流中是否能够获得用于第一组音频回放设备的响度参数; 响应于确定对于该第一组存在该参数,使用该参数和音频数据来呈现音频;以及 响应于确定对于该第一组不存在该响度参数,分析该第一组的一个或更多个特性,并且基于所述一个或更多个特性来确定该参数。2.根据权利要求1所述的方法,其中,所述一个或更多个特性包括用于音频数据的不同简档的增益水平。3.根据权利要求2所述的方法,其中,所述增益水平定义如下中的至少一个:控制音频数据将对于被定义的节目如何回放的艺术动态范围简档,以及对于被定义的节目的部分提供过载保护的短期动态范围简档。4.根据权利要求1所述的方法,其中,使用该参数和音频数据呈现音频包括将该参数和音频数据传输至下游模块,所述下游模块呈现音频以供回放。5.根据权利要求1所述的方法,其中,使用该参数和音频数据来呈现音频包括基于该参数和音频数据来呈现音频数据。6.根据权利要求1所述的方法,进一步包括: 确定将呈现所接收的音频流的输出设备;以及 确定输出设备是否属于第一组音频回放设备,其中,分析流中的元数据以确定是否能够获得用于第一组音频回放设备的响度参数的步骤在确定该输出设备属于第一组音频回放设备的步骤之后执行。7.根据权利要求6所述的方法,其中,确定该输出设备属于第一组音频回放设备的步骤包括: 接收来自与输出设备连接的模块的、指示输出设备的身份或者指示包括该输出设备的一组设备的身份的指示,并且 基于所接收的指示确定输出设备属于第一组音频回放设备。8.一种装置,包括: 接口,被配置为接收包括与音频数据相关联的元数据的位流; 分析器,耦合到所述接口,并且被配置为分析位流中的元数据以确定在位流中是否能够获得用于第一组音频回放设备的响度参数; 呈现组件,被配置为响应于所述分析器确定对于该第一组存在该参数,使用该参数和音频数据来呈现音频,所述呈现组件进一步被配置为响应于所述分析器确定对于该第一组不存在该响度参数,分析该第一组的一个或更多个特性,并且基于所述一个或更多个特性来确定该参数。9.根据权利要求8所述的装置,其中,所述呈现组件使用该参数和音频数据来呈现音频包括所述呈现组件将该参数和音频数据传输至下游模块,所述下游模块呈现音频以供回放。10.根据权利要求9所述的装置,其中,所述呈现组件使用该参数和音频数据来呈现音频包括所述呈现组件基于该参数和音频数据来呈现音频数据。11.根据权利要求10所述的装置,进一步包括第二组件,被配置为确定将呈现所接收的音频流的输出设备,并且确定输出设备是否属于第一组音频回放设备,其中,所述分析器分析流中的元数据以确定是否能够获得用于第一组音频回放设备的响度参数在所述第二组件确定该输出设备是否属于第一组音频回放设备之后执行。12.根据权利要求11所述的装置,进一步包括接口,被配置为接收来自与输出设备连接的模块的、指示输出设备的身份或者指示包括该输出设备的一组设备的身份的指示,并且基于所接收的指示确定输出设备属于第一组音频回放设备。13.—种方法,包括: 接收音频数据和与所述音频数据相关联的元数据; 分析位流中的元数据以确定在流中是否能够获得与用于第一组音频设备的响度参数相关联的响度信息; 响应于确定对于该第一组存在该响度信息,从该流确定响度信息,并且传输该音频数据和响度信息以用于呈现音频;以及 响应于确定对于该第一组不存在该响度信息,确定与输出简档相关联的响度信息,并且传输该输出简档的所确定的响度信息以用于呈现音频。14.根据权利要求13所述的方法,其中,确定与输出简档相关联的响度信息的步骤进一步包括: 分析输出简档的特性; 基于所述特性确定参数,并且 传输所确定的响度信息包括传输所确定的参数。15.根据权利要求14所述的方法,其中,所述特性包括用于音频数据的不同简档的增益水平。16.根据权利要求15所述的方法,其中,所述增益水平定义如下中的至少一个:控制音频数据将对于被定义的节目如何回放的艺术动态范围简档,以及对于被定义的节目的部分提供过载保护的短期动态范围简档。17.根据权利要求13所述的方法,其中,所述响度信息包括用于输出简档的响度参数。18.根据权利要求13所述的方法,其中,所述响度信息包括输出简档的特性。19.根据权利要求13所述的方法,进一步包括确定要被传输的低位率编码流,其中,所述响度信息包括一个或更多个输出简档的特性。20.根据权利要求17所述的方法,其中,一个或更多个输出简档不包括优质内容简档。21.一种用于解码音频数据的装置,包括: 接口,其接收音频数据和与所述音频数据相关联的元数据;以及 第一组件,其分析位流中的元数据以确定在流中是否能够获得与用于第一组音频设备的响度参数相关联的响度信息,响应于确定对于该第一组存在该响度信息,所述第一组件从该流确定响度信息并且传输该音频数据和响度信息以用于呈现音频;并且响应于确定对于该第一组不存在该响度信息,所述第一组件确定与输出简档相关联的响度信息,并且传输该输出简档的所确定的响度信息以用于呈现音频。22.根据权利要求21所述的装置,其中,所述第一组件分析元数据包括所述第一组件分析输出简档的特性并且基于所述特性确定参数,并且所述第一组件传输所确定的响度信息包括所述第一组件传输所确定的参数。23.根据权利要求22所述的装置,其中,所述响度信息包括用于输出简档的响度参数。24.根据权利要求23所述的装置,其中,所述响度信息包括输出简档的特性。25.根据权利要求24所述的装置,进一步包括用于确定要被传输的低位率编码流的第二组件,其中,所述响度信息包括一个或更多个输出简档的特性。
【专利摘要】实施例涉及如下的方法和系统,其用于在位流中接收与音频数据相关联的元数据,并且分析该元数据以确定在位流中是否可获得用于第一组音频回放设备的响度参数。响应于确定存在用于第一组的参数,系统使用该参数和音频数据来呈现音频。响应于确定不存在用于第一组的响度参数,系统分析第一组的一个或多个特性并且基于该一个或多个特性来确定参数。
【IPC分类】H03G9/00
【公开号】CN104937844
【申请号】CN201480005314
【发明人】J·瑞德米勒, S·G·诺克罗斯, K·J·罗德恩
【申请人】杜比实验室特许公司, 杜比国际公司
【公开日】2015年9月23日
【申请日】2014年1月15日
【公告号】EP2946469A1, US20150363160, WO2014113471A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1