音频处理装置及其方法_2

文档序号：9439630阅读：来源：国知局

择渲染模式。一个子集的渲染模式的选择可考虑与属于另一子集的音频换能器相关的特性。
[0034]音频换能器位置数据可提供用于这组音频换能器的每个音频换能器的位置指示或可提供用于仅仅其子集的位置指示。
[0035]渲染器可布置成针对每个音频成分产生用于音频换能器的音频换能器信号成分，并通过组合用于多个音频成分的音频换能器信号成分来产生用于每个音频换能器的音频换能器信号。
[0036]根据本发明的可选特征，渲染器可操作来针对这组换能器的第一音频换能器的音频对象使用不同的渲染模式，且渲染控制器布置成针对第一音频换能器的每个音频对象独立地选择渲染模式。
[0037]这可在很多实施例中提供提高的性能和/或可允许提高的用户体验和/或增加的自由度和灵活性。特别是，该方法可允许对特定的渲染情形的提高的适应，其中考虑对特定渲染配置和被渲染的音频的优化。特别是，特定的渲染算法被使用于的音频换能器的子集对于不同的音频成分可以是不同的，以反映音频成分的不同特性。
[0038]在一些实施例中，渲染控制器可布置成响应于渲染配置数据，针对第一音频成分选择来自多个渲染模式的选定渲染模式；并响应于音频描述数据确定选定渲染模式的一组渲染参数。
[0039]根据本发明的可选特征，多个音频成分中的至少两个是不同的音频类型。
[0040]这可在很多实施例中提供提高的性能和/或可允许提高的用户体验和/或增加的自由度和灵活性。特别是，该方法可允许对特定的渲染情形的提高的适应，其中执行对特定渲染配置和被渲染的音频的优化。
[0041]用于给定的音频换能器的渲染模式对于不同的音频成分可以是不同的。可根据音频成分的音频类型来选择不同的渲染模式。音频描述数据可指示多个音频成分中的一个或多个的音频类型。
[0042]根据本发明的可选特征，多个音频成分包括来自由下列项组成的组的不同音频类型的至少两个音频成分:音频通道成分、音频对象成分和音频场景成分；并且渲染器布置成针对该至少两个音频成分使用不同渲染模式。
[0043]这可提供特别有利的性能，且可特别是允许系统例如MPEG 3D Aud1的提尚的性能。渲染控制器可根据音频成分是音频通道、音频对象还是音频场景对象来选择用于音频换能器的给定子集和第一音频成分的渲染模式。
[0044]根据MPEG标准IS0/IEC 23008-3 MPEG 3D Aud1，音频成分可以特别地是音频通道成分、音频对象成分和/或音频场景成分。
[0045]根据本发明的可选特征，接收器布置成接收指示至少第一音频成分的音频类型的音频类型指示数据，且渲染控制器布置成响应于音频类型指示数据而选择用于第一音频成分的清染模式。
[0046]这可提供提尚的性能，并可允许提尚的用户体验、提尚的适应和/或在首频换能器定位中的提高的灵活性和自由度。
[0047]根据本发明的可选特征，渲染控制器布置成响应于第一音频换能器相对于音频换能器的预定位置的位置来选择用于第一音频换能器的渲染模式。
[0048]这可提供提尚的性能，并可允许提尚的用户体验、提尚的适应和/或在首频换能器定位中的提高的灵活性和自由度。
[0049]第一音频换能器的位置和/或该预定位置可作为绝对位置或作为例如相对于收听者位置的相对位置而被提供。
[0050]预定位置可以是在渲染配置中的音频换能器的标称或默认位置。渲染配置可以是与标准设置例如标称5.1环绕声扬声器设置相关的渲染配置。渲染配置在一些情况下可对应于与一个或多个音频成分相关的默认渲染配置，例如与音频通道相关的渲染配置。特别地，预定位置可以是针对音频通道假设或定义的默认音频换能器位置。
[0051]根据本发明的可选特征，渲染控制器布置成选择用于第一音频换能器的默认渲染模式，除非在第一音频换能器的位置与预定位置之间的差异超过阈值。
[0052]这可便于操作并可在很多实施例和情形中允许提高的可靠性和/或鲁棒性。默认渲染模式可例如与默认渲染配置(例如与标准环绕声音频换能器配置相关的环绕声渲染算法)相关。默认渲染模式(例如环绕声渲染模式)可用于被定位为靠近标准环绕声音频换能器配置的默认位置的音频换能器，而当音频换能器位置足够偏离默认位置时可选择替代的渲染模式/算法。
[0053]根据本发明的可选特征，渲染控制器布置成:将这组音频换能器分成音频换能器的第一子集和音频换能器的第二子集，音频换能器的第一子集包括在音频换能器的位置和预定位置之间的差异超过阈值的音频换能器，而音频换能器的第二子集包括在音频换能器的位置和预定位置之间的差异不超过阈值的至少一个音频换能器；以及从第一渲染模式子集选择用于第一子集的每个音频换能器的渲染模式并从第二渲染模式子集选择用于第二子集的每个音频换能器的渲染模式。
[0054]该方法可提供方便的操作和/或提高的性能和/或增加的灵活性。
[0055]第一子集可包括被定位为远离给定标称渲染/音频换能器配置的默认位置的音频换能器。第二子集可包括被定位为接近给定标称渲染/音频换能器配置的默认位置的一个或多个音频换能器。第二子集的(多个)驱动信号可使用与给定标称渲染/音频换能器配置相关的标称渲染模式，而第一子集的驱动信号可使用补偿不在默认位置处的音频换能器的不同的渲染模式。第一子集可能包括在音频换能器的位置和预定位置之间的差异不超过阈值的一个或多个音频换能器；例如，如果这样的(多个)音频换能器用于支持来自其中该差异超过阈值的音频换能器的渲染的话。
[0056]根据本发明的可选特征，多个渲染模式包括从由下列项组成的组选择的至少一个渲染模式:立体声渲染；基于矢量的幅值平移渲染；波束成型渲染；串音消除渲染；高保真度立体声响复制(ambisonics)清染；波场合成清染；以及最小二乘法优化清染。
[0057]在这些渲染模式之间的音频换能器子集的单独选择提供特别有利的性能。实际上，组的渲染模式具有特别适合于具有不同特性的不同渲染/音频换能器配置的特性。
[0058]根据本发明的可选特征，接收器还布置成接收音频成分的渲染位置数据，且渲染控制器布置成响应于渲染位置数据而选择渲染模式。
[0059]这可提供提尚的性能和适应，且将在很多实施例和情形中允许提尚的用户体验。
[0060]根据本发明的可选特征，渲染器布置成针对音频成分中的音频成分的不同频带使用不同的渲染模式；且渲染控制器布置成针对音频成分的不同频带独立地选择渲染模式。[0061 ] 这可提供提尚的性能和适应，且将在很多实施例和情形中允许提尚的用户体验。
[0062]根据本发明的可选特征，渲染控制器布置成使用于至少一个音频成分的渲染的变化与在该至少一个音频成分中的音频内容变化同步。
[0063]这可提供提尚的性能和适应，且将在很多实施例和情形中允许提尚的用户体验。它可特别是减小渲染中的变化对用户来说的显著性。
[0064]根据本发明的可选特征，渲染控制器还布置成响应于来自由下列项组成的组的渲染配置数据而选择渲染模式:不在这组音频换能器中的音频换能器的音频换能器位置数据；收听位置数据；这组音频换能器的音频换能器的音频换能器音频渲染特性数据；以及用户清染偏好。
[0065]这可提供提尚的性能和适应，且将在很多实施例和情形中允许提尚的用户体验。
[0066]根据本发明的可选特征，渲染控制器布置成响应于由感知模型产生的质量度量而选择清染模式。
[0067]这可提供特别有利的操作并可提供提尚的性能和/或适应。特别是，在很多实施例中，它可允许有效和优化的适应。
[0068]根据本发明的方面，提供了音频处理的方法，该方法包括:接收音频数据和渲染配置数据，音频数据包括多个音频成分的音频数据并且渲染配置数据包括一组音频换能器的音频换能器位置数据；从音频数据产生这组音频换能器的音频换能器信号，该产生包括根据多个可能的渲染模式中的渲染模式来渲染音频成分；响应于音频换能器位置数据从多个可能的渲染模式选择用于渲染器的渲染模式；并且其中音频换能器信号的产生包括针对这组音频换能器的不同子集采用不同的渲染模式，以及针对这组音频换能器的不同子集中的每个子集独立地选择渲染模式。
[0069]本发明的这些和其它方面、特征和优点将根据在下文中描述的实施例中而变得清楚并将参考在下文中描述的实施例被阐明。
【附图说明】
[0070]仅通过例子参考附图来描述本发明的实施例，其中:
图1图示根据现有技术的MPEG环绕声系统的原理的例子；
图2图示根据现有技术的SAOC系统的元件的例子；
图3图示使用户能够控制包含在SAOC比特流中的个体对象的交互式接口；
图4图示根据现有技术的DTS MDA?的音频编码的原理的例子；
图5图示根据现有技术的MPEG 3D音频系统的元件的例子；
图6图示根据本发明的一些实施例的渲染方法的原理的例子；
图7图示根据本发明的一些实施例的音频处理装置的例子；以及图8图示图7的音频处理装置的渲染器的元件的例子。
【具体实施方式】
[0071]下面的描述聚焦于可应用于渲染系统的本发明的实施例，渲染系统布置成渲染不同类型的多个渲染音频成分，且特别是MPEG音频流的音频通道、音频对象和音频场景对象的渲染。然而将认识到，本发明不限于这个申请，但可应用于很多其它音频渲染系统以及其它音频流。
[0072]所述渲染系统是能够使它的操作适应于所使用的特定音频换能器渲染配置且特别地适应于在渲染中使用的音频换能器的特定位置的自适应渲染系统。
[0073]大部分现有声再现系统只允许在扬声器设置中的非常适度量的灵活性。由于通常以关于扬声器的一般配置(例如扬声器或多或少等距地位于收听者周围或布置在收听者的前方的线上的扬声器)或关于音频内容的性质(例如它由少量单独局部化源组成或它由高度扩散声场景组成)的基本假设来开发常规系统，现有系统一般只能够针对有限范围的扬声器配置来传送最佳体验。这导致在用户体验中且特别是在很多真实生活使用情况中的空间体验中的明显降低和/或严重减小用户定位扬声器的自由度和灵活性。
[0074]在下文中所述的渲染系统提供能够传送在不同扬声器设置的大范围内的高质量和一般优化的空间体验的自适应渲染系统。它因此提供在很多应用中例如对家庭渲染应用寻求的自由度和灵活性。
[0075]渲染系统基于决策算法的使用，决策算法从一组不同的(空间)声音渲染方法模式选择一个或多个(空间)渲染方法，使得(多个)用户的提高和常常最优的体验被实现。选择决策基于用于渲染的实际扬声器配置。用于选择渲染模式的配置数据包括扬声器的至少(可能三维)位置，并可在一些实施例中也考虑扬声器的其它特性(例如尺寸、频率特性和方向性型式)。在很多实施例中，选择决策可进一步基于音频内容的特性，例如，如在伴随实际音频数据的元数据中规定的。
[0076]在一些实施例中，选择算法还可使用其它可得到的信息以调节或确定(多个)选定渲染方法的设置。
[0077]图6图示根据本发明的一些实施例的渲染方法的原理的例子。在该例子中，当选择音频输入流的音频成分的适当渲染模式时，考虑各种数据。
[0078]图7图示根据本发明的一些实施例的音频处理装置701的例子.音频处理装置701特别地是产生用于一组音频换能器的信号的音频渲染器，这组音频换能器在特定的例子中是扬声器703。因此，音频处理装置701产生音频换能器信号，其在特定的例子中是用于一组扬声器703的驱动信号。图7特别地图示六个扬声器(例如对于5.1扬声器设置)的例子，但将认识到，这仅仅图示特定的例子，以及可使用任何数量的扬声器。
[0079]音频处理装置701包括接收包括从扬声器703将被渲染的多个音频成分的音频数据的接收器705。音频成分一般被渲染以向用户提供空间体验，并可例如包括音频通道、音频对象和/或音频场景对象。
[0080]音频处理装置701还包括布置成从音频数据产生音频换能器信号(即扬声器703的驱动信号)的渲染器707。特别地，渲染器可从每个音频成分产生扬声器703的驱动信号成分，并接着将

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6