音频处理装置及其方法_6

文档序号：9439630阅读：来源：国知局

0183]在一些实施例中，渲染控制器709可布置成响应于用户渲染偏好而选择渲染模式。用户偏好可例如被提供为手动用户输入。在一些实施例中，可响应于在操作期间提供的用户输入来确定用户偏好。例如，音频处理装置701可渲染音频，同时在可能的渲染模式之间切换。用户可指示他偏爱的渲染，且音频处理装置701可存储这个偏好并使用它来调整选择算法。例如，在两个可能的渲染模式之间的选择的阈值可在用户的偏好的方向偏向。
[0184]在一些实施例中，接收器705可进一步接收一个或多个音频成分的渲染位置数据，且用于一个或多个音频成分的渲染模式的选择可取决于位置。
[0185]例如，局部化声源的音频对象可连同指示音频对象应被渲染于的位置的位置数据一起被接收。渲染控制器709可接着评估位置是否对应于针对特定的当前扬声器设置可使用基于矢量的幅值平移准确地在期望位置处渲染时的位置。如果是，则它继续选择基于矢量的幅值平移渲染算法用于该音频对象。然而如果当前渲染配置不允许幅值平移提供适当的声源定位(例如由于相关扬声器只布置在用户的另一侧上)，则渲染控制器709可替代地选择使在两个或多个扬声器之间的驱动信号解相关的渲染方法，以便产生声源位置的扩散空间感知。
[0186]在一些实施例中，该方法可在单独频带中被应用。特别地，在一些实施方式中，音频处理装置701可布置成对音频成分的不同频带潜在地使用不同的渲染算法。在这样的实施例中，渲染控制器709可布置成针对不同的频带执行渲染模式的独立选择。
[0187]例如，渲染器707可布置成将给定音频成分分成高频成分和低频成分(例如有大约500Hz的交叉频率)。这些成分中的每个的渲染可单独地被执行，且因此不同的渲染算法可以潜在地用于不同的频带。额外的自由度允许渲染控制器709将渲染模式的选择优化到在不同频带中的音频成分的特定空间显著性。特别地，人类空间感知通常比在更低频率下更取决于在更高频率下的空间线索。相应地，渲染控制器709可选择提供期望空间体验的用于高频带的渲染模式，而对于低频带，可选择具有减小的资源要求的不同和更简单的渲染算法。
[0188]作为另一例子，渲染控制器709可检测到扬声器的子集可被考虑为被布置为具有某个间隔的阵列，该间隔被定义为在子集的任两个相邻的扬声器之间的最大距离。在这样的情况下，阵列的间隔确定上频率，对于该上频率，子集可有效地并有利地用作用于例如波束成型或波场合成或最小二乘法的阵列。渲染控制器709可接着分离音频成分以产生使用任何阵列型渲染方法渲染的低频成分。
[0189]在很多实施例中，音频处理装置701可布置成动态地改变渲染模式的选择。例如，当音频成分的特性改变时，(例如从表示特定的声源到一般背景噪声，当例如扬声器停止讲话时)，渲染控制器709可改变所使用的渲染模式。
[0190]在一些实施例中，渲染模式的改变可以是渐进的转变。例如不是如在图8的例子中的在不同的渲染引擎的输出之间简单地切换，可执行一个信号的慢渐强和另一信号的渐弱。
[0191]在一些实施例中，渲染控制器709可布置成使音频成分的渲染模式的变化与音频成分的音频内容中的变化同步。
[0192]因此，在一些实施例中，渲染模式选择可以是动态的，并随着内容中的变化而改变。选择的变化可与音频中的转变例如与场景变化同步。例如，音频处理装置701可布置成检测在音频内容中的实质性和瞬时转变，例如在(低通滤波的)幅值水平中的变化或在(时间平均的)频谱中的实质性变化。每当这样的变化被检测到时，渲染控制器709可执行重新评估以确定从那时起的适当清染模式。
[0193]将认识到，为了清楚，上面的描述参考不同的功能电路、单元和处理器描述了本发明的实施例。然而，将明显，可使用在不同的功能电路、单元或处理器之间的功能的任何适当的分布而不减损本发明。例如，被示为由单独的处理器或控制器执行的功能可由相同的处理器或控制器执行。因此，对特定的功能单元或电路的提及只被看作对用于提供所述功能的适当装置的提及，而不是指示严格的逻辑或物理结构或组织。
[0194]可以在任何适当的形式——包括硬件、软件、固件或这些的任何组合——中实施本发明。本发明可以可选地至少部分地被实施为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。可以用任何适当的方式物理地、功能地和逻辑地实施本发明的实施例的元件和部件。实际上，可在单个单元中、在多个单元中或作为其它功能单元的部分实施功能。因此，本发明可在单个单元中实施或可物理地和功能地分布在不同的单元、电路和处理器之间。
[0195]虽然结合一些实施例描述了本发明，其非旨在被限制到本文阐述的特定形式。更确切地，本发明的范围只由所附权利要求限制。此外，虽然特征可能看起来结合特定的实施例被描述，本领域中的技术人员将认识到，可根据本发明来组合所述实施例的各种特征。在权利要求中，术语“包括”并不排除其它元件或步骤的存在。
[0196]此外，虽然个体地被列出，多个装置、元件、电路或方法步骤可由例如单个电路、单元或处理器实施。此外，虽然个体的特征可包括在不同的实施例中，这些也许可能被有利地组合，且包括在不同的权利要求中并不暗示特征的组合不是可行的和/或有利的。此外，特征包括在一个类别的权利要求中并不暗示对这个类别的限制，而更确切地指示特征同样可视情况应用于其它权利要求类别。此外，在权利要求中的特征的顺序并不暗示特征必须工作的任何特定顺序，且特别是在方法权利要求中的个体步骤的顺序并不暗示步骤必须以这个顺序被执行。更确切地，步骤可以按任何适当的顺序被执行。此外，单数提及并不排除多个。因此对“一”、“一个”、“第一”、“第二”等的提及并不排除多个。在权利要求中的参考符号被提供仅仅作为澄清的例子，不应被解释为以任何方式限制权利要求的范围。
【主权项】
1.一种音频处理装置，包括: 接收器(705)，其用于接收音频数据和渲染配置数据，所述音频数据包括多个音频成分的音频数据且所述渲染配置数据包括一组音频换能器(703)的音频换能器位置数据；渲染器(707)，其用于从所述音频数据产生用于所述组音频换能器的音频换能器信号，所述渲染器(707)能够根据多个渲染模式渲染音频成分；渲染控制器(709)，其布置成响应于所述音频换能器位置数据而从所述多个渲染模式选择用于所述渲染器(707)的渲染模式；以及其中所述渲染器(707)布置成针对所述组音频换能器的不同子集采用不同的渲染模式，并针对所述组音频换能器(703)的每个所述不同子集独立地选择渲染模式，以及其中所述渲染控制器(709)布置成响应于所述组音频换能器(703)的第一音频换能器相对于所述音频换能器的预定位置的位置来选择所述第一音频换能器的渲染模式。2.如权利要求1所述的音频处理装置，其中所述渲染器(707)可操作来针对所述组音频换能器(703)的第一音频换能器的音频对象采用不同的渲染模式，且所述渲染控制器(709)布置成针对所述第一音频换能器的每个所述音频对象独立地选择渲染模式。3.如权利要求1或2所述的音频处理装置，其中所述多个音频成分中的至少两个是不同的音频类型。4.如权利要求3所述的音频处理装置，其中所述多个音频成分包括来自由下列项组成的组的不同音频类型的至少两个音频成分: -音频通道成分， -音频对象成分，以及 -音频场景成分；以及所述渲染器布置成针对所述至少两个音频成分使用不同渲染模式。5.如权利要求3所述的音频处理装置，其中所述接收器(705)布置成接收指示至少第一音频成分的音频类型的音频类型指示数据，且所述渲染控制器(709)布置成响应于所述音频类型指示数据而选择用于所述第一音频成分的所述渲染模式。6.如权利要求1所述的音频处理装置，其中所述渲染控制器(709)布置成选择用于所述第一音频换能器的默认渲染模式，除非在所述第一音频换能器的位置与所述预定位置之间的差异超过阈值。7.如权利要求1所述的音频处理装置，其中所述渲染控制器(709)布置成:将所述组音频换能器(703)分成音频换能器的第一子集和音频换能器的第二子集，音频换能器的所述第一子集包括其中在所述音频换能器的位置和所述预定位置之间的差异超过阈值的音频换能器，而音频换能器的所述第二子集包括其中在所述音频换能器的位置和所述预定位置之间的差异不超过阈值的至少一个音频换能器；以及从第一渲染模式子集选择用于所述第一子集的每个音频换能器的渲染模式并从第二渲染模式子集选择用于所述第二子集的每个音频换能器的渲染模式。8.如权利要求1所述的音频处理装置，其中所述多个渲染模式包括从由下列项组成的组选择的至少一个渲染模式: -立体声渲染； -基于矢量的幅值平移渲染； -波束成型渲染； -串音消除渲染； -高保真度立体声响复制渲染； -波场合成渲染；以及 -最小二乘法优化渲染。9.如权利要求1所述的音频处理装置，其中所述接收器(705)还布置成接收所述音频成分的渲染位置数据，且所述渲染控制器(709)布置成响应于所述渲染位置数据而选择所述渲染模式。10.如权利要求1所述的音频处理装置，其中所述渲染器(707)布置成针对所述音频成分中的音频成分的不同频带采用不同的渲染模式；且所述渲染控制器(709)布置成针对所述音频成分的不同频带独立地选择清染模式。11.如权利要求1所述的音频处理装置，其中所述渲染控制器(709)布置成使至少一个音频成分的渲染的变化与在所述至少一个音频成分中的音频内容变化同步。12.如权利要求1所述的音频处理装置，其中所述渲染控制器(709)还布置成响应于来自由下列项组成的组的渲染配置数据而选择所述渲染模式: -不在所述组音频换能器中的音频换能器的音频换能器位置数据； -收听位置数据； -所述组音频换能器的音频换能器的音频换能器音频渲染特性数据；以及 -用户清染偏好。13.如权利要求1所述的音频处理装置，其中所述渲染控制器(709)布置成响应于由感知模型产生的质量度量而选择所述渲染模式。14.一种音频处理的方法，所述方法包括: 接收音频数据和渲染配置数据，所述音频数据包括多个音频成分的音频数据并且所述渲染配置数据包括一组音频换能器(703)的音频换能器位置数据；从所述音频数据产生所述组音频换能器的音频换能器信号，所述产生包括根据多个可能的渲染模式中的渲染模式来渲染音频成分；响应于所述音频换能器位置数据从所述多个可能的渲染模式选择用于所述渲染器的清染模式；以及其中所述音频换能器信号的产生包括针对所述组音频换能器的不同子集采用不同的渲染模式，以及针对所述组音频换能器(703)的每个不同子集独立地选择渲染模式，以及其中选择用于所述渲染器的渲染模式包括响应于所述组换能器(703)的第一音频换能器相对于所述音频换能器的预定位置的位置而选择用于所述第一音频换能器的渲染模式。15.一种计算机程序产品，其包括适配为当所述程序在计算机上运行时执行权利要求14的所有步骤的计算机程序代码模块。
【专利摘要】音频处理装置包括：接收包括音频成分的音频数据和包括一组音频换能器（703）的音频换能器位置数据的渲染配置数据的接收器（705）。渲染器（707）从音频数据产生这组音频换能器的音频换能器信号。渲染器（7010）能够根据多个渲染模式渲染音频成分。渲染控制器（709）基于音频换能器位置数据而从多个渲染模式选择用于渲染器（707）的渲染模式。渲染器（707）可针对这组音频换能器的不同子集采用不同的渲染模式，渲染控制器（709）可针对这组音频换能器（703）的每个不同子集独立地选择渲染模式。渲染控制器（709）可响应于这组音频换能器（703）的第一音频换能器相对于音频换能器的预定位置的位置而选择第一音频换能器的渲染模式。该方法可提供例如对下面的情形的提高的适应：大部分扬声器在期望位置处而子集从（多个）期望位置偏离。
【IPC分类】H04S7/00
【公开号】CN105191354
【申请号】CN201480028327
【发明人】W.P.J.德布鲁伊恩, A.S.赫马, A.W.J.奧门
【申请人】皇家飞利浦有限公司
【公开日】2015年12月23日
【申请日】2014年5月16日
【公告号】EP2997742A1, US20160080886, WO2014184353A1

完整全部详细技术资料下载

当前第6页1 2 3 4 5 6