针对任意扬声器布局的音频对象的平移的制作方法_5

文档序号:9673301阅读:来源:国知局
09] L浪浊:激枕~~ 汾'技…,',V>、,装)化试4) t
[0110] 在式4中,Edistance代表对于向相对远离源的扬声器施加增益的惩罚并且Qdistance代 表距离加权因子。Edistance是上述正则项的示例。在一些实现中,加权因子Qdistance可W在0.1 和0.0001之间。在一个示例中,Qdistance=O. 01。
[0111] 在一些实现中,成本函数的第=项可W设置用于所确定的增益贡献的尺度 (scale)。该项可W允许例如成本函数如W上参照8B所述地在选项之间进行辨别,并且从可 能无限数量的增益集中选择单个增益集。在一些运样的实现中,成本函数的第=项可W如 下: ... 、?',
[0"2]款议况會術?议;泌々~.I£躬-1试5)
[01 13]在式5中,Esim-to-one代表设置增値的尺度的项,并且Clsimi-to-one代表增値贝献的缩放 因子。在一些示例中,Qsum-to-one可W被设置成1。然而,在其他示例中,日3皿-*。-。。6可^被设置成 另一个值,诸如2或其他正数。
[0114] 在一些实现中,成本函数可W是分派给各扬声器的增益的二次函数。在一些运样 的实现中,成本函数可W包括上述的第一项、第二项和第=项,例如,如下:
[0115]E[gi]=Ecl巧distanceWsum-to-one (式6)
[0116] 在式6中,E[gi]代表为gi的二次的成本函数。设及二次成本函数的实现可W具有潜 在优点。例如,使成本函数最小通常是直接的(解析的)。此外,对于二次成本函数,只有一个 最小值。然而,替代实现可W使用非二次成本函数,诸如更高次的成本函数。尽管运些替代 实现具有一些潜在益处,但相比于二次成本函数的最小化过程,使成本函数最小可能不是 直接的。此外,对于更高次的成本函数,一般有多于一个的最小值。确定更高次的成本函数 的全局极小值可能存在挑战。
[0117] -些实现包含W下过程:调节因应用成本函数而导致的增益W确保保持音量,换 句话讲,确保任何任意扬声器布局中音频对象W相同音量/响度被感知。存在各种可能性。 在一些实现中,增益可W被归一化,使得: normalized__ //WjP'V.含
[0118]Si -朵V、厶若试7) /
[0119] 在式7中,gin°?alized代表归一化后的扬声器(或者群集)增益并且P代表常数。在一 些示例中,P可W在[1,2]的范围内。
[0120] 尽管主要依据向扬声器进行呈现描述了使用成本函数确定增益贡献的W上讨论, 但运些方法可W尤其用于确定群集的增益贡献,群集可W是随时间变化的群集。
[0121] 图IOA和图IOB是提供向群集呈现音频对象的一些方法的概况的流程图。方法1000 的操作(如同本文中描述的其他方法一样)不一定按指示的次序执行。此外,运些方法可W 包括比示出和/或描述的框更多或更少的框。可W至少部分由逻辑系统(诸如图IOE和图11 示出的和W下描述的逻辑系统)实现运些方法。此逻辑系统可W是音频处理系统的组件。作 为替代地或者附加地,可W借助其上存储有软件的非暂态介质实现运些方法。该软件可W 包括用于控制一个或多个装置来至少部分执行本文中描述的方法的指令。
[0122] 在运个示例中,方法1000先从框1005开始,框1005设及接收包括N个音频对象的音 频数据。例如,可W由音频处理系统接收音频数据。在运个示例中,音频对象包括音频信号 和相关联的元数据。元数据可W包括各种类型的元数据,诸如在本文中别处描述的元数据, 但在运个示例中至少包括音频对象位置数据。在运个示例中,框1010设及执行从N个音频对 象产生M个群集的音频对象集群过程,M是小于N的数。
[0123] 图IOB示出框1010的细节的一个示例。在运个示例中,框IOlOa设及选择M个代表性 音频对象。如本文中别处所描述的,根据特定实现,可W按照各种标准选择代表性音频对 象。如W上参照图7A和图7B描述的,例如,一个运样的标准可W是各音频对象的音频信号的 幅度:在框IOlOa中可W选择相对"较响的"音频对象作为代表。
[0124]运里,框IOlOb设及根据M个代表性音频对象中的每个的音频对象位置数据来确定 M个群集中的每个的群集质屯、位置。运里,各群集质屯、位置是代表与群集关联的所有音频对 象的位置的单个位置。在运个示例中,各群集质屯、位置对应于M个代表性音频对象中的一个 的位置。
[0125]在运个示例中,框IOlOc设及确定N个音频对象中的每个的音频信号对于M个群集 中的至少一个的增益贡献。运里,确定增益贡献设及确定作为群集质屯、位置和分派给各群 集的增益的函数的响度中屯、位置,并且确定成本函数的最小值。在运个实现中,成本函数的 第一项代表响度中屯、位置和音频对象位置之间的差异。
[0126] 因此,确定对于M个群集中的每个的增益贡献的过程可基本上如上所述地在确定 对于M个扬声器中的每个的增益贡献的情境下执行。然而,该过程可W在一些方面不同,因 为群集质屯、位置可W是随时间变化的并且回放环境的扬声器位置一般将不是随时间变化 的。
[0127]因此,在一些实现中,确定响度中屯、位置可W包含借助加权过程组合群集质屯、位 置,在加权过程中,赋予群集质屯、位置的权重对应于分派给群集质屯、位置的增益。例如,确 定响度中屯、位置可W包含:确定各群集质屯、位置和分派给各群集质屯、位置的增益的乘积; 计算乘积之和;确定所有群集质屯、位置的增益之和;将乘积之和除W增益之和。
[0128]在一些示例中,成本函数的第二项代表对象位置和群集质屯、位置之间的距离。例 如,成本函数的第二项可W与对象位置和群集质屯、位置之间距离的平方成比例。在一些实 现中,成本函数的第=项可W设置所确定的增益贡献的尺度。成本函数可W是分派给各群 集的增益的二次函数。
[0129]在运个示例中,可选框1015包含根据对应群集中的音频对象的增益贡献来修正至 少一个群集质屯、位置。如W上所述的,在一些实现中,群集质屯、位置可W简单地是被选择作 为群集代表的音频对象的位置。在包括可选框1015的实现中,代表性音频对象位置可W是 初始群集质屯、位置。在执行W上提及的用于确定音频对象信号对于各群集的贡献的过程之 后,在运些实现中,可W根据所确定的增益来确定至少一个修正后的群集质屯、位置。
[0130] 图IOC和图IOD提供了根据对应群集中的音频对象的增益贡献来修正群集质屯、位 置的示例。图IOC和图IOD和图7A和图7B的修正形式。在图IOC中,在执行W上提及的确定音 频对象信号对于群集Cl和C2的贡献的过程之后,修正了群集质屯、710a的位置。在运个示例 中,群集质屯、710a的位置被移位成更靠近音频对象705c(群集Cl中的第二响音频对象):用 虚线轮廓示出修正后的群集质屯、710a的位置。
[0131] 类似地,在图IOD中,在执行W上提及的确定音频对象信号对于群集C1、C2和C3的 贡献的过程之后,修正了群集质屯、710a的位置。在运个示例中,群集质屯、710a的位置被移位 成更靠近音频对象70化和705i(群集Cl中此时仅剩的其它音频对象)的中点。
[0132]图IOE是提供能够实现本公开的各种方面的设备的组件示例的框图。设备1050可 W是例如音频处理系统(或者可W是音频处理系统的一部分)。
[0133] 在运个示例中,设备1050包括接口系统1055和逻辑系统1060。逻辑系统1060可W 例如包括通用单忍片或多忍片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场 可编程口阵列(FPGA)或其它可编程逻辑器件、分立的口或晶体管逻辑、和/或分立的硬件组 件。
[0134]在运个示例中,设备1050包括存储系统1065。存储系统1065可W包括一种或多种 合适类型的非暂态存储介质,诸如闪存存储器、硬盘驱动等。接口系统1055可W包括网络接 口、逻辑系统和存储系统之间的接口和/或外部装置接口(诸如通用串行总线化SB)接口)。
[0135]在运个示例中,逻辑系统1060能够至少部分地执行本文中公开的方法。例如,逻辑 系统1060可W能够借助接口系统接收包括N个音频对象的音频数据,音频对象包括音频信 号和相关联的元数据。元数据可W至少包括音频对象位置数据。
[0136] 在一些实现中,逻辑系统1060可W能够确定N个音频对象中的每个的音频对象信 号对于M个扬声器中的至少一个的增益贡献。确定增益贡献可W包含确定作为扬声器位置 和分派给各扬声器的增益的函数的响度中屯、位置,并且确定成本函数的最小值。成本函数 的第一项可W代表响度中屯、位置和音频对象位置之间的差异。确定响度中屯、位置可W包含 借助加权过程组合扬声器位置,在加权过程中,赋予扬声器位置的权重对应于分派给扬声 器位置的增益。
[0137]在一些实现中,逻辑系统1060可W能够执行从N个音频对象产生M个群集的音频对 象集群过程,M是小于N的数。集群过程可W包含选择M个代表性音频对象,并且根据M个代表 性音频对象中的每个的音频对象位置数据来确定M个群集中的每个的群集质屯、位置。各群 集质屯、位置可W是代表与群集关联的所有音频对象的位置的单个位置。
[0138]逻辑系统1060可W能够确定N个音频对象中的每个的音频对象信号对于M个群集 中的至少一个的增益贡献。确定增益贡献可W包含确定作为群集质屯、位置和分派给各群集 的增益的函数的响度中屯、位置,并且确定成本函数的最小值。在一些实现中,确定响度中屯、 位置可W包含借助加权过程组合群集质屯、位置,在加权过程中,赋予群集质屯、位置的权重 对应于分派给群集质屯、位置的增益。至少一个群集质屯、位置可W是随时间变化的。
[0139]成本函数的第一项可W代表响度中屯、位置和音频对象位置之间的差异。成本函数 的第二项可W代表对象位置和扬声器位置或群集质屯、位置之间的距离。例如,成本函数的 第二项可W与对象位置和扬声器位置或群集质屯、位置之间的距离的平方成比例。成本函数 的第=项可W设置所确定的增益贡献的尺度。成本函数可W是分派给各扬声器或群集的增 益的二次函数。
[0140]在一些实现中,逻辑系统1060可W能够根据一个或多个非暂态介质存储的软件、 至少部分地执行本文中公开的方法。非暂态介质可W包括与逻辑系统1060相关联的存储 器,诸如随机存取存储器(RAM)和/或只读存储器(ROM)。非暂态介质可W包括存储系统1065 的存储器。
[0141] 图11是提供音频处理设备的组件示例的框图。在运个示例中,音频处理系统1100 包括接口
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1