音频提供设备和方法_2

文档序号:9252728阅读:来源:国知局
132、深度控制器133、 定位器134和渲染器135。
[0052] 几何信息分析器131可接收关于对象音频信号的几何信息并对几何信息进行分 析。具体地,几何信息分析器131可将关于对象音频信号的几何信息转换为对于渲染所必 需的3D坐标信息。例如,如图3中所示的几何信息分析器131可将接收到的对象音频信号 "0"分析为坐标信息(r, 0,q>)。这里,r表示收听者的位置与对象音频信号之间的距离, 0表示声像的方位角,9表示声像的俯仰角。
[0053]距离控制器132可基于3D坐标信息来产生距离控制信息。详细地,距离控制器 132可基于通过由几何信息分析器131进行分析而获得的3D距离"r"来计算对象音频信号 的距离增益。在这种情况下,距离控制器132可计算与3D距离"r"成反比的距离增益。也 就是说,随着对象音频信号的距离增加,距离控制器132可减小对象音频信号的距离增益, 而随着对象音频信号的距离减小,距离控制器132可增加对象音频信号的距离增益。另外, 当位置更靠近于原点时,距离控制器132可设置一并不完全成反比的上限增益值,从而使 距离增益不会发散。例如,距离控制器132可如以下等式(1)中所表现的来计算距离增益 "dg" :
[0055] 也就是说,如图4中所示,距离控制器132可基于等式(1)将距离增益值"dg"设 置为1到3. 3。
[0056] 深度控制器133可基于3D坐标信息来产生深度控制信息。在这种情况下,深度控 制器133可基于对象音频信号的水平投射距离"d"和收听者的位置来获取深度增益。
[0057] 在这种情况下,深度控制器133可将深度增益表示为负矢量和正矢量之和。具 体地,当在对象音频信号的3D坐标中Kl时,S卩,当对象音频信号位于由音频提供设 备100所包括的扬声器构成的球体中时,正矢量被定义为(r,0 ,cp),负矢量被定义为 (r,0 +180,q>)。为了定义对象音频信号,深度控制器133可计算正矢量的深度增益"vp" 以及负矢量的深度增益"vn",从而将对象音频信号的几何矢量表示为正矢量与负矢量之 和。在这种情况下,正矢量的深度增益"Vp"以及负矢量的深度增益"Vn"可如以下的等式 (2)中所表现的被计算:
[0058] Vp=sin(dSJT/2+JT/4) …⑵
[0059]vn=cos(dSJT/2+JT/4)
[0060] 也就是说,如图5a中所示,深度控制器133可在水平投射距离"d"为0到1的情 况下计算正矢量的深度增益以及负矢量的深度增益。
[0061] 进一步地,深度控制器133可将深度增益表示为正矢量与负矢量之和。详细地,当 在平移增益与所有声道的位置的乘积之和收敛于0的情况下不存在方向时的平移增益可 被定义为空矢量。具体地,深度控制器133可计算正矢量的深度增益"vp"以及空矢量的深 度增益"vnll",使得在水平投射距离"d"接近于0时,空矢量的深度增益被映射为1,而在水 平投射距离"d"接近于1时,正矢量的深度增益被映射为1。在这种情况下,正矢量的深度 增益"vp"以及空矢量的深度增益"vnll"可如以下的等式(3)中所表现的来计算:
[0062] Vp=sin(dSJT/2) ...⑶
[0063] Vnll=cos(dS/2)
[0064] 也就是说,如图5b所示,深度控制器133可在水平投射距离"d"为0到1的情况 下计算正矢量的深度增益以及空矢量的深度增益。
[0065] 深度控制由深度控制器133执行,并且当水平投射距离接近于0时,可通过所有的 扬声器输出声音。因此,在平移边界中发生的不连续性减少。
[0066] 定位器134可基于3D坐标信息来产生用于对对象音频信号进行定位的定位信 息。具体地,定位器134根据音频提供设备100的扬声器布局来计算用于对对象音频信号 进行定位的平移增益。详细地,定位器134可选择用于对具有与对象音频信号的几何结构 (geometry)的方向相同的方向的正矢量进行定位的三扬声器(tripletspeaker),并针对 正矢量的三扬声器计算3D平移系数"gp"。另外,当深度控制器133用正矢量和负矢量来表 示深度增益时,定位器134可选择用于对具有与对象音频信号的轨迹方向相反的方向的负 矢量进行定位的三扬声器,并针对负矢量的三扬声器计算3D平移系数"gn"。
[0067] 渲染器135可基于距离控制信息、深度控制信息以及定位信息来渲染对象音频信 号。具体地,渲染器135可从距离控制器132接收距离增益"dg",从深度控制器133接收深 度增益%",从定位器134接收平移增益"g",并将距离增益"dg"、深度增益"v"和平移增益 "g"应用于对象音频信号以产生多声道对象音频信号。具体地,当对象音频信号的深度增 益被表示为正矢量与负矢量之和时,渲染器135可如以下的等式(4)中所表现的来计算第 m声道的最终增益"Gm":
[0068] Gm=dgS(gp;mSvp+gn;mSvn) …(4)
[0069] 其中,gp>n^示当正矢量被定位时应用于m声道的平移系数,gn,m表示当负矢量被 定位时应用于m声道的平移系数。
[0070] 此外,当对象音频信号的深度增益被表示为正矢量与空矢量之和时,渲染器135 可如以下的等式(5)中所表现的计算第m声道的最终增益"Gm":
[0071] Gm=dgS(gp;mSvp+gnll;mSvnll) …(5)
[0072] 其中,81),111表示当正矢量被定位时应用于m声道的平移系数,gn,m表示当空矢量被 定位时应用于m声道的平移系数。此外,Egnll,m可变为0。
[0073] 此外,渲染器135可将最终增益应用于对象音频信号"X",从而如以下的等式(6) 中所表现的来计算第m声道的对象音频信号的最终输出"Ym":
[0074] Ym=XsGm …(6)
[0075] 如上所述计算的对象音频信号的最终输出"Ym"可被输出到混合单元150。
[0076] 此外,当存在多个对象音频信号时,对象渲染单元130可计算所述多个对象音频 信号之间的相位差,并将所述多个对象音频信号之一移动计算的相位差以组合所述多个对 象音频信号。
[0077] 详细地,在多个对象音频信号为相同的信号但在所述多个对象音频信号被输出时 具有不同的相位的情况下,当所述多个对象音频信号按照原样被组合时,由于所述多个对 象音频信号的重叠而导致音频信号失真。因此,对象渲染单元130可计算所述多个对象音 频信号之间的相关性,并当相关性等于或大于预定值时,对象渲染单元130可计算所述多 个对象音频信号之间的相位差,并将所述多个对象音频信号中的一个对象音频信号移动计 算出的相位差以对所述多个对象音频信号进行组合。因此,当彼此相似的多个对象音频信 号被输入时,可防止由于所述多个对象音频信号的组合而引起的失真。
[0078] 在上述不例性实施例中,音频提供设备100的扬声器布局是具有不同的尚度感的 3D布局,但是这仅仅是示例性实施例。音频提供设备100的扬声器布局可以是具有相同高 度值的2D布局。具体地,当音频提供设备100的扬声器布局是具有相同高度感的2D布局 时,对象渲染单元130可将包括在上述的关于对象音频信号的几何信息中的9的值设置为 0〇
[0079] 此外,音频提供设备100的扬声器布局可以是具有相同高度感的2D布局,但是音 频提供设备1〇〇可通过使用2D扬声器布局来虚拟地提供3D对象音频信号。
[0080] 以下,将参照图6和图7来描述用于提供虚拟3D对象音频信号的示例性实施例。
[0081] 图6是示出根据本发明的另一示例性实施例的用于提供虚拟3D对象音频信号的 对象渲染单元130'的配置的框图。如图6中所示,对象渲染单元130'包括虚拟滤波器136、 3D渲染器137、虚拟渲染器128和混合器139。
[0082] 3D渲染器137可通过使用以上参照图2到图5b描述的方法来渲染对象音频信号。 在这种情况下,3D渲染器137可将能够通过音频提供设备100的实体扬声器输出的对象音 频信号输出到混合器139,并输出提供不同的高度感的虚拟扬声器的虚拟平移增益"gm,t。/。
[0083] 虚拟滤波器136是对对象音频信号的音色进行补偿的块。虚拟滤波器136可基 于心理声学对输入的对象音频信号的频谱特性进行补偿,并将声像提供到虚拟扬声器的位 置。在这种情况下,虚拟滤波器136可被实现为各种类型的滤波器,诸如头相关传输函数 (HRTF)滤波器、双耳室脉冲响应(BRIR)滤波器等。
[0084] 此外,当虚拟滤波器136的长度小于帧的长度时,可通过块卷积来应用虚拟滤波 器136〇
[0085] 此外,当在诸如快速傅里叶(FFT)、改进离散余弦变换(MDCT)、正交镜像滤波器 (QMF)的频域中执行渲染时,虚拟滤波器136可被用作乘法器。
[0086] 当提供了多个虚拟顶层扬声器时,虚拟滤波器136可通过使用实体扬声器分布方 程式和一个高度滤波器来产生多个虚拟顶层扬声器。
[0087] 此外,当提供了多个虚拟顶层扬声器和虚拟后部扬声器时,虚拟滤波器136可通 过使用实体扬声器的分布方程式和多个虚拟滤波器来产生多个虚拟顶层扬声器和虚拟后 部扬声器,从而在不同的位置应用不同的频谱着色。
[0088] 此外,如果使用诸如Hl、H2、…、HN的N个频谱着色,则虚拟滤波器136可被设计 成树结构以减少算术运算的数量。具体地,如图7a中所示,虚拟滤波器136可将用于识别 共同高度的档位/尖峰设计为H),并按照级联型式将Kl到KN连接到HO,其中,Kl到KN是 通过从Hl到HN减去HO的特性而获取的分量。另外,基于共同分量和频谱着色,虚拟滤波 器136可具有包括图7b中所示的多级的树结构。
[0089] 虚拟渲染器138是用于将虚拟声道表现为物理声道的渲染块。具体地,虚拟渲染 器138可根据从虚拟滤波器136输出的虚拟声道分布方程式来产生输出到虚拟扬声器的对 象音频信号,并将产生的虚拟扬声器的对象音频信号乘以虚拟平移增益"gm,t。/以对输出信 号进行组合。在这种情况下,虚拟扬声器的位置可根据多个实体扁平锥形扬声器的分散程 度而改变,其中,所述分散程度可被定义为虚拟声道分布方程式。
[0090] 混合器139可将物理声道的对象音频信号与虚拟声道的对象音频信号进行混合。
[0091] 因此,通过使用具有2D扬声器布局的音频提供设备100,对象音频信号可被表现 为被定位在3D布局上。
[0092] 再次参照图1,声道渲染单元140可将具有第一声道数量的声道音频信号渲染成 具有第二声道数量的音频信号。在这种情况下,声道渲染单元140可基于扬声器布局将具 有第一声道数量的声道音频信号改变为具有第二声道数量的音频信号。
[0093] 具体地,当声道音频信号的布局与音频提供设备100的扬声器布局相同时,声道 渲染单元140可在不用改变声道的情况下渲染声道音频信号。
[0094] 此外,当声道音频信号的声道数量多于音频提供设备100的扬声器布局的声道数 量时,声道渲染单元140可对声道音频信号进行向下混合以执行渲染。例如,当声道音频信 号的声道为7. 1声道而音频提供设备100的扬声器布局为5. 1声道时,声道渲染单元140可将具有7. 1声道的声道音频信号向下混合成5. 1声道。
[0095] 具体地,当对声道音频信号进行向下混合时,声道植染单元140可确定声道音频 信号的几何结构停止且没有任何变化的位置处的对象,并执行向
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1