音频提供设备和方法

文档序号:9252728阅读:593来源:国知局
音频提供设备和方法
【技术领域】
[0001] 本发明构思涉及一种音频提供设备和方法,更具体地,涉及一种渲染和输出具有 针对音频再现系统最佳的各种格式的音频信号的音频提供设备和方法。
【背景技术】
[0002] 目前,在多媒体市场中正在使用各种音频格式。例如,音频提供设备提供从2声道 音频格式到22. 2声道音频格式的各种音频格式。具体地,正提供使用诸如在三维空间中表 现声源的7. 1声道、11. 1声道和22. 2声道的声道的音频系统。
[0003] 然而,大部分当前提供的音频信号具有2. 1声道格式或5. 1声道格式,并且在三维 空间中表现音源方面受限。另外,在家中建立用于再现7. 1声道、11. 1声道和22. 2声道音 频信号的音频系统是特别困难的。
[0004] 因此,需要开发一种根据输入信号的格式和音频再现系统来主动地渲染音频信号 的方法。

【发明内容】

[0005] 技术问题
[0006] 本发明构思提供一种音频提供方法和使用该方法的音频提供设备,其中,所述音 频提供方法和音频提供设备通过对声道音频信号进行向上混合或向下混合来针对收听环 境而优化声道音频信号,并根据几何信息渲染对象音频信号以提供针对收听环境而被优化 的声像。
[0007] 技术方案
[0008] 根据本发明构思的一方面,提供了一种音频提供设备,包括:对象渲染单元,基于 关于对象音频信号的几何信息来渲染对象音频信号;声道渲染单元,将具有第一声道数量 的音频信号渲染为具有第二声道数量的音频信号;混合单元,将渲染的对象音频信号与具 有第二声道数量的音频信号进行混合。
[0009] 对象渲染单元可包括:几何信息分析器,将关于对象音频信号的几何信息转换为 三维(3D)坐标信息;距离控制器,基于3D坐标信息产生距离控制信息;深度控制器,基于 3D坐标信息产生深度控制信息;定位器,基于3D坐标信息产生用于对对象音频信号进行 定位的定位信息;渲染器,基于距离控制信息、深度控制信息和定位信息来渲染对象音频信 号。
[0010] 距离控制器可获取对象音频信号的距离增益。随着对象音频信号的距离增大,距 离控制器可使对象音频信号的距离增益减小,而随着对象音频信号的距离减小,距离控制 器可使对象音频信号的距离增益增大。
[0011] 深度控制器可基于对象音频信号的水平投射距离获取深度增益,深度增益可被表 不为负矢量与正矢量之和,或者可被表不为负矢量与空矢量之和。
[0012] 定位器可根据音频提供设备的扬声器布局来获取用于对对象音频信号进行定位 的平移增益。
[0013] 渲染器可基于对象音频信号的深度增益、平移增益和距离增益将对象音频信号渲 染为多声道对象音频信号。
[0014] 当对象音频信号为多个对象音频信号时,对象渲染单元可获取所述多个对象音频 信号之中具有相关性的多个对象音频信号之间的相位差,并将具有相关性的多个对象音频 信号之一移动获取的相位差以对具有相关性的多个对象音频信号进行组合。
[0015] 当音频提供设备通过使用具有相同高度的多个扬声器来再现音频时,对象渲染单 元可包括:虚拟滤波器,对对象音频信号的频谱特性进行校正并将虚拟高度信息添加到对 象音频信号;虚拟渲染器,基于由虚拟滤波器提供的虚拟高度信息来渲染对象音频信号。
[0016] 虚拟滤波器可具有包括多级的树结构。
[0017] 当具有第一声道数量的音频信号的布局为二维(2D)布局时,声道渲染单元可将 具有第一声道数量的音频信号向上混合为具有大于第一声道数量的第二声道数量的音频 信号,具有第二声道数量的音频信号的布局可以是具有高度信息的三维(3D)布局,其中, 所述高度信息不同于与具有第一声道数量的音频信号有关的高度信息。
[0018] 当具有第一声道数量的音频信号的布局为三维(3D)布局时,声道渲染单元可将 具有第一声道数量的音频信号向下混合为具有小于第一声道数量的第二声道数量的音频 信号,具有第二声道数量的音频信号的布局可以是二维(2D)布局,其中,在二维布局中多 个声道具有相同的高度分量。
[0019] 从对象音频信号和具有第一声道数量的音频信号中选择的至少一个可包括用于 确定是否对特定帧执行虚拟三维(3D)植染的信息。
[0020] 声道渲染单元可在将具有第一声道数量的音频信号渲染为具有第二声道数量的 音频信号的操作中获取具有相关性的多个音频信号之间的相位差,并将具有相关性的多个 音频信号之一移动获取的相位差以对具有相关性的多个音频信号进行组合。
[0021] 混合单元可在将渲染的对象音频信号与具有第二声道数量的音频信号进行混合 的同时获取具有相关性的多个音频信号之间的相位差,并将具有相关性的多个音频信号之 一移动获取的相位差以对具有相关性的多个音频信号进行组合。
[0022] 对象音频信号可包括关于对象音频信号的标识(ID)和类型信息中的至少一个, 从而使用户能够对对象音频信号进行选择。
[0023] 根据本发明构思的另一方面,提供了一种音频提供方法,包括:基于关于对象音频 信号的几何信息来渲染对象音频信号;将具有第一声道数量的音频信号渲染为具有第二声 道数量的音频信号;将渲染的对象音频信号与具有第二声道数量的音频信号进行混合。
[0024] 渲染对象音频信号的步骤可包括:将关于对象音频信号的几何信息转换为三维 (3D)坐标信息;基于3D坐标信息,产生距离控制信息;基于3D坐标信息,产生深度控制信 息;基于3D坐标信息,产生用于对对象音频信号进行定位的定位信息;基于距离控制信息、 深度控制信息和定位信息,渲染对象音频信号。
[0025] 产生距离控制信息的步骤可包括:获取对象音频信号的距离增益;随着对象音频 信号的距离增大,使对象音频信号的距离增益减小;随着对象音频信号的距离减小,使对象 音频信号的距离增益增大。
[0026] 产生深度控制信息的步骤可包括:基于对象音频信号的水平投射距离来获取深度 增益,深度增益可被表示为负矢量与正矢量之和,或者可被表示为负矢量与空矢量之和。
[0027] 产生定位信息的步骤可包括:根据音频提供设备的扬声器布局获取用于对对象音 频信号进行定位的平移增益。
[0028] 渲染步骤可包括:基于对象音频信号的深度增益、平移增益和距离增益,将对象音 频信号渲染为多声道对象音频信号。
[0029] 渲染对象音频信号的步骤可包括:当对象音频信号为多个对象音频信号时,获取 所述多个对象音频信号之中具有相关性的多个对象音频信号之间的相位差,并将具有相关 性的多个对象音频信号之一移动获取的相位差以对具有相关性的多个对象音频信号进行 组合。
[0030] 当音频提供设备通过使用具有相同高度的多个扬声器来再现音频时,渲染对象音 频信号的步骤可包括:对对象音频信号的频谱特性进行校正并将虚拟高度信息添加到对象 音频信号;基于由虚拟滤波器提供的虚拟高度信息来渲染对象音频信号。
[0031] 获取步骤可包括:通过使用具有包括多级的树结构的虚拟滤波器来获取关于对象 音频信号的虚拟高度信息。
[0032] 将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号的步骤可 包括:当具有第一声道数量的音频信号的布局为二维(2D)布局时,将具有第一声道数量的 音频信号向上混合为具有大于第一声道数量的第二声道数量的音频信号,具有第二声道数 量的音频信号的布局可以是具有高度信息的三维(3D)布局,其中,所述高度信息不同于与 具有第一声道数量的音频信号有关的高度信息。
[0033] 将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号的步骤可 包括:当具有第一声道数量的音频信号的布局为三维(3D)布局时,将具有第一声道数量的 音频信号向下混合为具有小于第一声道数量的第二声道数量的音频信号,具有第二声道数 量的音频信号的布局可以是二维(2D)布局,其中,在二维布局中多个声道具有相同的高度 分量。
[0034] 从对象音频信号和具有第一声道数量的音频信号中选择的至少一个可包括用于 确定是否对特定帧执行虚拟三维(3D)植染的信息。
[0035] 有益效果
[0036] 根据本发明的各种实施例,音频提供设备再现具有针对输出音频系统最佳的各种 格式的音频信号。
【附图说明】
[0037] 图1是示出根据本发明的示例性实施例的音频提供设备的配置的框图。
[0038] 图2是示出根据本发明的示例性实施例的对象渲染单元的配置的框图。
[0039]图3是用于描述根据本发明的示例性实施例的对象音频信号的几何信息的示图。 [0040]图4是用于描述根据本发明的示例性实施例的基于对象音频信号的距离信息的 距离增益的曲线图。
[0041]图5a和图5b是用于描述根据本发明的示例性实施例的基于对象音频信号的深度 信息的深度增益的曲线图。
[0042] 图6是示出根据本发明的另一示例性实施例的用于提供虚拟三维(3D)对象音频 信号的对象渲染单元的配置的框图。
[0043]图7a和图7b是用于描述根据本发明的示例性实施例的虚拟滤波器的示图。
[0044]图8a到图Sg是用于描述根据本发明的各种示例性实施例的音频信号的声道渲染 的示图。
[0045] 图9是用于描述根据本发明的示例性实施例的音频信号提供方法的流程图。
[0046] 图10是示出根据本发明的另一示例性实施例的音频提供设备的配置的框图。
【具体实施方式】
[0047] 以下,将参照附图来详细描述本发明。图1是示出是根据本发明的示例性实施例 的音频提供设备100的配置的框图。如图1中所示,音频提供设备100包括输入单元110、 解复用器120、对象渲染单元130、声道渲染单元140、混合单元150和输出单元160。
[0048]输入单元110可从各种源接收音频信号。在这种情况下,音频源可包括声道音频 信号和对象音频信号。这里,声道音频信号是包括相应帧的背景声的音频信号,并且可具有 第一声道数量(例如,5. 1声道、7. 1声道等)。另外,对象音频信号可以是具有运动的对象 或相应帧中的重要对象的音频信号。对象音频信号的示例可包括语音、枪声等。对象音频 信号可包括对象音频信号的几何信息。
[0049]解复用器120可对来自接收到的音频信号的声道音频信号和对象音频信号进行 解复用。另外,解复用器120可将解复用的对象音频信号和声道音频信号分别输出到对象 渲染单元130和声道渲染单元140。
[0050] 对象渲染单元130可基于与接收到的对象音频信号有关的几何信息来渲染接收 到的对象音频信号。在这种情况下,对象音频渲染单元130可根据音频提供设备100的扬 声器布局来渲染接收到的对象音频信号。例如,当音频提供设备100的扬声器布局是具有 相同高度(elevation)的二维(2D)布局时,对象植染单元130可对接收到的对象音频信号 进行二维渲染。另外,当音频提供设备100的扬声器布局是具有多个高度的3D布局时,对 象渲染单元130可对接收到的对象音频信号进行三维渲染。另外,虽然音频提供设备100 的扬声器布局是具有相同高度的2D布局,但是对象渲染单元130可将虚拟高度信息添加到 接收到的对象音频信号,并对对象音频信号进行三维渲染。将参照图2到图7b详细描述对 象植染单元130。
[0051] 图2是示出根据本发明的示例性实施例的对象渲染单元130的配置的框图。如图 2中所示,对象渲染单元130可包括几何信息分析器131、距离控制器
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1