音频提供设备和方法_5

文档序号：9252728阅读：来源：国知局

将音频信号和附加信息中的至少一个发送到外部装置。在这种情况下，接口 1070可被实现为诸如HDMI接口等的数字接口。外部装置可通过使用接收的音频信号和附加信息来执行渲染，并输出渲染的音频信号。
[0167] 然而，如上所述，将音频信号和附加信息发送到外部装置的渲染单元1050仅仅是示例性实施例。渲染单元1050可通过使用音频信号和附加信息来渲染音频信号，并输出渲染的音频信号。
[0168] 根据本发明的示例性实施例的对象音频信号可包括元数据，其中，所述元数据包括标识（ID)、类型信息或优先级信息。例如，对象音频信号可包括指示对象音频信号的类型是对话还是评论的信息。另外，当音频信号是广播音频信号时，对象音频信号可包括指示对象音频信号的类型是第一主播、第二主播、第一投手（caster)、第二投手还是背景声的信息。另外，当音频信号是音乐音频信号时，对象音频信号可包括指示对象音频信号的类型是第一歌手、第二歌手、第一乐器声还是第二乐器声的信息。另外，当音频信号是游戏音频信号时，对象音频信号可包括指示对象音频信号的类型是第一音效还是第二音效的信息。
[0169] 渲染单元1050可分析包括在上述对象音频信号中的元数据，并根据对象音频信号的优先级来渲染对象音频信号。
[0170] 此外，渲染单元1050可根据用户的选择移除特定的对象音频信号。例如，当音频信号是针对运动会的音频信号时，音频提供设备1000可显示用户界面（UI)，其中，n将当前输入的对象音频信号的类型显示给用户。在这种情况下，对象音频信号可包括投手的语音、画外音、叫喊声等。当用于从多个对象音频信号之中移除投手的语音的用户命令通过用户输入单元1060被输入时，渲染单元1050可从所述多个对象音频信号之中移除投手的语音，并通过使用其它的对象音频信号来执行渲染。
[0171] 此外，渲染单元1050可根据用户的选择针对特定的对象音频信号提高或降低音量。例如，当音频信号是包括在电影内容中的音频信号时，音频提供设备1000可显示UI，其中，该n将当前输入的对象音频信号的类型显示给用户。在这种情况下，对象音频信号可包括第一主角的语音、第二主角的语音、炸弹声、飞机声等。当用于在多个对象音频信号之中提高第一主角的语音和第二主角的语音的音量并降低炸弹声和飞机声的音量的用户命令通过用户输入单元1060被输入时，渲染单元1050可提高第一主角的语音和第二主角的语音的音量，并降低炸弹声和飞机声的音量。
[0172] 根据上述示例性实施例，用户操作期望的音频信号，因此建立了适合于用户的音频环境。
[0173] 根据各种示例性实施例的音频提供方法可被实现为程序并可被提供给显示设备或输入设备。具体地，包括控制显示设备的方法的程序可被存储在非暂时性计算机可读记录介质中并被提供。
[0174] 非暂时性计算机可读记录介质表示半永久地存储数据并可由装置读取的介质，而不是短时间地存储数据的介质，例如寄存器、高速缓冲存储器和内存。详细地，各种应用或程序可被存储在非暂时性计算机可读记录介质（诸如CD、DVD、硬盘、蓝光盘、USB存储器、存储卡或ROM)中。
[0175] 虽然已经参照本发明构思的示例性实施例具体示出和描述了本发明构思，但是应理解，在不脱离权利要求的精神和范围的情况下可对其进行形式和细节上的各种修改。
【主权项】
1. 一种音频提供设备，包括：对象渲染单元，基于关于对象音频信号的几何信息来渲染对象音频信号；声道渲染单元，将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号；混合单元，将渲染的对象音频信号与具有第二声道数量的音频信号进行混合。2. 如权利要求1所述的音频提供设备，其中，对象渲染单元包括：几何信息分析器，将关于对象音频信号的几何信息转换为三维（3D)坐标信息；距离控制器，基于3D坐标信息产生距离控制信息；深度控制器，基于3D坐标信息产生深度控制信息；定位器，基于3D坐标信息产生用于对对象音频信号进行定位的定位信息；渲染器，基于距离控制信息、深度控制信息和定位信息来渲染对象音频信号。3. 如权利要求2所述的音频提供设备，其中距离控制器获取对象音频信号的距离增益，随着对象音频信号的距离增大，距离控制器使对象音频信号的距离增益减小，随着对象音频信号的距离减小，距离控制器使对象音频信号的距离增益增大。4. 如权利要求3所述的音频提供设备，其中深度控制器基于对象音频信号的水平投射距离来获取深度增益，深度增益被表不为负矢量与正矢量之和，或者被表不为负矢量与空矢量之和。5. 如权利要求4所述的音频提供设备，其中，定位器根据音频提供设备的扬声器布局来获取用于对对象音频信号进行定位的平移增益。6. 如权利要求5所述的音频提供设备，其中，渲染器基于对象音频信号的深度增益、平移增益和距离增益将对象音频信号渲染为多声道对象音频信号。7. 如权利要求2所述的音频提供设备，其中，当对象音频信号为多个对象音频信号时，对象渲染单元获取所述多个对象音频信号之中具有相关性的多个对象音频信号之间的相位差，并将具有相关性的多个对象音频信号之一移动获取的相位差以对具有相关性的多个对象音频信号进行组合。8. 如权利要求1所述的音频提供设备，其中，当音频提供设备通过使用具有相同高度的多个扬声器来再现音频时，对象植染单元包括：虚拟滤波器，对对象音频信号的频谱特性进行校正并将虚拟高度信息添加到对象音频信号；虚拟渲染器，基于由虚拟滤波器提供的虚拟高度信息来渲染对象音频信号。9. 如权利要求8所述的音频提供设备，其中，虚拟滤波器具有包括多级的树结构。10. 如权利要求1所述的音频提供设备，其中，当具有第一声道数量的音频信号的布局为二维（2D)布局时，声道渲染单元将具有第一声道数量的音频信号向上混合为具有大于第一声道数量的第二声道数量的音频信号，具有第二声道数量的音频信号的布局为具有高度信息的三维（3D)布局，其中，所述高度信息不同于与具有第一声道数量的音频信号有关的高度信息。11. 如权利要求1所述的音频提供设备，其中，当具有第一声道数量的音频信号的布局为三维（3D)布局时，声道渲染单元将具有第一声道数量的音频信号向下混合为具有小于第一声道数量的第二声道数量的音频信号，具有第二声道数量的音频信号的布局是二维（2D)布局，其中，在二维布局中多个声道具有相同的高度分量。12. 如权利要求1所述的音频提供设备，其中，从对象音频信号和具有第一声道数量的音频信号中选择的至少一个包括用于确定是否对特定帧执行虚拟三维（3D)渲染的信息。13. 如权利要求1所述的音频提供设备，其中，声道渲染单元在将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号的操作中获取具有相关性的多个音频信号之间的相位差，并将具有相关性的多个音频信号之一移动获取的相位差以对具有相关性的多个音频信号进行组合。14. 如权利要求1所述的音频提供设备，其中，混合单元在将渲染的对象音频信号与具有第二声道数量的音频信号进行混合的同时获取具有相关性的多个音频信号之间的相位差，并将具有相关性的多个音频信号之一移动获取的相位差以对具有相关性的多个音频信号进行组合。15. 如权利要求1所述的音频提供设备，其中，对象音频信号包括关于对象音频信号的标识（ID)和类型信息中的至少一个，从而使用户能够对对象音频信号进行选择。16. -种音频提供方法，包括：基于关于对象音频信号的几何信息来渲染对象音频信号；将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号；将渲染的对象音频信号与具有第二声道数量的音频信号进行混合。17. 如权利要求16所述的音频提供方法，其中，渲染对象音频信号的步骤包括：将关于对象音频信号的几何信息转换为三维（3D)坐标信息；基于3D坐标信息，产生距离控制信息；基于3D坐标信息，产生深度控制信息；基于3D坐标信息，产生用于对对象音频信号进行定位的定位信息；基于距离控制信息、深度控制信息和定位信息，渲染对象音频信号。18. 如权利要求17所述的音频提供方法，其中，产生距离控制信息的步骤包括：获取对象音频信号的距离增益，随着对象音频信号的距离增大，使对象音频信号的距离增益减小，随着对象音频信号的距离减小，使对象音频信号的距离增益增大。19. 如权利要求18所述的音频提供方法，其中产生深度控制信息的步骤包括：基于对象音频信号的水平投射距离来获取深度增益，深度增益被表不为负矢量与正矢量之和，或者被表不为负矢量与空矢量之和。20. 如权利要求19所述的音频提供方法，其中，产生定位信息的步骤包括：根据音频提供设备的扬声器布局获取用于对对象音频信号进行定位的平移增益。21. 如权利要求20所述的音频提供方法，其中，渲染步骤包括：基于对象音频信号的深度增益、平移增益和距离增益，将对象音频信号渲染为多声道对象音频信号。22. 如权利要求17所述的音频提供方法，其中，渲染对象音频信号的步骤包括：当对象音频信号为多个对象音频信号时，获取所述多个对象音频信号之中具有相关性的多个对象音频信号之间的相位差，并将具有相关性的多个对象音频信号之一移动获取的相位差以对具有相关性的多个对象音频信号进行组合。23. 如权利要求16所述的音频提供方法，其中，当音频提供设备通过使用具有相同高度的多个扬声器来再现音频时，渲染对象音频信号的步骤包括：对对象音频信号的频谱特性进行校正并将虚拟高度信息添加到对象音频信号；基于由虚拟滤波器提供的虚拟高度信息来渲染对象音频信号。24. 如权利要求23所述的音频提供方法，其中，获取步骤包括：通过使用具有包括多级的树结构的虚拟滤波器来获取关于对象音频信号的虚拟高度信息。25. 如权利要求16所述的音频提供方法，其中将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号的步骤包括：当具有第一声道数量的音频信号的布局为二维（2D)布局时，将具有第一声道数量的音频信号向上混合为具有大于第一声道数量的第二声道数量的音频信号，具有第二声道数量的音频信号的布局为具有高度信息的三维（3D)布局，其中，所述高度信息不同于与具有第一声道数量的音频信号有关的高度信息。26. 如权利要求16所述的音频提供方法，其中将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号的步骤包括：当具有第一声道数量的音频信号的布局为三维（3D)布局时，将具有第一声道数量的音频信号向下混合为具有小于第一声道数量的第二声道数量的音频信号，具有第二声道数量的音频信号的布局是二维（2D)布局，其中，在二维布局中多个声道具有相同的高度分量。27. 如权利要求16所述的音频提供方法，其中，从对象音频信号和具有第一声道数量的音频信号中选择的至少一个包括用于确定是否对特定帧执行虚拟三维（3D)渲染的信息。
【专利摘要】提供一种音频提供设备和方法。音频提供设备包括：对象渲染单元，通过使用关于对象音频信号的几何信息来渲染对象音频信号；声道渲染单元，将具有第一声道数量的音频信号渲染为具有第二声道数量的音频信号；混合单元，将渲染的对象音频信号与具有第二声道数量的音频信号进行混合。
【IPC分类】H04S5/00, H04S7/00
【公开号】CN104969576
【申请号】CN201380072141
【发明人】赵炫, 金善民, 朴在夏, 孙尚模
【申请人】三星电子株式会社
【公开日】2015年10月7日
【申请日】2013年12月4日
【公告号】CA2893729A1, EP2930952A1, US20150350802, WO2014088328A1

完整全部详细技术资料下载

当前第5页1 2 3 4 5