用于呈现器与可独立寻址的驱动器的阵列之间的通信的双向互连的制作方法

文档序号：8288324阅读：278来源：国知局

用于呈现器与可独立寻址的驱动器的阵列之间的通信的双向互连的制作方法
【专利说明】用于呈现器与可独立寻址的驱动器的阵列之间的通信的双向互连
[0001] 相关申请的交叉引用
[0002] 本申请要求于2012年8月31日提交的美国临时专利申请61/696, 030号的优先权，在此通过引用将其全部内容包括在本文中。
技术领域
[0003] 一个或更多实现一般地涉及音频信号处理，更具体地，涉及用于通过可独立寻址的驱动器呈现反射音频信号和直接音频信号的系统的双向互连。
【背景技术】
[0004] 背景部分中所论述的主题不应当被认为仅由于背景部分中提到而是现有技术。类似地，背景部分中提到的问题或与背景部分的主题相关的问题不应当被认为是现有技术中先前已经认识到的问题。背景部分中的主题仅仅表示不同的方法，这些不同的方法本身也可以是发明。
[0005] 音频应用的互连系统通常是将扬声器馈送信号从声源或呈现器发送至扬声器阵列的简单的单向链路。高级音频内容诸如基于对象的音频的出现显著增加了呈现处理的复杂度和传输至各种不同的扬声器阵列的音频内容的种类，这现在是可能的。例如，电影音轨可以包括与屏幕上的图像、会话、噪声和音效对应的很多不同的声音元素，不同的声音元素从屏幕上的不同位置发出并且与背景音乐和环境效果相结合以产生整体的听众体验。准确播放要求以尽可能接近地对应于关于声源位置、强度、运动和深度在屏幕上所显示的那些的方式来再现声音。传统的基于通道的音频系统以扬声器馈送的形式将音频内容发送至听音环境中的各个扬声器。在这种情况下，常规的与扬声器的单向互连通常就足够了。
[0006] 然而，数字电影的引入和真实三维（"3D"）内容或虚拟3D内容的发展创建了新的声音标准，诸如多个音频通道的合并以给予内容创作者更大的创作力以及给予听众覆盖更广和更逼真的听觉体验。作为用于分配空间音频的方法对传统的扬声器馈送和基于通道的音频进行扩展是至关重要的，并且对以下基于模型的音频描述存在巨大兴趣：该基于模型的音频描述使得听者能够选择期望的播放配置，针对他们所选择的配置具有特定呈现的音频。声音的空间呈现利用音频对象，音频对象是与明显的源位置（例如，3D坐标）、明显的源宽度和其它参数的参数源描述相关的音频信号。另外的进步包括：开发了下一代空间音频（也称为"自适应音频"）格式，该下一代空间音频格式包括音频对象和传统的基于通道的扬声器馈送连同音频对象的位置元数据的混合。在空间音频解码器中，通道直接被发送至与通道相关的扬声器（如果存在合适的扬声器的话）或者被下混合至现有的扬声器组，并且音频对象由解码器以灵活的方式来呈现。与每个对象相关的参数源描述诸如3D空间中的位置轨迹连同连接至解码器的扬声器的数量和位置被获取作为输入。然后，呈现器利用某些算法，诸如声像法则（panninglaw)，在所附接的扬声器组之间分配与每个对象相关的音频。这样，可以通过存在于听音空间中的特定扬声器配置最佳地呈现每个对象的创作空间意图。
[0007] 本互连系统不能充分利用这种下一代音频系统的全部特征和能力。这种互连限于发送扬声器馈送音频信号或许一些受限的控制信号，而且不具有足以利用整个系统的所有呈现、配置和校准能力的结构。因此，需要以下互连系统：该互连系统将适当的信息从听音环境传输至呈现器，使得呈现器可以向特定扬声器阵列传输扬声器馈送并且调用用于基于对象的音频内容的优化播放的任何自动配置和校准例程。

【发明内容】

[0008] 描述了用于呈现听音环境中的空间音频内容的互连系统的实施例。一种物理/逻辑互连将系统的部件耦接在一起，所述系统包括：呈现器，其被配置成生成包括指定相应的音频通道在听音环境中的播放位置的信息的多个音频通道；放置在听音环境周围的可独立寻址驱动器阵列；校准/配置部件，其用于处理由放置在听音环境中的麦克风提供的声学信息。互连可以被实现为用于在呈现器/校准单元与扬声器驱动器之间传输音频信号和控制信号的双向互连。
[0009] 实施例具体地涉及用于将基于对象的呈现系统的部件耦接的互连，其包括：第一网络通道，其将呈现器耦接至在听音环境中投射声音的能够独立寻址的驱动器的阵列，并且将音频信号和控制数据从呈现器传输至阵列；以及第二网络通道，其将放置在听音环境中的麦克风耦接至呈现器的校准部件，并且将针对由麦克风生成的声学信息的校准控制信号传输至校准部件。
[0010] 本文中所描述的呈现系统可以实现以下音频格式和系统：其包括更新内容创建工具、分配方法、基于包括新的扬声器和通道配置的自适应音频系统的增强用户体验以及可能由为电影声音混合器创建的一套高级内容创建工具产生的新的空间描述格式。音频流 (一般包括通道和对象）连同包括音频流的期望位置的描述内容创建者或声音混合器的意图的元数据一起被传输。可以将位置表达为命名通道（从预先定义的通道配置内）或者表达为3D空间位置信息。实施例还可以涉及用于呈现包括反射声音和直接声音的自适应音频内容的系统及方法，自适应音频内容要通过扬声器或包含直接（前射式）驱动器和反射 (上射式或侧射式）驱动器的驱动器阵列被播放。
[0011] 援引并入
[0012] 本说明书中提到的每个公开、专利和/或专利申请在此通过引用将其全部内容合并到本文中，就如同具体且单独指出每个单独的公开和/或专利申请通过引用合并到本文中一样。
【附图说明】
[0013] 在下面的附图中，相同的附图标记用来指代相同的要素。尽管下面的图描绘了各种示例，但是一个或更多实现不限于图中所描绘的示例。
[0014] 图1例示提供用于高通道的播放的高扬声器的环绕系统（例如，9. 1环绕）中的示例扬声器放置。
[0015] 图2例示根据实施例的产生自适应音频混合的基于通道的数据和基于对象的数据的组合。
[0016] 图3是根据实施例的用于自适应音频系统的播放体系结构的框图。
[0017] 图4A是例示根据实施例的用于使基于电影的音频内容适用于消费者环境的功能部件的框图。
[0018] 图4B是根据实施例的图3A的部件的详细框图。
[0019] 图4C是根据实施例的基于消费者的自适应音频环境的功能部件的框图。
[0020] 图4D例示根据实施例的在扬声器单元中执行部分呈现功能的分布式呈现系统。
[0021] 图5例示示例家庭影院环境中的自适应音频系统的部署。
[0022] 图6例示使用反射声音来模拟家庭影院中的头顶扬声器的上射式驱动器的使用。
[0023] 图7A例示根据实施例的具有多个在具有反射声音呈现器的自适应音频系统中使用的第一配置下的驱动器的扬声器。
[0024] 图7B例示根据实施例的具有分布于在具有反射声音呈现器的自适应音频系统中使用的多个箱中的驱动器的扬声器系统。
[0025] 图7C例示根据实施例的在使用反射声音呈现器的自适应音频系统中使用的条形箱的示例配置。
[0026] 图8例示具有包括听音空间内放置的上射式驱动器的可独立寻址驱动器的扬声器的示例放置。
[0027] 图9A例示根据实施例的对于反射音频利用多个可寻址驱动器的自适应音频5. 1 系统的扬声器配置。
[0028] 图9B例示根据实施例的对于反射音频利用多个可寻址驱动器的自适应音频7. 1 系统的扬声器配置。
[0029] 图IOA是例示根据实施例的双向互连的构成的图。
[0030] 图IOB是例示根据实施例的单向互连的构成的图。
[0031] 图11例示根据实施例的在自适应音频系统使用的自动配置和系统校准处理。
[0032] 图12是例示根据实施例的在自适应音频系统中使用的校准方法的处理步骤的流程图。
[0033] 图13例示自适应音频系统在示例电视和条形箱消费者使用情况中的使用。
[0034] 图14例示根据实施例的自适应音频系统中的三维双耳耳机虚拟化的简化表示。
[0035] 图15是例示根据实施例的在针对消费者环境利用反射声音呈现器的自适应音频系统中使用的某些元数据定义的表格。
【具体实施方式】
[0036] 描述了用于基于对象的呈现器和可独立寻址扬声器驱动器阵列之间的互连的系统及方法。该互连支持音频信号和控制信号到驱动器的传输以及音频信息从听音环境到呈现器的传输。呈现器包括或被耦接至以下校准单元：该校准单元针对呈现器和驱动器的自动配置和校准来处理关于听音环境的声学信息。驱动器阵列可以包括以下驱动器：驱动器被配置并且被定向为将声波直接传播到位置或者使声波被一个或更多表面反射，或者使声波在听音区域中扩散。可以在以下音频或视听系统中实现本文中所描述的一个或更多实施例的方面：该音频或视听系统对包括执行软件指令的一个或更多计算机或处理装置的混合、呈现和播放系统中的源音频信息进行处理。任何描述的实施例可以被单独使用或者以任意组合彼此一起被使用。虽然由在本说明书中的一个或更多地方讨论或提到的现有技术的各种缺点推动了各种实施例，但是实施例不必陈述所有这些缺点。换言之，不同的实施例可以陈述在说明书中可以讨论的不同的缺点。一些实施例可以仅部分陈述在本说明书中可以讨论的一些缺点或仅一个缺点，而一些实施例可以不陈述这些缺点中的任何一个。
[0037] 出于描述的目的，下面的术语具有相关的含义：术语"通道"指其中位置被编码为通道标识符例如左前环绕或右上环绕的音频信号加元数据；"基于通道的音频"是为了通过预先定义的具有相关的标称位置的一组扬声器区域来播放而格式化的音频，例如5. 1、7. 1 等；术语"对象"或"基于对象的音频"指具有诸如明显源位置（例如，3D坐标）、明显源宽度等的参数源描述的一个或更多音频通道；"自适应音频"指基于通道的音频信号和/或基于对象的音频信号加元数据，元数据基于使用位置被编码为空间中的3D位置的音频流加元数据的播放环境呈现音频信号；以及"听音环境"指任何开放的、部分封闭或全封闭的区域，诸如可以用于单独播放音频内容或者与视频或其它内容一起播放音频内容的空间，并且"听音环境"可以在家庭、电影院、剧院、礼堂、工作室、游戏控制台等中被实现。这种区域可以具有一个或更多置于其中的表面，例如可以直接反射声波或扩散地反射声波的墙或挡板。
[0038] 自话应音频格式和系统
[0039] 在实施例中，互连系统被实现为被配置为与可以被称为"空间音频系统"或"自适应音频系统"的声音格式和处理系统一起工作的音频系统的一部分。这种系统基于音频格式和呈现技术以允许增强的听众沉浸、更强的艺术控制以及系统灵活性和可伸缩性。通常，整个自适应音频系统包括音频编码、分配和解码系统，其被配置为生成包含常规的基于通道的音频元素和音频对象编码元素的一个或更多比特流。与单独采用基于通道或基于对象的方法相比，这种组合方法提供了更高的编码效率和呈现灵活性。在于2012年4月20日提交的题目为"SystemandMethodforAdaptiveAudioSignalGeneration,Codingand Rendering"的未决美国临时专利申请61/636, 429中描述了可以结合本实施例使用的自适应音频系统的示例，该申请在此通过引用被合并到本文中。
[0040] 自适应音频系统和相关的音频格式的示例实现是Dolby?Atmos?平台。这种系统包括可以被实现为9. 1环绕系统或类似环绕声配置的高度（上/下）维度。图1例示提供用于高度通道的播放的高度扬声器的环绕系统（例如，9.1环绕）中的扬声器放置。9.1 系统100的扬声器配置包括底平面中的5个扬声器102和高度平面中的4个扬声器104。通常，这些扬声器可以用于产生被设计成或多或少准确地从空间中的任意位置发出的声音。诸如图1中示出的那些预先定义的扬声器配置当然可以限制准确呈现给定声源的位置的能力。例如，不能比左扬声器本身更向左平移声源。这适用于每个扬声器，因此形成一维 (例如，左右）、两维（例如，前后）或三维（例如，左右、前后、上下）几何结构，在几何结构中下混合被限制。各种不同的扬声器配置和类型可以用于这种扬声器配置。例如，某些增强的音频系统可以使用9. 1、11. 1、13. 1、19.4或其它配置下的扬声器。扬声器类型可以包括全范围直接扬声器、扬声器阵列、环绕扬声器、超低音扬声器、高音扬声器和其它类型的扬声器。
[0041] 可以将音频对象视为可以被感知成从特定的物理位置或听音环境中的位置发出的声音元素的组。这种对象可以是静态的（即，静止的）或动态的（即，运动的）。可以通过定义给定时间点的声音的位置的元数据连同其它功能来控制音频对象。当播放对象时，使用现有的扬声器根据位置元数据来呈现对象，而不必将对象输出至预先定义的物理通道。会话中的轨迹可以是音频对象，并且标准的声像数据类似于位置元数据。以这种方式，屏幕上放置的内容可以以与基于通道的内容相同的方式有效地进行声像调节，但是如果期望，则环绕中放置的内容可以被呈现到单独的扬声器。当使用音频对象为离散效果提供期望的控制时，音轨的其它方面可以在基于通道的环境中有效工作。例如，很多环境效果或混响实际上受益于被馈送至扬声器阵列。虽然这些能够被视为具有足够宽度以填充阵列的对象，但是保持一些基于通道的功能是有益的。
[0042] 自适应音频系统被配置为：除音频对象以外还支持"音床"，其中音床是有效的基于通道的子混合或干。取决于内容创建者的意图，这些可以被传送以便单独地或被组合成单个音床来最终播放（呈现）。可以以不同的基于通道的配置诸如5. 1、7.1和9.1以及包括诸如图1中所示的头顶扬声器的阵列来创建这些音床。图2例示根据实施例的产生自适应音频混合的基于通道的数据和基于对象的数据的组合。如处理200中所示，例如可以是以脉冲编码调制（PCM)数据的形式提供的5. 1或7. 1环绕声数据的基于通道的数据202与音频对象数据204组合以产生自适应音频混合208。可以通过将原始的基于通道的数据的元素与指定关于音频对象的位置的某些参数的相关的元数据进行组合来生成音频对象数据204。如图2中在概念上示出的，创作工具提供创建同时包括扬声器通道组和对象通道的组合的音频节目的能力。例如，音频节目可以包括一个或更多优选地组织成组（或音轨，例如立体声或5. 1音轨）的扬声器通道、关于一个或更多扬声器通道的描述性元数据、一个或更多对象通道以及关于一个或更多对象通道的描述性元数据。
[0043] 自适应音频系统有效地超越简单的"扬声器馈送"而作为用于分配空间音频的方法，并且已经开发了使得听者能够自由选择适合听者的个人需求或预算的播放配置并且具有针对听者个人所选的配置具体呈现的音频的高级基于模型的音频描述。在高的级中，存在四种主要的空间音频描述格式：（1)扬声器馈送，其中，音频被描述为针对位于标称扬声器位置的扬声器所计划的信号；(2)麦克风馈送，其中，音频被描述为由预先定义的配置 (麦克风的数量及其相对位置）下的实际麦克风或虚拟麦克风捕获的信号；(3)基于模型的描述，其中，根据在所描述的时间和位置的音频事件的顺序来描述音频；以及（4)双耳的，其中，通过到达听者的两耳的信号来描述音频。
[0044] 通常，这四种描述格式与下列普通呈现技术相关，其中，术语"呈现"表示到用作扬声器馈送的电信号的转换：（1)声像调节，其中，使用一组声像调节法则和已知或假定的扬声

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：斯宾塞·S·胡克斯;约舒亚·布兰东·兰多;斯里巴拉·S·梅赫塔;马修·费勒斯;斯图尔特·默里;布拉德·巴斯勒;
技术所有人：杜比实验室特许公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。