具有位置信息的有效传输的多通道编码器和解码器的制造方法

文档序号:8927069阅读:632来源:国知局
具有位置信息的有效传输的多通道编码器和解码器的制造方法
【技术领域】
[0001] 本发明涉及位置信息的通信,并且尤其但不完全涉及用于音频处理应用的位置数 据的通信。
【背景技术】
[0002] 随着数字信号表示和通信已日益取代模拟表示和通信,各种各样源信号的数字编 码在过去数十年已变得越来越重要。例如,诸如语音和音乐之类的音频内容越来越多地以 数字内容编码为基础。此外,随着例如环绕立体声和家庭影院设置成为流行,音频消费已日 益成为一种包络(enveloping)三维体验。
[0003] 已研制音频编码格式来提供日益有能力的、多样的和灵活的音频服务,并且尤其 已研制支持空间音频服务的音频编码格式。
[0004] 如同DTS和Dolby Digital之类的众所周知的音频编码技术产生编码的多通道音 频信号,其将空间图像表示为围绕着收听者被放置在固定位置上的许多通道。对于与对应 于多通道信号的设置不同的扬声器设置来说,空间图像将是次最优的。并且,基于通道的音 频编码系统通常不能应付不同数量的扬声器。
[0005] (MPEG-D) MPEG Surround (环绕)提供一种多通道音频编码工具,其允许现有的基 于单声道或基于立体声的编码器被扩展至多通道音频应用。图1举例说明MPEG Surround 系统的元素的示例。使用通过原始的多通道输入的分析而获得的空间参数,MPEG Surround 解码器通过单声道或立体声信号的受控上混(upmix)以获得多通道输出信号而能够重新创 建空间图像。
[0006] 由于多通道输入信号的空间图像被参数化,所以MPEG Surround允许利用不使用 多通道扬声器设置的渲染设备来解码同一个多通道比特流。示例是在耳机上的虚拟环绕立 体声再现,其被称为MPEG Surround双耳解码处理。在这种模式中,在使用普通耳机的同时 能够提供逼真的环绕立体声体验。另一示例是较高阶多通道输出例如7. 1通道至较低阶设 置例如5. 1通道的修剪(pruning)。
[0007] 实际上,随着越来越多的再现格式变得可用于主流消费者,用于渲染空间声音的 渲染配置的变化和灵活性近年来已显著增加。这要求音频的灵活表示。随着MPEG Surround 编解码器的引入,已采取重要的步骤。然而,仍然针对特定的扬声器设置来产生和发送音 频。没有规定通过不同的设置和通过非标准(即,灵活的或用户定义的)扬声器设置的再现。 实际上,具有使得音频编码和表示日益独立于特定的预定的和标称的扬声器设置的愿望。 日益优选的是:能够在解码器/渲染侧上执行针对多种多样的不同的扬声器设置的灵活适 配(adaptation)。
[0008] 为了提供更灵活的音频的表示,MPEG标准化了称为"Spatial Audio Object Coding (空间音频对象编码)"(MPEG-D SA0C)的格式。与诸如DTS、Dolby Digital和MPEG Surround之类的多通道音频编码系统形成对比,SA0C提供个别音频对象而非音频通道的 有效编码。借助于渲染矩阵,个别声音对象被映射到扬声器通道上。而在MPEG Surround 中,每一个扬声器通道能够被视为源自声音对象的不同混合,SAOC使得在解码器侧上可利 用的个别声音对象用于如图2所示的交互操纵。在SA0C中,多个声音对象和参数化数据一 起被编码到单声道或立体声缩混(downmix)中,其中参数化数据允许声音对象在植染侧上 被提取,从而允许个别音频对象可用于例如由终端用户进行的操纵。
[0009] 实际上,与MPEG Surround相类似,SA0C也创建单声道或立体声缩混。另外,计算 和包括对象参数。在解码器侧上,用户可以操纵这些参数来控制个别对象的各种各样特征 诸如位置、水平、均衡乃至应用诸如混响之类的效果。图3举例说明使得用户能够控制在 SA0C比特流中包含的个别对象的交互界面。
[0010] 通过发送音频对象而非仅仅再现通道,SA0C允许更灵活的方案并且尤其允许更多 的基于渲染的适应性(adaptability)。假定空间被扬声器充分覆盖,则这允许解码器侧将 音频对象放置在空间中的任意位置上。这样,在所发送的音频与再现或渲染设置之间没有 关系,因此能够使用任意的扬声器设置。这对于例如其中扬声器几乎从不位于预定位置上 的典型起居室中的家庭影院设置而言是有利的。在SA0C中,在解码器侧上决定在声音场景 中这些对象被放置在什么地方,这从艺术的角度来看时常不是所希望的。SA0C标准确实提 供在比特流中发送默认渲染矩阵的方式,这消除解码器责任。然而,所提供的方法依赖于或 固定的再现设置或依赖于未指明的语法。因而,SA0C没有提供规范的手段来完全发送音频 场景而与扬声器设置无关。并且,SA0C不太适合于(not well equipped)弥散性信号分量 的忠实植染。虽然具有包括所谓的多通道背景对象(multichannel background object)来 捕获漫声的可能性,但是这个对象被束缚于一个特定的扬声器配置,例如,诸如5. 1环绕扬 声器设置。
[0011] 由3D Audio Alliance (音频联盟)(3DAA)正在研制用于3D音频的音频格式的 另一规范,其中3DAA是工业联盟。3DAA致力于研制"将有助于从当前的扬声器馈送范例至 灵活的基于对象的方案的转变"的用于3D音频的传输的标准。在3DAA中,将定义允许将传 统的多通道缩混连同个别声音对象一起传输的比特流格式。另外,包括对象定位数据。在 图4中举例说明生成3DAA音频流的原理。
[0012] 在3DAA方案中,单独地在扩展流中接收声音对象,并且可以从多通道缩混中提取 这些声音对象。由此产生的多声道缩混与个别可用的对象一起进行渲染。
[0013] 这些对象可以由所谓的词干(stem)构成。这些词干基本上是分组(缩混)的轨道 (track)或对象。因此,对象可以由包装在词干中的多个子对象构成。在3DAA中,利用音 频对象的选择,能够发送多通道参考混合(reference mix)。3DAA针对每一个对象发送3D 位置数据。这些对象随后能够使用3D位置数据来提取。可供选择地,可以发送逆的混合矩 阵,其描述这些对象与参考混合之间的关系。
[0014] 根据3DAA的描述,通过给每一个对象分配角度和距离,很可能发送声音场景信 息,其表明:相对于例如默认的前进方向应该将该对象放置在什么地方。因而,针对每一个 对象,发送位置信息。这对于点源来说是有用的,但是其无法描述广源(wide source)(例 如,如同合唱或欢呼)或弥漫性声场(诸如周围环境)。当从参考混合中提取所有的点源时, 周围的多声道混合保留。与SA0C相类似,3DAA中的残留物(residual)被固定于特定的扬 声器设置。
[0015] 因而,SA0C和3DAA方案二者并入能够在解码器侧上个别操纵的个别音频对象的 传输。这两种方案之间的不同在于:SAOC通过相对于缩混提供表征音频对象的参数来提供 有关这些音频对象的信息(即,以致在解码器侧上根据缩混来生成这些音频对象),而3DAA 提供音频对象作为完整的且独立的音频对象(即,能够在解码器侧上独立于缩混来生成这 些音频对象)。对于两种方案,可以针对这些音频对象来传送位置数据。
[0016] 传统的和新的用于音频编码和分发的方案之间的显著差异在于:传统的方案固有 地假设特定的扬声器配置。因而,对于这些方案来说,每一个扬声器的位置是(被假设为)已 知的。此外,音频作为针对个别扬声器的音频信号而被编码并被分发,并因而生成将从已知 的渲染位置渲染的音频信号,并且以致当从这些位置渲染这些信号时,由此产生的声音将 产生声源位于所希望位置上的空间感知。作为这个方案的结果,只需要传送针对个别扬声 器的音频信号,并且不需要位置信息。
[0017] 然而,对于较新的方案来说,不能进行这样的假设,并相应地要求或希望也传送位 置数据。
[0018] 例如,与音频对象的所希望或所建议的位置相关的位置信息应该被传送。作为 另一示例,可取的可能是将要传送所希望的扬声器位置(或,例如,捕获信号的麦克风的位 置),以致渲染器能够在根据在编码的时间未知的给定渲染配置生成空间声音场景时考虑 这样的位置。另一示例是:当提供对于双耳虚拟声音渲染的支持时,诸如当使用HRTF处理 来经由耳机渲染空间音频时。在这个案例中,可以传送位置信息,以便双耳渲染器选择与所 希望的位置相对应的恰当的HRTF滤波器。
[0019] 然而,位置数据的通信对于音频信息的通信引入开销,并且具体地导致比其他情 况更高的数据率。可取的是尽可能减少这个开销,并因而希望位置数据的有效表示和通信。
[0020] 因此,改善的方案将是有利的,并且特别地允许位置信息的改善的表示与通信、降 低的数据率、减少的开销、便利的实现和/或改善的性能的方案将是有利的。

【发明内容】

[0021] 相应地,本发明寻求优选地、单个地或以任何组合来减轻、缓解或消除上述缺点之 中的一个或多个。
[0022] 根据本发明的一方面,提供一种用于传送位置的设备,该设备包括:用于接收位置 的接收机,该位置具有至少第一值和第二值,第一值表示第一位置参数,并且第二值表示第 二位置参数;匹配电路,用于确定第二值是否与用于第二位置参数的标称值相匹配;用于 生成输出数据的输出电路,该输出电路被安排成:当第二值与标称值相匹配时,在输出数据 的第一字段中包括表示第一值的第一数据但是在输出数据中不包括表示第二值的数据;以 及当第二值与标称值不匹配时,在第一字段中包括第二数据,第二数据表示用于第一位置 参数的无效位置值。
[0023] 本发明可以允许改善的位置的通信。特别地,一个或多个位置可以利用减少的开 销来传送。在许多实施例和情形中可以降低为了传送音频数据和相关联的位置信息所需的 数据率。这在许多实施例中可以实现而不限制能够传送的位置的范围。
[0024] 该方案基于发明人的认识,即通过允许位置有时利用比用于描述位置的参数的数 量更少的值来表明,能够实现有利地在许多情形中改善的位置的表示和通信。例如,三维位 置可以利用单个值或两个值来表示。这可以通过对于至少一个分量使用标称值来实现。这 些标称值在发射机上和在接收机上都可以是已知的。然而,该方案还虑及能够传送的位置 不限于只在一个参数方面变化的位置。相反,数据字段的数据能够动态地变化,以便在对于 至少一个其他位置参数假设标称值的情况下表示第一位置参数的值或表示这些标称值不 能用于这个其他位置参数的指示。具体地,第一数据字段能够包括指示第一位置参数的值 的数据或能够表明第二通信参数具有标称值的假设是否是有效的。
[0025]该方案可以允许低复杂度的语法用于表示。它可
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1