基于可变数量的接收通道的用于多通道音频呈现的平滑配置切换的制作方法

文档序号:2827170阅读:173来源:国知局
基于可变数量的接收通道的用于多通道音频呈现的平滑配置切换的制作方法
【专利摘要】解码系统基于输入信号重构n通道音频信号,所述输入信号通过参数译码表示音频信号或者将音频信号表示为n个离散译码通道。参数解码使用控制空间合成级的混合参数以及核心信号,所述空间合成级被从下混级供给下混信号。下混级基于n通道输入信号实现在下混信号上的投影,该n通道输入信号为离散译码信号或填充了中性值通道的核心信号。填充可在解码侧(缩减参数译码)或编码侧进行。在一个实施例中,解码系统中的音频解码器(110)在紧接在离散译码时间帧后面的每个缩减参数译码时间帧的起始部分期间以及在紧接在离散译码时间帧前面的每个缩减参数译码时间帧的最终部分期间填充核心信号。
【专利说明】基于可变数量的接收通道的用于多通道音频呈现的平滑配 置切换

【技术领域】
[0001] 本文中所公开的本发明总地涉及视听媒体发布。具体地讲,本发明涉及一种使得 能够在解码期间实现高比特率模式和低比特率模式两者以及无缝模式转变的自适应发布 格式。本发明还涉及用于根据发布格式对信号进行编码和解码的方法和装置。

【背景技术】
[0002] 就收听质量而言,参数立体声和多通道译码方法已知是可伸缩的并且有效率的, 这使得它们在低比特率应用中特别有吸引力。然而,在比特率限制是瞬变的性质(例如,网 络抖动、载荷变化)的情况下,可以通过使用自适应发布格式来获得可供使用的网络资源 的充分益处,其中,在正常状况下使用相对高的比特率,当网络运行不良时,使用较低的比 特率。现有的自适应发布格式和相关联的译码(coding/码化)(解码)技术可以从它们的 带宽效率、计算效率、差错恢复、算法延迟的角度来进行改进,并且进一步,在视听媒体发布 中就比特率切换事件对于享用解码的媒体的人的明显程度来进行改进。

【专利附图】

【附图说明】
[0003] 现在将参照附图来描述本发明的实施例,其中:
[0004] 图1是根据本发明的示例实施例的解码系统的总体框图;
[0005] 图2类似于图1,示出根据本发明的示例实施例的编码系统;
[0006] 图3例示位于编码器和解码器侧的下混级的机能;
[0007] 图4示出用于部署在解码系统中的根据示例实施例的上混级的细节;
[0008] 图5示出用于部署在解码系统中的根据示例实施例的空间合成级的细节;
[0009] 图6例示在配备有图5的空间合成级的示例解码系统中出现的数据信号和控制信 号;
[0010] 图7示出用于部署在解码系统中的根据示例实施例的空间合成级的细节;
[0011] 图8例示在配备有图7的空间合成级的示例解码系统中出现的数据信号和控制信 号;
[0012] 图9示出根据本发明的示例实施例的将信息发送到解码器装置的编码系统;
[0013] 图10例示在配备有图5的空间合成级的示例解码系统中出现的数据信号和控制 信号;
[0014] 图11是根据本发明的示例实施例的解码系统的总体框图;和
[0015] 图12示出用于部署在解码系统中的根据示例实施例的音频解码器的细节。
[0016] 所有的附图都是示意性的,并且仅从大体上示出了为了阐明本发明而必需的部 分,而其他部分则可以被略去或者仅仅被建议。除非另有指示,否则相似的标号在不同图中 指示相似的部分。

【具体实施方式】[0017]I.概沭
[0018] 如本文中所使用的,音频信号可以是纯音频信号、视听信号或多媒体信号的音频 部分、或者与元数据组合的这些信号中的任何一个。
[0019] 在本发明的第一方面内,示例性实施例提出了使得能够以改进的比特率选择能力 和/或减小的延迟来自适应地发布媒体内容(诸如音频或视频内容)的方法和装置。示例 实施例还提供了适合于这样的自适应媒体发布的译码格式,所述译码格式有助于比特率之 间的无缝转变。
[0020] 本发明的示例实施例提供具有独立权利要求中所阐述的特征的编码方法、编码系 统、解码方法、解码系统、音频发布系统和计算机程序产品。
[0021] 解码系统适于基于输入信号重构音频信号,所述输入信号可以直接提供给解码系 统,或者可替代地可以被用解码系统所接收的比特流进行编码。输入信号被分割为与音频 信号的(重叠的或相连的)时间段相应的时间巾贞。输入信号的一个时间巾贞根据译码机制表 示音频信号的时间段,所述译码机制选自包括参数译码和离散译码的一组译码机制。特别 地,如果编码的音频信号是η通道信号,则输入信号在所接收的它被离散译码的帧中(至 少)包含相等数量的通道,即,在离散译码机制中,η个离散编码的通道被用于表示音频信 号。在参数译码的所接收的帧中,输入信号包括比η个通道少的通道(但是它可以是η通 道格式,其中一些通道不被使用),但是可以另外包括元数据,诸如在编码处理期间例如通 过计算信号能量值或相关系数从音频信号推导的至少一个混合参数。可替代地,所述至少 一个混合参数可以通过不同的通信路径(例如,经由与承载输入信号的比特流分离的元数 据比特流)被供给解码系统。如所指出的,输入信号可以处于至少两种不同的机制(即,参 数译码或离散译码),解码系统通过转变到--或者保持处于--参数模式或离散模式来 对这些机制做出反应。系统的转变可以具有有限的持续时间,使得解码系统只有在一个或 多个时间帧过去之后才进入输入信号的当前译码机制所引起的模式。因此,在操作中,解码 系统的模式可能落后于输入信号的机制与一个或多个时间帧相应的时段。参数译码时间帧 集合(印isode)是指全都通过参数译码表示音频信号的一个或多个连续时间帧的序列。类 似地,离散译码时间帧集合是具有η个离散译码通道的一个或多个连续时间帧的序列。如 本文中所使用的,解码系统在如下这样的那些时间帧中处于参数模式,在那些时间帧中,解 码系统输出对于帧持续时间的更大部分是通过空间合成而生成的(不管底层数据的来源 如何);离散模式是指在其中解码系统不处于参数模式的任何时间帧。
[0022] 解码系统包括下混级,所述下混级适于基于输入信号输出m通道下混信 号。优选地,解码系统接受控制下混操作的定量和/或定性方面的下混规范(downmix specification),例如,下混级所形成的将在任何线性组合中施加的增益。优选地,下混规范 是可被从数据通信或存储介质提供给至少一个进一步的下混级的数据结构,所述进一步的 下混级例如是将输入信号或者对输入信号进行编码的比特流提供给解码系统的编码器中 的具有类似的或不同的结构特性的下混级。这样,可以确保这些下混级在功能上是等同的, 例如,它们响应于相同的输入信号提供相同的下混信号。下混规范的加载可以相当于部署 之后下混级的重新配置,但是可替代地可以在其制造、初始编程、安装、部署等期间执行。下 混规范可以用输入信号的特定形式或格式(包括一种格式中的通道的位置或编号)来表 达。可替代地,它可以从语义上来表达(包括通道的几何意义,而不管其相对于格式的位置 如何)。优选地,下混规范与输入信号的当前形式或格式和/或输入信号的机制无关地制 定,从而下混操作可越过输入信号格式改变继续进行,而不中断。
[0023] 解码系统还包括空间合成级,所述空间合成级适于接收下混信号,并且输出音频 信号的η通道表示。空间合成级由于其算法延迟的原因与非零通过时间相关联;本发明的 基础问题之一是尽管存在该延迟,但是仍然实现平滑切换。音频信号的η通道表示可以作 为解码系统输出而输出;可替代地,它经受了以更忠实地和/或以更少的伪像和差错重构 音频信号为总体目标的附加的处理。空间合成级接受控制空间合成操作的定量和/或定性 方面的至少一个混合参数。原则上,空间合成级至少在参数模式下(例如,当下混信号可供 使用时)工作(active)。在离散模式下,解码系统通过对η个离散编码的通道中的每个进 行解码来从输入信号推导输出信号。
[0024] 根据这个示例实施例,下混级至少在每个离散译码时间帧集合中的第一时间帧中 (例如,在整个帧内)以及至少在每个离散译码时间帧集合之后的第一时间帧中(例如,在 整个帧内)工作。这意味着,输入信号一从离散译码转变为参数译码,m通道下混信号就可 以可供使用。因此,空间合成级可以在较短的时间内启动,即使它包括与固有的非零算法延 迟相关联的处理(例如,时频变换、实复转换和/或混合分析滤波)仍如此。此外,音频信 号的η通道表示在从参数模式到离散模式的整个转变中可以保持可供使用,并且可以用于 使这样的转变更快速和/或更不明显。
[0025] 如本文中所使用的,时间帧(或帧)是输入信号的对于其译码机制可被控制的最 小单元。优选地,输入信号的非空通道通过加窗的变换而获得。例如,如MDCT中那样,每个 变换窗口可以与样本相关联,并且连续变换窗口可以重叠。明确的是,如果连续窗口重叠 50%,则时间帧的长度不小于变换窗口的一半长度(例如,512样本的变换窗口的一半长度 等于256个样本),该长度于是等于变换步幅。因为可以使切换事件更少地被享用解码的音 频的人感知到,所以这个示例实施例不需要限制操作期间的切换事件的数量,而是可以专 心地对网络状况的变化做出响应。这使得可供使用的网络资源可以被更充分地利用。减小 的解码系统延迟可以增强媒体的保真度,在实时媒体流传输中尤其如此。
[0026] 为了本公开的目的,下混级在时间帧中工作意味着下混级至少在该时间帧的子集 期间工作。下混级可以在整个帧内/期间或者仅在时间帧的子集(诸如帧的起始部分)期 间工作。起始部分可以对应于帧长度的1/2、1/3、1/4、1/6 ;起始部分可以对应于变换步幅; 可替代地,起始部分可以对应于Τ/ρ,其中,T是帧长度,ρ是在每个帧内开始的变换窗口的 数量。输入信号中的译码机制之间的转变典型地涉及在时间帧开始时(例如,在时间帧的 前1/6期间或者在1536个时间米样之中的256个时间米样期间)、在前一时间巾贞的译码与 当前时间帧的译码之间(例如,作为当将输入信号从频域格式变换到时域时使用重叠变换 窗口的结果,在频域格式中,输入信号可以从比特流获得)的交错淡变。下混级优选地可以 至少在紧接在输入信号转变为离散译码或者输入信号从离散译码转变之后的时间帧的起 始部分期间工作。这使得下混信号在输入信号中的交错淡变期间可供使用,由此空间合成 级可以对于与输入信号中的交错淡变相关联的时间帧的部分输出音频信号的η通道表示。 关于输入信号的当前机制(例如,参数译码或离散译码)的信息可以与输入信号一起(例 如,其中包含输入信号的比特流中的某一位置处的比特)被接收。例如,在参数译码期间, 关于空间参数的信息可以在比特流的某些位置处被找到,而在离散译码期间,这些位置/ 比特不被使用。通过检查这样的比特在它们的预期位置的存在与否,解码系统可以确定输 入信号的当前译码机制。
[0027] 在前面的示例实施例的进一步发展中,输入信号的时间段可以通过译码机制来表 示音频信号的时间段,所述译码机制选自包括参数译码、离散译码和缩减(reduced)参数 译码的一组译码机制。因此,在进一步的发展中,存在另外的被称为缩减参数译码的译码机 制,在所述缩减参数译码中,输入信号是m通道核心信号(可以伴随有混合参数和其他元数 据)。该核心信号可以通过根据下混规范进行下混从表示相同的音频信号(即,表示与第一 次提及的音频信号相同的音频信号)的假定离散η通道输入信号获得。相反,基于离散译 码时间帧中的输入信号,下混规范使得能够确定在缩减参数译码已经用于在这些帧内表示 相同的音频信号的情况下核心信号将会是什么。
[0028] 在输入信号通过缩减参数译码表示音频信号的帧中,可能不需要执行任何下混。 实际上,输入信号是m通道核心信号,在它被发送到空间合成级之前,不需要进行下混。因 此,空间合成级优选地可以直接接收输入信号,或者输入信号可以在到达空间合成级之前 不受影响地通过下混级。在输入信号通过缩减参数译码表示音频信号的帧中,空间合成级 因此可以基于输入信号和至少一个混合参数输出音频信号的η通道表示。当接收到缩减参 数译码时间帧时停用下混级(或者使它置于空闲/被动/休息模式)可以节省能量,由此 例如便携式装置中的电池时间可以得以延长。
[0029] 在示例实施例中,下混级在其中输入信号通过参数译码表示音频信号的每个时间 帧中工作。在仅存在两种译码机制(参数和离散)的例子中,这意味着,下混级至少在所有 的不被离散译码的帧中工作。在存在另外的可供使用的译码机制(诸如缩减参数译码)的 例子中,下混级在不被离散译码的时间帧中还可以不工作/被停用/空闲。这可以节省能 量和/或延长电池时间。
[0030] 在示例实施例中,解码系统适于接收输入信号,所述输入信号在参数译码时间帧 期间还包括m通道核心信号(除了任何混合参数和其他元数据之外)。核心信号可以通过 根据下混规范进行下混从表示相同的音频信号(即,表示与第一次提及的音频信号相同的 音频信号)的假定离散η通道输入信号获得。相反,基于离散译码时间帧中的输入信号,下 混规范使得能够确定在参数译码已经被用于在那些帧中表示相同的音频信号的情况下核 心信号将会是什么。
[0031] 然而,因为下混级在输入信号可能不包含核心信号的至少一些离散译码时间帧 (诸如,离散译码时间帧集合中的第一时间帧)中工作,所以解码系统将能够预测在这些离 散译码时间帧内该核心信号将会是什么。因此,即使在原则上核心信号和离散译码通道可 能不能共存,输入信号中的与(参数译码或缩减参数译码与离散译码之间的)机制改变相 关的任何间断也可以一起被减轻或避免。
[0032] 在前面的示例实施例的进一步发展中,下混级适于通过再现输入信号中的核心信 号(如果该核心信号可供使用)来产生下混信号。换句话说,下混级适于尤其通过拷贝或 转发核心信号来对参数译码时间帧的接收做出响应,以使得下混级将核心信号作为下混信 号输出。换句话说,如果下混信号中的m通道被认为是η通道输入信号的空间的子空间,则 下混级是该子空间上的投影。特别地,存在输入信号的如下m通道子集,下混级将所述m通 道子集相同地映射到下混信号中的各m个通道。这可以在下混规范中被规定。对于离散译 码时间帧,基于输入信号并且根据下混规范来产生下混信号。如以上所讨论的,下混规范定 义了输入信号中的η个离散译码通道与核心信号之间的关系。这意味着,输入信号中的机 制改变本身不能引起间断;也就是说,如果音频信号跨越模式改变是连续的,则下混级输出 将保持为连续的,并且基本上不会中断。
[0033] 在可以实现为以上所概述的示例实施例的替代方案或者这些示例实施例的进一 步发展的示例实施例中,解码系统适于接收如下比特流,所述比特流以在参数译码机制和 离散译码机制两者中都可适用的格式对输入信号进行编码。为了适应η个离散译码通道, 所接收的比特流以包括η个通道或更多个通道的格式对输入信号进行编码。因此,参数译 码机制中的时间帧可以包含例如n-m个未被使用的通道。为了保持参数译码机制中的格式 的均一 1丨生,未被使用的通道存在,但是被设为与无激励相应的中性值(neutral value),例 如,零序列。发明人认识到,解码器产品可包含其设计不意图部署在其中格式改变可能频繁 的自适应媒体发布设备中的老式组件或通用组件(例如,硬件、算法、软件库)。这样的组件 可以通过停用它们自己或者使它们自己部分断电来对检测到变为低比特率格式做出响应。 当这些组件回到正常操作时,这可能由于与格式改变相关的间断而阻止比特率之间的平滑 转变或者使得平滑转变更难以实现。当诸如与具有重叠窗口函数的变换有关地,来自不同 译码机制的帧的贡献被累计时,也可能引起困难。在本示例实施例中,因为均一格式被用于 输入格式,所以解码系统中的具有这些特性的组件将典型地保持基本上不受从参数译码机 制到离散译码机制的转变的影响,反之亦然。以上适用于所有的被离散译码或参数译码的 时间帧。在某些示例实施例中,输入信号可以作为替代在两个参数译码时间帧集合之间以m 通道格式(缩减参数译码机制)被提供,以便在没有模式转变即将发生或者正被执行时不 需要下混。可选地,在所有的不被离散译码的帧中可以使用m通道格式(即,缩减参数译码 机制),并且解码系统可选地可以适于至少在某些帧内将所接收的m通道格式重新格式化 为η通道格式。例如,在紧接在离散译码时间帧前面或后面的缩减参数译码帧中,可以通过 将n-m个中性通道附加到m通道格式来重新格式化缩减参数译码,以便获得上述在不同译 码机制之间的转变期间具有相同数量的通道的优点中的至少一些。优选地,均一格式容纳 混合参数和参数和/或离散模式中所使用的其他元数据。优选地,通过熵编码或类似的方 法来对输入信号进行编码,以使得未被使用的通道仅将有限程度地增加所需的带宽。
[0034] 在示例实施例中,解码系统还包括第一延迟线和混合器。第一延迟线接收输入信 号,并且可操作为输出输入信号的延迟版本。可替代地,第一延迟线可以可操作为延迟输 入信号的经处理的版本,例如,在已经从输入信号推导η个通道之后,或者在拆包之后。第 一延迟线不需要在参数模式下(即,在其中通过空间合成生成解码系统输出的那些时间帧 中)工作(可能除了解码系统处于离散模式的时间帧序列中的起始时间帧之外),以便利于 模式转变。混合器连接到第一延迟线输出和空间合成级输出两者,并且充当这两个源之间 的选择器。在参数模式中,混合器输出空间合成级输出。在离散模式中,混合器输出第一延 迟线输出。当在输入信号中在离散译码机制与参数译码机制(或如上所述那样,在解码系 统适于将所接收的缩减参数译码时间帧重新格式化为η通道格式的情况下的缩减参数译 码机制)之间转变时,混合器执行这两个输出之间的混合转变。混合转变可以包括交错淡 变类型的操作或者已知不是显然可感知到的其他混合转变。混合转变可以占据从其发生模 式转变的时间帧或者时间帧的一小部分。第一延迟线的存在使得通过空间合成级提供的音 频信号的η通道表示可以保持与从输入信号基于η个离散编码通道推导的信号同步。这促 进了模式转变的平滑性。此外,因为不需要两个信号之间的初步对齐,混合器将能够以短的 等待时间在模式之间进行转变。特别地,第一延迟线可以被配置为使输入信号延迟与下混 级和空间合成级的总通过时间相应的时段。总通过时间可以是各个通过时间的和。然而, 如果采取了延迟减小措施,则总通过时间可能小于该和。指出,下混级的通过时间可以是非 零数字或者零,在下混级在时域中进行操作时尤其如此。
[0035] 在前面的实施例的进一步发展中,解码系统还包括在混合器下游的第二延迟线。 第二延迟线被配置为在参数模式和离散模式下类似地起作用(即,通过添加延迟,所述延 迟为时间帧持续时间与第一延迟线所引起的延迟之间的差值)。因此,解码系统的总通过 时间正好为一个时间帧。可替代地,第二延迟线所引起的延迟被选择为使得第一延迟线和 第二延迟线所引起的总延迟对应于一个时间帧的长度的倍数。这两种替代方案都简化了切 换。特别地,这简化了解码系统与连接实体之间的和切换相关的协作。
[0036] 在示例实施例中,空间合成级适于应用通过时间内插而获得的混合参数值。在参 数译码机制和缩减参数译码机制中,时间帧可以承载针对在给定时间帧中的参考点(或锚 点)被明确定义的一个混合参数(多个混合参数),所述参考点诸如为该时间帧的中间点 或终点(end)。基于所述明确定义的值,空间合成级通过连续的(相连的)时间帧中的各 个参考点之间的内插来推导用于中间时间点的中间混合参数值。换句话说,在两个连续的 (相连的)时间帧中的每一个承载混合参数值的情况下,例如,在这两个时间帧中的每一个 被参数译码或缩减参数译码的情况下,可以仅在这两个时间帧之间执行内插。在该设置中, 特别是如果参考点不是起始点,则空间合成级适于通过下述方式响应当前时间帧是在其中 每个时间帧被参数译码或缩减参数译码的时间帧集合中的第一时间帧(即,当前时间帧前 面的时间帧不承载混合参数值),即从当前时间帧中的参考点向后对混合参数值进行外插 直至当前时间帧的开始。空间合成级可以被配置为用常数值对混合参数进行外插。也就 是说,混合参数将被取为在帧开头具有它们的参考点值,将不变地保持该值(作为中间值) 直到参考点为止,并且然后将朝着后一时间帧中的参考点发起内插。优选地,外插可以伴随 有解码系统中的到参数模式的转变。空间合成单元可以在当前时间帧中被启动。在当前帧 和/或其后的帧期间,解码系统可以转变为使用从空间合成单元输出的音频信号的η通道 表示重构音频信号。在当前时间帧是离散译码时间帧集合中的第一时间帧时,空间合成级 可以适于从紧接在当前时间帧前面的时间帧中的参考点开始执行(混合参数值的)向前外 插。可以通过从最后一个参考点直到当前时间帧的终点为止保持混合参数值不变来实现向 前外插。可替代地,对于在当前时间帧之后的另一个时间帧,可以继续进行外插,以便适应 到离散模式的模式转变。因此,空间合成级可以将来自当前时间帧(或后一时间帧)的核 心信号与从一个时间帧(紧接在当前时间帧前面的时间帧)外插的混合参数值组合使用。 在当前帧之后的帧和/或其后的时间帧期间,解码系统优选地可以转变为基于输入信号中 所包含的η个离散编码通道推导音频信号。
[0037] 在示例实施例中,空间合成级包括对下混信号的频域表示进行操作的混合矩阵。 混合矩阵可以可操作为执行m到η上混。为此,空间合成级还包括在混合矩阵上游的时频 变换级以及在混合矩阵下游的频时变换级。附加地或者可替代地,混合矩阵被配置为通过 包括m个下混通道的线性组合来产生其η个输出通道。线性组合优选地可以包括下混通道 中的至少一些通道的去相关版本。混合矩阵接受混合参数,并且通过根据混合参数的值调 整线性组合中的与下混通道中的至少一个相关的至少一个增益来做出反应。所述至少一个 增益可以应用于下混信号的m通道频域表示中的通道中的一个或多个。混合参数值中的点 改变可以导致立即增益变化或渐变增益变化;例如,如以上所概述的,可以通过连续帧之间 的内插来实现渐变变化。指出,不管是对下混信号的时域表示还是频域表示执行上混操作, 都可以实现增益的可控性。
[0038] 在示例实施例中,下混级适于对输入信号的时域表示进行操作。更确切地说,为了 生成m通道下混信号,下混级被供给核心信号的时域表示或者η个离散编码信号。时域中 的下混是计算贫乏(computationally lean)的技术,在典型使用情况下这意味着下混级的 操作将使解码系统中的总计算载荷增加非常小的程度(与没有下混级的解码器相比)。如 已经描述的,下混的定量特性可以由下混规范控制。特别地,下混规范可以包括将施加的增 Mo
[0039] 在示例实施例中,如果在解码系统中提供空间合成级和混合器,则这样的空间合 成级和混合器由可以实现为例如有限状态机(FSM)的控制器控制。下混级可以独立于所述 控制器进行操作,或者当不需要下混时,例如,当输入信号被缩减参数译码时或者当输入信 号在当前时间帧和前一(或先前多个)时间帧中被离散译码时,下混级可以被所述控制器 停用。所述控制器(例如,有限状态机)可以是处理器,其状态由当前时间帧和前一时间帧 的以及可能地在所述前一时间帧之前的时间帧的译码类型/机制(参数、离散,并且如果缩 减参数可供使用,缩减参数)唯一地确定。如以下将看见的,所述控制器不需要包括堆栈、 隐式状态变量、或者存储除了出于能够实施本发明的目的的程序指令之外的任何内容的内 部存储器。这给予了简单性、透明性(例如,在验证和测试中)和/或鲁棒性。
[0040] 在示例实施例中,可以在每个时间帧中根据如下三种译码机制来表示音频信号 : 离散译码(D)、参数译码(P)和缩减参数译码(rP)。在目前的示例实施例(在该示例实施 例中,解码系统不适于将缩减参数译码时间帧重新格式化为η通道格式,而如上所述,这在 其他示例实施例中是可以的)中,可以避免以下的连续(相连)时间帧序列:
[0041] rP D 或 D rP,
[0042] 即,缩减参数译码时间帧不(紧接)在离散译码时间帧的后面或前面。换句话说, 离散译码时间帧后面为离散译码时间帧或参数译码时间帧,离散译码时间帧前面为离散译 码时间帧或参数译码时间帧。可替代地或者另外地,由于编码效率,以下连续(相连)时间 帧序列:
[0043] P rP P 和 P rP...rP P
[0044] 分别优于:
[0045] P P P 和 P P…P P
[0046]换句话说,紧随参数译码时间帧的每个时间帧优选地可以被缩减参数译码或离散 译码。例外情况可以是非常短的集合被接受的实现;在这样的情况下,可能不总是存在足以 进入缩减参数译码机制的时间,由此可能出现两个连续的参数译码时间帧。
[0047] 在上述的与根据不同机制译码的时间帧的次序相关的规则全都应用的示例实施 例中,输入信号中的时间帧序列典型地看起来像:
[0048] DDPDDDDPrPrPrPrPrPPDDDPDPDDDPrPPDD,
[0049] 其中,缩减参数译码(rP)总是分离离散译码(D)和参数(P)编码。要指出,如上 所述,上述示例实施例中的至少一些的编码系统可以适于接收连续帧(的编码机制)的其 他组合。
[0050] 在示例实施例中,在输入信号在当前时间帧中以及在紧接在当前时间帧前面的先 前两个时间帧中被离散译码的所有情况下,解码通过从输入信号推导η个离散编码通道来 进行。另外地,解码通过下述方式进行,即,在音频信号在当前时间帧内被参数译码或者当 前时间帧是离散译码时间帧集合中的第一时间帧的情况下,根据下混规范基于输入信号产 生m通道下混信号;在音频信号在当前帧中以及在先前两个帧中被参数译码的所有情况 下,基于下混信号产生音频信号的η通道表不。输入信号在当前时间巾贞和仅前一时间巾贞中 被参数译码(或缩减参数译码)的时间帧中的行为在不同示例实施例中可不同。可选地, 当音频信号在(紧接)该前一时间帧前面的时间帧中被参数译码时,还产生m通道下混信 号。
[0051] 在这个示例实施例的进一步发展中,接收输入信号(例如,通过对比特流进行解 码)(所述输入信号在给定时间帧中通过参数译码或缩减参数译码来表示音频信号)的步 骤包括接收对于所述给定时间帧中的非起始点的至少一个混合参数的值。如果当前时间帧 是时间巾贞集合(在该时间巾贞集合中,每个时间巾贞被参数译码或缩减参数译码)中的第一时 间帧,则对所接收的至少一个混合参数的值向后进行外插,直到当前时间帧的起点为止。另 外地,或者可替代地,参数译码时间帧之后的两个连续的离散译码时间帧(当前时间帧和 前一时间帧)的接收使解码系统进行参数解码(即,基于下混信号产生音频信号的η通道 表示),不过这是基于与在所述前一时间帧前面的时间帧相关联的混合参数值的。因为不 存在可以形成向前内插的基础的紧接在后的时间帧,所以解码系统在整个当前帧内对最后 的明确的混合参数值向前进行外插。同时,例如,通过在帧的起始部分(例如,其持续时间 的1/3U/4或1/6,其长度已经在上面进行了讨论)执行交叉混合,解码系统转变为离散解 码/模式。所述方法还可以包括以下步骤:响应于输入信号在当前时间帧和前一时间帧中 被参数译码并且在所述前一时间帧前面的时间帧中被离散译码,在当前时间帧期间转变为 基于下混信号和至少一个混合参数产生音频信号的η通道表不。
[0052] 在本发明的示例实施例中,编码系统适于对分割为时间帧的η通道音频信号进行 编码。编码系统适于输出比特流(P),所述比特流在给定时间帧中根据译码机制表示音频信 号,所述译码机制选自包含参数译码和使用η个离散编码通道的离散译码的组。编码系统 包括选择器,所述选择器适于对于给定时间帧选择哪个编码机制将用于表示音频信号。编 码系统还包括参数分析级,所述参数分析级可操作为基于音频信号的η通道表示并且根据 下混规范来输出在参数译码中将形成输出比特流的一部分的核心信号和至少一个混合参 数。在本示例实施例的进一步发展中,译码机制的组还包括缩减参数译码。在本实施例中, 参数译码使用具有η个信号通道的格式,离散译码也是如此。另一方面,缩减参数译码使用 具有m个信号通道的格式,其中,n>m> 1。
[0053] 在本发明的第二方面内,提供一种用于重构η通道音频信号的解码系统。解码系 统适于接收对输入信号进行编码的比特流。输入信号分割为时间帧,并且在给定时间帧中 根据译码机制表示音频信号,所述译码机制选自包含以下译码机制的组:使用η个离散编 码通道表示音频信号的离散译码;以及使用m通道核心信号和至少一个混合参数表示音频 信号的缩减参数译码,其中,n>m> 1。要指出,除了核心信号之外,缩减参数译码机制还可 以例如使用诸如至少一个混合参数的元数据来表示音频信号。
[0054] 本示例实施例的解码系统可操作为基于η个离散编码通道或者通过空间合成来 推导音频信号。解码系统包括音频解码器,所述音频解码器适于将它从比特流提取的输入 信号的频域表示变换为输入信号的时域表示。解码系统还包括下混级和空间合成级,所述 下混级可操作为根据下混规范基于输入信号的时域表示来输出m通道下混信号,所述空间 合成级可操作为基于下混信号和至少一个混合参数(例如,在同一比特流中被接收并且被 音频解码器提取,或者例如在某些其他比特流中被分离地接收)来输出音频信号的η通道 表不。
[0055] 在本示例实施例的缩减参数译码时间帧中,与输入信号的频域表示是η通道信号 的离散译码时间帧不同,输入信号的频域表示是m通道信号(即,核心信号)。音频解码器 可以适于在将输入信号的频域表示变换到时域之前,在与离散译码时间帧相邻的缩减参数 译码时间帧的至少部分中,对输入信号的频域表示进行重新格式化(也就是说,修改其格 式),以便使这些部分中的输入信号的频域表示(从而,还使时域表示)具有数量与离散译 码时间帧中的通道数量相同的通道。在离散译码与缩减参数译码之间转变期间具有恒定 (但是在各缩减参数译码时间帧集合期间不必是恒定的)数量的通道的输入信号的时域表 示可有助于在这样的转变期间仍提供平滑的收听体验。这通过促使在解码系统中的布置在 更下游的解码/处理部分中进行转变来实现。例如,具有恒定数量的通道可以有助于提供 输入信号的时域表示中的平滑转变。
[0056] 为了这个目的,音频解码器可以适于至少在紧接在离散译码时间帧后面的各缩减 参数译码时间帧的起始部分期间,以及至少对于紧接在离散译码时间帧前面的各缩减参数 译码时间帧的最后部分,对输入信号的频域表示进行重新格式化。音频解码器适于通过将 n-m个中性通道附加到m通道核心信号来将在这些部分的输入信号的频域表示(其用缩减 参数译码时间帧中的m通道核心信号表示)重新格式化为η通道格式。中性通道可以是包 含中性信号值(即,与无音频内容或无激励相应的值,诸如零)的通道。换句话说,中性值 可以被选择为使得当中性通道的内容被添加到包含音频信号的通道时,通过其生成音频信 号的添加不受中性值的影响(中性值加上非中性贡献等于非中性贡献),但是仍然被明确 地定义为操作。以上述方式,(一些)缩减参数译码时间帧(的至少部分)中的音频信号 的频域表示的m通道核心信号可以被音频解码器重新格式化为与离散译码时间帧中的输 入信号的格式同质的格式,特别是包括相同数量的通道的格式。
[0057] 根据示例实施例,音频解码器可以适于使用重叠变换窗口来执行频时变换,其中, 每个时间帧等于变换窗口中的至少一个的一半长度(例如,具有与该一半长度相同的长 度)。换句话说,每个时间帧可以对应于为等同于一个变换窗口的时间段的长度的至少一半 的时间段。当变换窗口重叠时,在来自不同时间帧的变换窗口之间可能重叠,并且给定时间 帧中的输入信号的时域表示的值因此可以基于来自除了给定时间帧之外的时间帧(例如, 至少紧接在所述给定时间帧前面或后面的时间帧)的贡献。
[0058] 在示例实施例中,音频解码器可以适于在紧接在离散译码时间帧后面的各缩减参 数译码时间帧中通过下述方式来确定输入信号的时域表示的至少一个通道,即,至少对来 自缩减参数译码时间帧的中性通道中的至少一个中性通道的第一贡献和来自紧接在前的 离散译码时间帧的第二贡献进行求和。如关于前面的实施例所描述的,m通道核心信号在 缩减参数译码时间帧中表示输入信号(在频域中),并且音频解码器可以适于在紧接在离 散译码时间帧后面的缩减参数译码时间帧中(至少在这些缩减参数译码时间帧的起始部 分上)将m-n个中性通道附加到m通道核心信号。输入信号的η通道时域表示可以在这样 的缩减参数译码时间帧中通过下述方式获得,即,对于η个通道中的每一个,对来自前一离 散译码时间帧和缩减参数译码时间帧的相应通道的贡献进行求和。对于与m通道核心信号 相应的m个通道中的每一个,这可以包括对来自核心信号的通道(来自缩减参数译码时间 帧)的第一贡献和来自离散译码时间帧中的相应通道的第二贡献进行求和。对于与n-m个 中性通道相应的n-m个通道中的每一个,这可以对应于对来自这些中性通道之一的第一贡 献(即,诸如零的中性值)和来自前一离散译码时间帧中的相应通道的第二贡献进行求和。 这样,来自离散译码时间帧的所有η个通道的贡献可当在紧接在该离散译码时间帧后面的 缩减参数译码时间帧中形成输入信号的时域表示时被使用。这可以使得在输入信号的时域 表示中可以进行更平滑的和/或较不明显的转变。例如,在缩减参数译码中,可以使得来自 离散译码时间帧的贡献可以在与n-m个中性通道相应的n-m个通道中淡出。这还可以有助 于解码系统中的布置在更下游的级/单元中的输入信号的处理/解码,以便在输入信号的 离散译码与缩减参数译码之间的转变期间实现改进的(或更平滑的)收听体验。
[0059] 在示例实施例中,音频解码器可以适于在紧接在参数译码时间帧后面的各离散译 码时间帧中通过下述方式来确定输入信号的时域表示的至少一个通道,即,至少对来自离 散译码时间帧的第一贡献和来自紧接在前的缩减参数译码时间帧的中性通道中的至少一 个的第二贡献进行求和。如关于前面的实施例所描述的,m通道核心信号在缩减参数译码时 间帧中表示输入信号(在频域中),并且音频解码器可以适于在紧接在离散译码时间帧前 面的缩减参数译码时间帧中(至少在这些缩减参数译码时间帧的最终部分上)将m-n个中 性通道附加到m通道核心信号。输入信号的η通道时域表示可以在紧接在这样的缩减参数 译码时间帧后面的离散译码时间帧中通过下述方式来获得,即,对于所述η个通道中的每 一个,对来自离散译码时间帧和前一缩减参数译码时间帧的相应通道的贡献进行求和。对 于与m通道核心信号相应的m个通道中的每一个,这可以包括对来自离散译码时间帧中的 相应通道的第一贡献和来自核心信号的相应通道(来自缩减参数译码时间帧)的第二贡献 进行求和。对于与n-m个中性通道相应的n-m个通道中的每一个,这可以对应于对来自离 散译码时间帧中的相应通道的第一贡献和来自前一缩减参数译码时间帧的相应的中性通 道的第二贡献(即,诸如零的中性值)进行求和。这样,来自缩减参数译码时间帧中的核心 信号的m个通道的贡献可当在紧接在后的离散译码时间帧中形成输入信号的时域表示时 被使用,例如,以使离散译码时间帧的相应通道的值在该离散译码时间帧的起始部分期间 淡入。而且,在其余的n-m个通道中,附加到m通道核心信号的通道中的中性值(例如,零) 可以用于使离散译码时间帧的相应通道的值淡入。特别地,在音频解码器的缓冲器/存储 器中剩余的来自早先的离散译码时间帧的以及与(典型的)在各缩减参数译码集合期间不 使用的n-m个通道相关的任何值可以被附加的中性通道的中性值取代,S卩,可能不被允许 影响在这个稍后的离散译码时间帧的编码系统的音频输出。以上所提及的早先的离散译码 时间帧可潜在地安置为比当前离散译码时间帧早许多个时间帧,即,它们可与当前离散译 码时间帧相隔许多个缩减参数译码时间帧,并且可潜在地对应于输入信号所表示的音频信 号中后退几秒或者甚至几分钟的音频内容。因此,可能可取的是当对当前离散译码时间帧 进行解码时避免使用与这些早先的离散译码时间帧相关的数据和/或音频内容。
[0060] 本示例性实施例可以允许输入信号的时域表示中的更平滑的和/或较不明显的 转变(由从缩减参数译码到离散译码的转变引起)。它还可以有助于解码系统中的更下游 的级/单元中的输入信号的进一步处理/解码,以便在输入信号的缩减参数译码与离散译 码之间的转变期间实现改进的(或更平滑的)收听体验。
[0061] 在示例实施例中,下混级可以适于在每一离散译码时间帧集合中的至少第一时间 帧中以及在每一离散译码时间帧集合之后的至少第一时间帧中工作。下混级优选地可以在 这些时间帧的起始部分中(即,在输入信号的时域表示中的到离散译码的变换以及从离散 译码的变换期间)工作。它然后可以在这些转变期间提供下混信号,所述下混信号可以用 于在输入信号中的到离散译码的变换以及从离散译码的变换期间使编码系统的输出具有 改进的(或更平滑的)收听体验。
[0062] 在示例实施例中,译码机制的组还可以包括参数译码。解码系统可以适于接收对 输入信号进行编码的比特流,所述输入信号在输入信号通过参数译码表示音频信号的每个 时间帧中包括m通道核心信号,所述m通道核心信号为使得在输入信号将音频信号表示为η 个离散编码通道的每个时间帧中,可以使用下混规范从输入信号获得表示相同的音频信号 的m通道核心信号。
[0063] 在本示例实施例中,可以使用如下三种译码机制中的任何一种来对经由比特流接 收的输入信号的时间帧进行译码:离散译码、参数译码和缩减参数译码。特别地,用这些译 码机制中的任何一种译码的时间帧可以跟随在用这些译码机制中的任何一种译码的时间 帧的后面。解码系统可以适于处理使用这三种译码机制中的任何一种译码的时间帧之间的 任何转变。
[0064] 在本发明的第二方面内,提供一种类似于前面的任一示例实施例中所描述的解码 系统(所执行的方法)那样重构η通道音频信号的方法。所述方法可以包括:接收比特流; 从所述比特流提取输入信号的频域表示;并且响应于输入信号在当前时间帧中被缩减参数 译码并且在紧接在前的时间帧中被离散译码,或者输入信号在当前时间帧中被缩减参数译 码并且在紧接在后的时间帧中被离散译码,将输入信号的频域表示的当前时间帧的至少一 部分重新格式化为η通道格式;并且将输入信号的频域表示变换为输入信号的时域表示。 所述方法还可以包括:响应于输入信号在当前时间帧和(一个或)两个紧接在前的时间帧 中被离散译码,基于η个离散编码通道来推导音频信号;并且响应于输入信号在当前时间 帧和(一个或)两个紧接在前的时间帧中被缩减参数译码,基于核心信号和至少一个混合 参数来产生音频信号的η通道表示。
[0065]在本发明的第二方面内,提供一种用于对分割为时间帧的η通道音频信号进行编 码的编码系统,其中,编码系统适于输出比特流,所述比特流在给定时间帧中根据译码机制 表示音频信号,所述译码机制选自包含以下译码机制的组:使用η个离散编码通道的离散 译码;以及缩减参数译码。编码系统包括:选择器,其适于对于给定时间帧选择哪个编码机 制将用于表示音频信号;以及参数分析级,其可操作为基于音频信号的η通道表示并且根 据下混规范来输出将由输出比特流在缩减参数译码机制中编码的m通道核心信号和至少 一个混合参数。可选地,编码系统可以可操作为输出如下比特流,所述比特流在给定时间帧 中也根据参数译码机制表示音频信号,并且选择器可以适于对于给定时间帧在离散译码、 参数译码和缩减参数译码之间进行选择。
[0066] 在本发明的第二方面内,提供一种将η通道音频信号编码为比特流的方法,所述 方法类似于前面的任一实施例的编码系统(所执行的方法)。所述方法可以包括:接收音 频信号的η通道表示;选择将用于在给定时间帧中表示音频信号的译码机制;响应于选择 通过缩减参数译码对音频信号进行编码,基于音频信号的η通道表示并且根据下混规范来 形成对m通道核心信号和至少一个混合参数进行编码的比特流;并且响应于选择通过离散 译码对音频信号进行编码,输出通过η个离散编码通道对音频信号进行编码的比特流。
[0067] 在本发明的第二方面内,提供一种音频传输系统,所述音频传输系统包括根据前 面的编码系统和解码系统的任一实施例的编码系统和解码系统。这些系统通信地连接,并 且编码系统和解码系统各自的下混规范是相同的。
[0068] 要指出,与本发明的第二方面的实施例相关地描述的译码机制(离散译码、参数 译码和缩减参数译码)是与关于本发明的第一方面描述的译码机制相同的译码机制,并 且本发明的第二方面的另外的实施例可以通过将已经描述的本发明的第二方面的实施例 (或它们的组合)与来自关于本实施例的第一方面所描述的实施例的特征组合来获得。在 这样做时,要指出,对于来自根据本发明的第一方面的实施例的至少一些特征,参数译码时 间帧和缩减参数译码时间帧可以互换使用,即,可能不需要区分这两种译码机制。
[0069]在从属权利要求中定义了本发明的两个方面的进一步的示例实施例。指出,本发 明涉及所有特征组合,即使特征被记载在互相不同的权利要求中仍如此。
[0070] II.示例实施例
[0071] 图1以框图形式例示了根据本发明的示例实施例的解码系统100。音频解码器110 接收比特流Ρ,并且在一个或多个处理步骤中从该比特流产生由加圈的字母A所指示的输 入信号,所述输入信号表示η通道音频信号。作为一个例子,可以将Dolby Digital Plus 格式(或Enhanced AC-3)与适于其的音频解码器110 -起使用。以下将更详细地讨论音 频解码器110的内部工作。输入信号A被分割为与音频信号的时间段相应的时间巾贞。优选 地,连续时间帧是相连的,并且不重叠的。输入信号A在给定时间帧内(b)通过参数译码来 表示音频信号或者(a)将音频信号表示为η个离散编码通道W。参数译码数据包括与可通 过对音频信号进行下混而获得的下混信号X相应的m通道核心信号。在输入信号A中接收 的参数译码数据还可以包括与下混信号X相关联的一个或多个混合参数,这些混合参数共 同用α表示。可替代地,与下混信号X相关联的至少一个混合参数α可以通过在同一比特 流P或不同比特流中与输入信号分离的信号被接收。关于输入信号的当前译码机制(即, 参数译码或离散译码)的信息可以在比特流P中被接收或者作为单独的信号被接收。在图 1中所示的解码系统中,音频信号具有六个通道,核心信号具有两个通道,即,m = 2,η = 6。 在本公开的一些段落中,为了明确地指示一些连接线适于发送多通道信号,为这些线提供 了与各自的通道数量相邻的交叉线。在离散译码机制中,输入信号A可以是音频信号的作 为5. 1环绕声的表示,具有通道L (左)、R(右)和C (中心)、Lfe (低频效果)、Ls (左环绕 声)、Rs (右环绕声)。然而,在参数译码机制中,在2. 0立体声中,L通道和R通道用于发送 核心信号通道LO (核心左)和RO (核心右)。
[0072] 解码系统100可以在离散模式下进行操作,在所述离散模式下,解码系统100从η 个离散编码通道W推导音频信号。解码系统100还可以在参数模式下进行操作,在所述参 数模式下,解码系统100通过执行包括空间合成的上混操作来从核心信号重构音频信号。
[0073] 下混级140接收输入信号,根据下混规范执行输入信号的下混,并且输出m通道下 混信号X。在本实施例中,下混级140将输入信号看作η通道信号,S卩,如果输入信号仅包含 m通道核心信号,则输入信号被认为具有n-m个另外的通道,这些通道为空/零。在实践中, 这可以变为用中性值(诸如零序列)填充未被占据的通道。下混级140形成η个输入通道 的m通道线性组合,并且将这些作为下混信号X输出。下混规范规定了该线性组合的增益, 并且与输入信号的译码无关,即,当下混级140工作时,它与输入信号的译码无关地进行操 作。
[0074] 在本实施例中,当音频信号被参数译码时,下混级140接收具有n-m个空通道的m 通道核心信号。下混规范所规定的线性组合的增益被选择为使得当音频信号被参数译码 时,下混信号X与核心信号相同,即,线性组合通过核心信号。可以如下地对下混级进行建 模:

【权利要求】
1. 一种用于重构n通道音频信号的解码系统(100),其中,所述解码系统适于接收比特 流(P),所述比特流(P)对输入信号进行编码,所述输入信号被分割为时间帧,并且在给定 时间帧中根据选自以下组的译码机制表示所述音频信号,所述组包含: b) 使用n个离散编码通道的离散译码;和 c) 使用m通道核心信号以及至少一个混合参数(a)的缩减参数译码,其中n>m> 1, 所述解码系统能够操作为基于所述n个离散编码通道或者通过空间合成来推导所述 音频信号, 所述解码系统包括: 音频解码器(110),适于从所述比特流提取输入信号的频域表示并且将其变换为输入 信号的时域表不; 下混级(140),能够操作为根据下混规范基于所述输入信号的时域表示来输出m通道 下混信号(X);以及 空间合成级(150),能够操作为基于所述下混信号和所述至少一个混合参数来输出所 述音频信号的n通道表示(Y), 其中,所述音频解码器进一步适于在将所述输入信号的频域表示变换为所述时域表示 之前通过附加n-m中性通道来将所述输入信号的频域表示重新格式化为n通道格式,其中 所述音频解码器适于至少对于紧接在离散译码时间帧后面的每个缩减参数译码时间帧的 起始部分以及至少对于紧接在离散译码时间帧前面的每个缩减参数译码时间帧的最终部 分期间执行所述重新格式化。
2. 根据权利要求1所述的解码系统,其中,所述音频解码器使用重叠变换窗口来执行 时频变换,其中,所述时间帧中的每一个等于所述变换窗口中的至少一个的一半长度。
3. 根据前述任一项权利要求所述的解码系统,其中,所述音频解码器适于在紧接在离 散译码时间帧后面的各缩减参数译码时间帧中、通过至少对来自缩减参数译码时间帧的所 述中性通道中的至少一个中性通道的第一贡献和来自紧接在前的离散译码时间帧的第二 贡献进行求和,确定输入信号的时域表示的至少一个通道。
4. 根据前述任一项权利要求所述的解码系统,其中,所述音频解码器适于在紧接在参 数译码时间帧后面的各离散译码时间帧中、通过至少对来自离散译码时间帧的第一贡献和 来自紧接在前的缩减参数译码时间帧的所述中性通道中的至少一个中心通道的第二贡献 进行求和,确定输入信号的时域表示的至少一个通道。
5. 根据前述任一项权利要求所述的解码系统,其中,所述下混级适于在每个离散译码 时间帧集合中的至少第一时间帧中以及在每个离散译码时间帧集合之后的至少第一时间 帧中工作。
6. 根据前述任一项权利要求所述的解码系统,其中,所述解码系统适于接收对输入信 号进行编码的比特流,所述输入信号在其中输入信号通过缩减参数译码表示音频信号的每 个时间帧中具有m通道核心信号的形式,所述m通道核心信号为使得在其中输入信号将音 频信号表示为n个离散编码通道的每个时间帧中,能够使用下混规范从所述输入信号获得 表示相同的音频信号的m通道核心信号。
7. 根据前述任一项权利要求所述的解码系统,还包括: 第一延迟线(120),适于接收所述输入信号;和 混合器(130),通信地连接到所述空间合成级和所述第一延迟线,并且适于 -在所述系统的参数模式下,输出空间合成级输出或者从其推导的信号; -在所述系统的离散模式下,输出第一延迟线输出;和 -响应于在所述输入信号中发生的缩减参数译码和离散译码之间的变化,输出空间合 成级输出与第一延迟线输出之间的混合转变。
8. 根据权利要求7所述的解码系统,其中,所述第一延迟线能够操作为引起与和所述 下混级和所述空间合成级相关联的总通过时间相对应的延迟。
9. 根据权利要求8所述的解码系统,还包括适于接收混合器输出的第二延迟线(160), 其中,所述第一延迟线和第二延迟线所引起的总延迟对应于一个时间帧的长度的倍数。
10. 根据前述任一项权利要求所述的解码系统,其中,所述空间合成级适于应用混合 参数值,所述混合参数值通过如下这样的连续时间帧之间的内插而获得,在所述连续时间 帧中,在缩减参数译码或者在适用的情况下的参数译码中输入信号定义了用于时间帧中的 非起始点的明确的混合参数值。
11. 根据权利要求10所述的解码系统,其中,所述空间合成级适于响应于当前时间帧 是时间帧集合中的第一时间帧而发起离散到参数转变,在所述集合中每个时间帧被缩减参 数译码或者在适用的情况下被参数译码,所述离散到参数转变包括对最早的明确的混合参 数值进行向后外插直到当前时间帧的开始为止。
12. 根据权利要求10或11所述的解码系统,其中,所述空间合成级适于响应于当前时 间帧是离散译码时间帧集合中的第一时间帧而发起参数到离散转变,所述参数到离散转变 包括对最新的明确的混合参数值进行向前外插,直到至少当前时间帧的结束为止。
13. 根据前述任一项权利要求所述的解码系统,其中,所述空间合成级包括: 第一变换级(151),适于接收所述m通道下混信号的时域表示,并且基于其输出所述下 混信号的频域表示(Xf); 上混级(155),适于基于所述下混信号的频域表示和所述至少一个混合参数来输出所 述音频信号的所述n通道表示的频域表示(Yf);和 第二变换级(152),适于接收所述音频信号的n通道表示的频域表示,并且基于其输出 所述音频信号的n通道表示的时域表示作为所述空间合成级的输出。
14. 根据权利要求13所述的解码系统,其中,所述上混级适于形成包括所述下混信号 的m通道频域表示中的通道的线性组合;并且将其输出作为所述音频信号的n通道表示的 频域表示,所述至少一个混合参数控制所述线性组合中的所述下混信号的m通道频域表示 中的至少一个通道相关的至少一个增益。
15. 根据前述任一项权利要求所述的解码系统,其中,所述下混级适于形成所述输入信 号的时域表示的通道的线性组合。
16. 根据前述任一项权利要求所述的解码系统,还包括控制器(170),所述控制器用于 基于当前时间帧和紧接在前的时间帧的译码机制来控制所述空间合成级和任何混合器。
17. 根据权利要求16所述的解码系统,其中,所述控制器基于当前时间帧和两个紧接 在前的时间帧的译码机制来控制所述空间合成级和任何混合器。
18. 根据前述任一项权利要求所述的解码系统,其中,所述空间合成级能够操作为在其 中输入信号通过缩减参数译码表示音频信号的并且紧接在缩减参数译码时间帧或者在适 用的情况下的参数译码时间帧后面的每个时间帧中基于所述输入信号和所述至少一个混 合参数输出所述音频信号的n通道表示。
19. 根据前述任一项权利要求所述的解码系统,其中,译码机制的组还包括 a) 参数译码, 所述解码系统适于接收对输入信号进行编码的比特流,输入信号在其中输入信号通过 参数译码表示音频信号的每个时间帧中包括m通道核心信号,所述m通道核心信号为使得 在其中输入信号将音频信号表示为n个离散编码通道的每个时间帧中,能够使用下混规范 从所述输入信号获得表示相同的音频信号的m通道核心信号。
20. 根据权利要求19的解码系统,其中,下混级适于通过将音频信号的参数化表示的 核心信号再现为下混信号,在其中输入信号通过参数译码表示音频信号的并且在缩减参数 译码时间帧或者参数译码时间帧后面的每个时间帧中生成下混信号。
21. 根据权利要求19或20的解码系统,其中,解码系统适于接收对输入信号进行编码 的比特流,所述输入信号在其中所述输入信号通过参数译码表示音频信号的每个时间帧中 是n通道信号,其中,n-m个通道不用于表示所述音频信号。
22. -种重构n通道音频信号的方法,所述方法包括以下步骤: 接收比特流(P),所述比特流对输入信号进行编码,所述输入信号被分割为时间帧,并 且在给定时间帧中根据选自以下组的译码机制表示所述音频信号,所述组包含: b) 使用n个离散编码通道的离散译码;和 c) 使用m通道核心信号以及至少一个混合参数(a)的缩减参数译码,其中n>m> 1, 从所述比特流提取输入信号的频域表示; 响应于输入信号在当前时间帧中被缩减参数译码并且在紧接在前的时间帧中被离散 译码,通过附加n-m中性通道到所述m通道核心信号来将所述输入信号的频域表示的当前 时间帧的至少起始部分重新格式化为n通道格式; 响应于输入信号在当前时间帧中被缩减参数译码并且在紧接在后的时间帧中被离散 译码,通过附加n-m中性通道到所述m通道核心信号来将所述输入信号的频域表示的当前 时间帧的至少最终部分重新格式化为n通道格式; 将输入信号的所述频域表示变换为输入信号的时域表示; 响应于输入信号在当前时间帧和两个紧接在前的时间帧中被离散译码,基于所述n个 离散编码通道推导所述音频信号;以及 响应于输入信号在当前时间帧和两个紧接在前的时间帧中被缩减离散译码,基于核心 信号和所述至少一个混合参数生成音频信号的n通道表示。
23. 根据权利要求22所述的方法,包括以下步骤: 响应于所述输入信号在当前时间巾贞和前一时间巾贞中被离散译码,基于所述n个离散编 码通道推导音频信号;以及 响应于所述输入信号在当前时间巾贞和前一时间巾贞中被缩减参数译码,基于核心信号和 所述至少一个混合参数产生音频信号的n通道表示。
24. 根据权利要求22或23所述的方法,还包括以下步骤: 响应于当前时间帧是离散译码时间帧集合中的第一时间帧或者当前时间帧是离散译 码时间帧集合之后的第一时间帧,根据下混规范基于输入信号生成m通道下混信号。
25. 根据权利要求24所述的方法,其中,所述输入信号的其中所述输入信号通过缩减 参数译码表示音频信号的每个时间巾贞包括对于给定时间巾贞中的非起始点的所述至少一个 混合参数的值,所述方法还包括以下步骤: 响应于所述输入信号在当前时间帧中被离散译码并且在前一时间帧中被缩减参数译 码,基于所述下混信号并且基于所述至少一个混合参数的与前一时间帧相关联的至少一个 值来产生音频信号的n通道表示,并且在当前时间帧期间转变为基于所述n个离散编码通 道推导音频信号。
26. 根据权利要求22到25中任一项所述的方法,其中,所述输入信号的其中所述输入 信号通过缩减参数译码表示音频信号的每个时间帧包括对于给定时间帧中的非起始点的 所述至少一个混合参数的值,所述方法还包括以下步骤: 响应于当前时间帧是缩减参数译码时间帧集合中的第一时间帧,向后外插所接收的至 少一个混合参数的值,直到当前时间帧的开始为止。
27. -种用于对分割为时间帧的n通道音频信号进行编码的编码系统(200),其中,所 述编码系统适于输出比特流(P),所述比特流在给定时间帧中根据选自以下组的译码机制 表示所述音频信号,所述组包含: b) 使用n个离散编码通道的离散译码;和 c) 缩减参数译码 所述编码系统包括: 选择器(230),适于对于给定时间帧选择哪个编码机制将用于表示音频信号;和 参数分析级(240),能够操作为基于音频信号的n通道表示并且根据下混规范来输出 将由输出的比特流在缩减参数译码机制中编码的m通道核心信号(X)和至少一个混合参数 (a ),其中,n>m彡 1。
28. 根据权利要求27所述的编码系统,其中,该译码机制的组还包括: a) 参数译码, 其中,在参数译码机制和离散译码机制中使用n通道信号格式,并且在缩减参数译码 机制中使用m通道信号格式。
29. -种音频发布系统,所述音频发布系统包括根据权利要求27或28所述的编码系统 和根据权利要求1至21中任一项所述的解码系统,所述编码系统和所述解码系统通信地连 接,并且所述编码系统和所述解码系统各自的下混规范是相同的。
30. -种将n通道音频信号编码为比特流(P)的方法,所述方法包括以下步骤: 接收所述音频信号的n通道表示; 从以下组选择要用于在给定时间帧中表示所述音频信号的译码机制,所述组包括: b) 使用n个离散编码通道的离散译码;和 c) 缩减参数译码, 响应于通过缩减参数译码对所述音频信号进行编码的决定,基于所述音频信号的n通 道表示并且根据下混规范来形成比特流,所述比特流对m通道核心信号(X)和至少一个混 合参数(〇)进行编码,其中,n>m彡1 ;和 响应于通过离散译码对所述音频信号进行编码的决定,输出通过n个离散编码通道对 所述音频信号进行编码的比特流。
31. -种包括计算机可读介质的计算机程序产品,所述计算机可读介质具有用于执行 根据权利要求22至26和30中任一项所述的方法的指令。
32. -种根据前述任一项权利要求所述的装置或方法,其中,n= 6,m= 2。
【文档编号】G10L19/008GK104380376SQ201380031015
【公开日】2015年2月25日 申请日期:2013年6月14日 优先权日:2012年6月14日
【发明者】H·普恩哈根, L·塞勒斯特罗姆, K·J·罗德恩, K·克约尔林, L·维尔莫斯 申请人:杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1