参量编码和解码的制作方法

文档序号：2818934阅读：430来源：国知局

专利名称：参量编码和解码的制作方法
技术领域：
本发明涉及參量(parametric)编码和解码，并且尤其涉及使用下混合 (down-mixing)和參量上混合(up-mixing)数据的多通道信号的參量编码和解码。
背景技术：
随着数字信号表示和通信逐渐取代模拟表示和通信，各种源信号的数字编码在过去的几十年里已变得日益重要。例如，诸如视频和音乐的媒体内容的分发愈加基于数字内容编码。多通道信号的编码可以通过将多通道信号下混合成更少的通道并对这些通道进行编码和传输来执行。例如，立体声信号可以被下混合成单声道信号，该单声道信号随后被编码。在參量多通道编码中，此外生成參量数据，其支持下混合的上混合以重新创建原始的多通道信号(的近似值)。使用下混合/上混合以及关联的參量数据的多通道系统的示例包括称为參量立体声(PS)标准的技术以及其到多通道參量编码的扩展(例如，环绕MPEG MPS)。以其最简单的形式，将立体声信号下混合成单声道信号可以简单地通过生成两个立体声通道的均值，即通过简单地生成中信号或和信号来执行。该单声道信号随后可以被分发并可以进一歩直接用作单声道信号。在诸如由參数立体声使用的编码方法中，除了下混合信号还提供了立体声提示(stereo cue)。具体地，通道间等级差异、时差或相位差和相干或相关性參数按照时频分块(其典型地对应于频率轴的Bark或ERB带(band)划分和时间轴的固定均勻分割)来确定。该数据典型地与下混合信号一起被分发并允许通过取决于參数的上混合进行的原始立体声信号的精确重新创建。然而，众所周知的是，创建中信号(mid signal)典型地导致稍微枯燥的信号，即具有降低的亮度/高频内容。原因是对于典型的音频信号，不同通道针对低频而不是针对较高频率趋于相当相关的。两个立体声通道的直接求和有效地抑制了未对齐的 (non-aligned)信号分量。事实上，对于左信号和右信号完全异相位的频率子带来说，获得的中信号为0。已提出的解决方案是在执行求和之前使用通道的相位对齐。因此，理想地，在左信号和右信号被加到一起之前，针对频域中的任何相位差(对应于时域中的时间差)对该左信号和右信号进行补偿。然而，这样的方法趋于复杂并可能引入算法延迟。同吋，在实践中，该方法趋于未提供最佳的质量。例如，如果测量了通道间的相位差，则存在是否将左通道相位对齐到右通道相位的模糊性，或者反之亦然。同吋，尝试偏移两个通道的相位同样导致模糊性。进ー步地，当相关性为低吋，相位差在数值上是劣性的，从而导致不精确和健壮的系统。当通过相位对齐创建下混合吋，全部这些问题趋于导致可察觉到的伪像。典型地，音调分量的调制由该方法造成。結果，最实用的系统趋于使用简单地作为左信号和右信号的平均值(mean)生成的所谓被动(passive)下混合。不幸地，被动下混合也具有ー些关联的缺点。缺点的其中之一是声学能量可能大量地降低并且对于异相位信号甚至完全丧失。所提出的用于解决该问题的方法是使用所谓的主动下混合，其中下混合被重新按比例调整(rescale)以具有与原始信号相同的能量。另一提出的解决方案是提供解码器侧能量补偿。然而，这样的补偿趋于在更总体的等级上，而没有区别(补偿是必要的)声调分量和(补偿不是必要的)噪音。此外，在被动和主动下混合两种方法中，问题出现在接近异相位的信号。事实上，在下混合信号中，异相位分量是完全缺少的。因此，针对多通道参量编码/解码的改进系统将会是有利的，并且尤其是对于允许增加的灵活性、便于操作、便于实现、降低的复杂性、改进的健壮性、异相位信号分量的改进编码、降低的数据率对质量比和/或改进的性能的系统将会是有利的。

发明内容
相应地，本发明寻求优选地单独或以任意组合来减轻、缓解或消除以上提及的缺点的一个或多个。根据本发明的一方面，提供了一种用于生成多通道音频信号的解码器，所述解码器包括第一接收器，用于接收作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的组合的下混合，第一权重和第二权重对于至少一些时频间隔具有不同的幅度；第二接收器，用于接收表征第一通道信号和第二通道信号之间关系的上混合参量数据；电路，用于根据上混合参量数据生成第一权重的第一权重估计和第二权重的第二权重估计；以及上混合器，用于响应于上混合参量数据、第一权重估计和第二权重估计，通过对所述下混合进行上混合来生成多通道音频信号，所述上混合取决于第一权重估计和第二权重估计的至少一个的幅度。本发明可以在很多场景中可以获得改进的和/或便利的操作。该方法可以典型地减轻异相位的问题和/或相位对齐编码的缺点。该方法可以往往获得改进的音频质量而不必增加数据速率。经常可以实现更健壮的编码/解码系统，并且尤其是，编码/解码可以对特定的信号条件更不敏感。该方法可以获得低复杂度的实现和/或具有低的计算资源需求。该处理可以是基于子带的。编码和解码可以在频率子带和时间间隔中执行。具体地，可以为每个频率子带和每个(时间)分段与下混合信号值一起提供第一权重和第二权重。可以通过在每个子带中单独组合由用于该子带的权重加权的第一和第二通道信号的频率子带值生成下混合。子带的权重(以及因此的权重估计)对于第一和第二通道信号的至少一些值具有不同的幅度(以及因此的能量)。每个时频间隔可以具体地对应于编码/解码时间分段和频率子带。上混合参量数据包括可以用来根据下混合生成与原始下混合的多通道信号相对应的上混合的参数。上混合参量数据可以具体地包括通道间等级差(ILD)、通道间相干性/ 相关性(IC/ICC)、通道间相位差(IPD)和/或通道间时间差(ITD)参数。可以为频率子带提供参数，并且该参数可以提供有合适的更新间隔。具体地，可以对于每个编码/解码时间分段、为多个频率带的每一个提供参数集合。用于参量数据的频率带和/或时间分段可以与用于下混合的频率带和/或时间分段相等，但是不需要一定相等。例如，相同的频率子带可以用于较低的频率但不可以用于较高的频率。因此，第一和第二权重的时频分辨率与上混合參量数据的參数不需要相等。对于ー些信号值，第一和第二权重(并且因此相应的权重估计)之一在一个子带中可以为零。第一和第二通道信号的組合可以是线性組合，例如具体是在求和之前通过相应的权重按比例调整的每个信号的线性求和。多通道信号包括两个或更多通道。具体地，多通道信号可以是双通道(立体声)信号。该方法可以尤其减轻异相位问题以提供更健壮的系统，同时维持低的复杂度和低的数据速率。具体地，该方法可以允许确定不同(具有不同幅度)的权重而无需发送另外的数据。因此，可以获得改进的音频质量而不必增加数据速率。第一和/或第二权重估计的确定可以使用与(假设)用于在编码器中确定第一和/ 或第二权重相同的方法。在许多实施例中，可以基于用于根据上混合參量数据的參数确定权重/权重估计的假设的函数来确定ー个或两个权重/权重估计。解码器可以不具有所接收信号的精确特性的明确信息，但是可以简单地通过以下假设来操作，即下混合是至少以第一权重加权的第一通道信号和以第二权重加权的第二通道信号的組合，其中第一权重和第二权重对于至少ー些时频间隔具有不同的幅度。时频间隔可以对应于时间间隔、频率间隔或者时间间隔和频率间隔的組合，诸如例如时间分段中的频率子帯。根据本发明可选的特征，电路被布置为利用与针对所述至少ー些时频间隔的參量数据的至少ー些參数的不同关系生成第一权重估计和第二权重估计。这可以获得改进的编码/解码系统，并尤其可以减轻异相位的问题以提供更加健壮的系统。根据參数确定权重估计的函数可以因此对于两个权重是不同的，以使得相同的參数将导致具有不同幅度的权重估计。编码器可以相应地被布置为确定第一权重和第二权重具有与针对所述至少ー些时频间隔的參量数据的至少ー些參数不同的关系。时频间隔可以对应于时间间隔、频率间隔或时间间隔和频率间隔的組合，诸如例如时间分段中的频率子帯。根据本发明可选的特征，上混合器被布置为将第一权重估计和第二权重估计的至少ー个确定为上混合參量数据的能量參数的函数，该能量參数指示第一通道信号和第二通道信号的相对能量特性。这可以提供改进的性能和/或便利的操作和/或实现。能量考虑对于确定合适的权重可以是尤其相关的，并且这些可以相应地被更合适地表示并与上混合參量数据的能量參数相互关联。因此，使用能量參数来确定权重/权重估计实现了允许确定具有不同幅度的权重/权重估计的信息的高效传输。具体地，使用能量參数来确定权重/权重估计允许高效地确定权重的幅度而不仅仅是权重的相位。能量參数可以具体地提供第一通道信号、第二通道信号、第一通道信号和第二通道信号之间的差或者組合信号的能量(例如交叉功率特性)的能量(或等效地，功率)特性的信息。根据本发明的可选特征，能量參数是以下各项之ー通道间强度差IID參数、通道间等级差ILD參数和通道间相干性/相关性IC/ICC參数。这可以提供尤其有利的性能并可以提供改进的向后兼容性。
根据本发明的可选特征，上混合参量数据包括第一权重和第二权重，与上混合参量数据之间关系的准确度指示，并且解码器被布置为响应于该准确度指示生成第一权重估计和第二权重估计的至少一个。这可以在很多场景中提供改进的性能并尤其可以实现不同信号条件的更准确权重估计的改进确定。准确度指示可以指示在根据参量数据计算权重估计时可以获取的权重估计的准确度。该准确度指示可以具体地指示可获得的准确度是否满足准确度标准。例如准确度指示可以是简单地指示是否可以使用该参量数据的二元指示。准确度指示可以包括每个子带的单独值，或者可以包括可应用于多个甚至所有子带的一个或多个指示。解码器可以被布置为只有准确度指示表明足够的准确度时才根据参量数据来估计权重估计。根据本发明的可选特征，针对至少一个频率间隔的第一权重和第二权重的至少一个具有比上混合参量数据的相应参数更精细的频时分辨率。这在许多场景中可以提供改进的性能，因为更准确的权重可以用来生成下混合，而同时允许维持低的数据速率。类似地，针对至少一个频率间隔的第一权重估计和第二权重估计的至少一个可以具有比上混合参量数据的相应参数更精细的频时分辨率。该相应的参数是包括相同的时间频率间隔的参数。在许多实施例中，解码器可以继续进行以基于相应的参数生成第一和/或第二权重的估计。因此，虽然参数可以表示较大的时间和/或频率间隔上的信号特性，但是它仍旧可以用作权重的时间和/或频率间隔的近似。根据本发明的可选特征，上混合器被布置为生成针对所述响应于参量数据的整体相位差值，并且响应于该整体相位差值执行上混合，该整体相位差值取决于第一权重估计和第二权重估计。这可以允许高质量的高效解码。在一些场景中，其可以提供改进的向后兼容性。 OPD单独地取决于第一和第二权重估计两者(包括其幅度)，并且可以具体地被定义为权重的函数，即 0PD=f (W11W2)
上混合可以例如基本上生成为
权利要求
1.一种用于生成多通道音频信号的解码器(115)，所述解码器(115)包括第一接收器(401、405)，用于接收作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的組合的下混合，所述第一权重和所述第二权重对于至少ー些时频间隔具有不同的幅度；第二接收器(401、403)，用于接收表征所述第一通道信号和所述第二通道信号之间关系的上混合參量数据；电路(411)，用于根据上混合參量数据生成所述第一权重的第一权重估计和所述第二权重的第二权重估计；以及上混合器(407 )，用于响应于所述上混合參量数据、所述第一权重估计和所述第二权重估计，通过对所述下混合进行上混合来生成所述多通道音频信号，所述上混合取决于所述第一权重估计和所述第二权重估计的至少ー个的幅度。
2.如权利要求1所述的解码器(115)，其中所述电路(411)被布置为利用与针对所述至少ー些时域间隔的參量数据的至少ー些參数的不同关系生成所述第一权重估计和所述第二权重估计。
3.如权利要求2所述的解码器(115)，其中所述上混合器(407)被布置为将所述第一权重估计和所述第二权重估计的至少ー个确定为所述上混合參量数据的能量參数的函数，所述能量參数指示所述第一通道信号和所述第二通道信号的相对能量特性。
4.如权利要求3所述的解码器(115)，其中所述能量參数为以下项中的至少ー个通道间强度差IID參数；通道间等级差ILD參数；以及通道间相干性/相关性IC/ICC參数。
5.如权利要求1所述的解码器(115)，其中所述上混合參量数据包括所述第一权重和所述第二权重与所述上混合參量数据之间关系的准确度指示，并且所述解码器(115)被布置为响应于所述准确度指示生成所述第一权重估计和所述第二权重估计的至少ー个。
6.如权利要求1所述的解码器(115)，其中针对至少ー个频率间隔的所述第一权重和所述第二权重的至少ー个具有比所述上混合參量数据的相应參数更精细的频时分辨率。
7.如权利要求1所述的解码器(115)，其中所述上混合器(407)被布置为生成针对所述响应于參量数据的整体相位差值，并且响应于所述整体相位差值执行所述上混合，所述整体相位差值取决于所述第一权重估计和所述第二权重估计。
8.如权利要求1所述的解码器(115)，其中除了所述整体相位差值以外，所述上混合独立于所述第一权重估计和所述第二权重估计的至少ー个的幅度。
9.如权利要求1所述的解码器(115)，其中所述上混合器(407)被布置为根据下混合生成解相关的信号，所述解相关的信号与所述下混合解相关；通过将矩阵乘法应用到所述下混合和所述解相关的信号来对所述下混合进行上混合，其中所述矩阵乘法的系数取决于所述第一权重估计和所述第二权重估计。
10.如权利要求1所述的解码器(115)，其中所述上混合器(407)被布置为通过以下方式确定所述第一权重估计响应于所述上混合參量数据确定第一能量度量，其指示所述第一通道信号和所述第二通道信号的非相位对齐组合的能量；响应于所述上混合參量数据确定第二能量度量，其指示所述第一通道信号和所述第二通道信号的相位对齐组合的能量；确定所述第一能量度量相对于所述第二能量度量的第一度量；响应于所述第一度量，确定所述第一权重估计。
11.如权利要求1所述的解码器(115)，其中所述上混合器(407)被布置为通过以下方式确定所述第一权重估计针对多个第一权重和第二权重的预定值对的每一个，响应于所述參量数据确定指示与所述预定值对相对应的下混合的能量的能量度量；以及响应于所述能量度量和所述预定值对确定所述第一权重。
12.一种用于生成至少包括第一通道和第二通道的多通道音频信号的编码表示的编码器(109)，所述编码器包括下混合器(201、203、205)，用于生成作为至少由第一权重加权的第一通道的第一通道信号和由第二权重加权的第二通道的第二通道信号的組合的下混合，所述第一权重和所述第二权重对于至少ー些时频间隔具有不同的幅度；电路(201、203、209)，用于生成表征所述第一通道信号和所述第二通道信号之间关系的上混合參量数据，所述上混合參量数据进一歩对所述第一权重和所述第二权重进行表征；以及电路(207、211)，用于生成所述编码表示以包括所述下混合和所述上混合參量数据，其中所述下混合器(201、203、205)布置为确定第一能量度量，其指示所述第一通道信号和所述第二通道信号的非相位对齐组合的能量；确定第二能量度量，其指示所述第一通道信号和所述第二通道信号的相位对齐组合的睹里；确定所述第一能量度量相对于所述第二能量度量的第一度量；以及响应于所述第一度量确定所述第一权重和所述第二权重。
13.—种生成多通道音频信号的方法，该方法包括接收作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的組合的下混合，所述第一权重和所述第二权重对于至少ー些时频间隔具有不同的幅度；接收表征所述第一通道信号和所述第二通道信号之间关系的上混合參量数据；根据所述上混合參量数据生成所述第一权重的第一权重估计和所述第二权重的第二权重估计；以及响应于所述上混合參量数据、所述第一权重估计和所述第二权重估计，通过对所述下混合进行上混合来生成所述多通道音频信号，所述上混合取决于所述第一权重估计和所述第二权重估计的至少ー个的幅度。
14.ー种生成至少包括第一通道和第二通道的多通道音频信号的编码表示的方法，该方法包括生成作为至少由第一权重加权的第一通道的第一通道信号和由第二权重加权的第二通道的第二通道信号的組合的下混合，所述第一权重和所述第二权重对于至少ー些时频间隔具有不同的幅度；生成表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据，所述上混合参量数据进一步对所述第一权重和所述第二权重进行表征；以及生成所述编码表示以包括所述下混合和所述上混合参量数据。
15.一种计算机程序产品，用于执行权利要求13或14任一项所述的方法。
16.一种用于多通道音频信号的音频比特流，包括作为至少由第一权重加权的第一通道信号和由第二权重加权的第二通道信号的组合的下混合，所述第一权重和所述第二权重对于至少一些时频间隔具有不同的幅度；以及表征所述第一通道信号和所述第二通道信号之间关系的上混合参量数据，所述上混合参量数据进一步对所述第一权重和所述第二权重进行表征。
17.一种存储介质，其上存储权利要求16所述的音频比特流。
全文摘要
一种用于多通道音频信号的编码器，所述编码器包括下混合器(201、203、205)，用于生成作为至少分别由第一和第二权重加权的第一和第二通道信号的组合的下混合，该第一和第二权重对于至少一些时频间隔具有不同的幅度。此外，电路(201、203、209)生成表征通道信号之间关系以及表征权重的上混合参量数据。电路根据上混合参量数据生成编码器权重的权重估计；以及包括上混合器(407)，其响应于上混合参量数据、第一权重估计和第二权重估计，通过对该下混合进行上混合来重新创建多通道音频信号，该上混合取决于一个或多个权重估计的至少一个的幅度。
文档编号G10L19/00GK102598122SQ201080051415
公开日2012年7月18日申请日期2010年11月5日优先权日2009年11月12日
发明者A.C.登布林克, A.W.J.奥门, E.G.P.舒伊杰斯申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：A.C.登布林克;E.G.P.舒伊杰斯;A.W.J.奥门
技术所有人：皇家飞利浦电子股份有限公司
我是此专利的发明人

上一篇：Sbr比特流参数缩混的制作方法
上一篇：复杂度可缩放的感知节拍估计的制作方法