多通道信号的预测编码的制作方法

文档序号:2830053阅读:373来源:国知局
专利名称:多通道信号的预测编码的制作方法
多通道信号的预测编码
本发明涉及多通道信号(multi channel signal)的编码和/或解码, 并且尤其是涉及使用线性预测编码的编码。
在过去几十年内,因为数字信号表示法和通信越来越多地取代模拟表 示法和通信,各种源信号的数字编码变得越来越重要。举例而言,诸如全 球移动通信系统那样的移动电话系统U于数字语音编码。而且诸如视频 和音乐那样的媒体内容的分发也越来越多地基于数字内容编码。
在内容编码中,且尤其是在音频和语音编码中,线性预测编码是经常 被采用的工具,因为它对于低数据速率提供高质量。线性预测编码过去主 要应用于个体信号,但它也可应用于多通道信号,诸如,举例而言象立体 声音频信号。
单通道线性预测编码通过减小信号中的冗余和在预测参数中捕获这 些而达到有效的数据速率。预测参数被包括在编码信号中,且冗余在解码 器中通过线性预测合成滤波器被恢复。
对于线性预测码/编码系统的性能来说, 一个重要参数是传送的预测 参数的精度。尤其是,为了达到对于给定质量水平的有效的数据速率,预 测参数必须被有效地编码,这通常包括参数的量化。然而,系统的性能对 于这种编码和量化是高度敏感的。
用于单通道信号的预测参数的量化和传输的几种方法是已知的。预观'J 参数不被个体地量化,因为线性预测滤波器的个体系数的量化误差可以大 大地改变滤波器的响应,且甚至较小的量化误差也可导致不稳定的合成滤 波器。因此,这样的参数量化会显著地影响编码质量,以及对于相关联的 预测滤波器的频率响应只提供很少的控制。
反正弦表示,对数面积比(LAR)或线谱频率(LSF),以便保持对转移特 性的控制和/或使得量化器的影响最小化。进一步的细节例如可以在教科 书 "Speech coding and synthesis (语音编码和合成)",B. klejin禾口 K. K. Paliwal (Eds.), Elsevier, Amsterdam, 1995, Chapter 12, 第 442-450页中找到。
对于多通道信号,线性预测也可以被使用来编码和解码。这导致由多
通道预测参数定义的多通道分析和合成系统。这样的多通道信号例如在立 体声音频数据和多通道音频数据中出现,但也可以是一幅图像的不同行。
众所周知,如果分析系统的个体转移的阶(order )是相等的,以及 如果使用输入数据窗来执行最佳化,则可以保证合成系统的稳定性。
然而,虽然知道去生成对于多通道信号的预测参数,但不知道这些参 数可以如何-故有效地编码和传送。
多通道预测参数的编码且尤其是量化,与许多问题相关联。
具体地,类似于单通道情形,参数的直接量化只允许对于转移特性很 少的控制。例如,预测矩阵的行列式(这是重要的矩阵特征)可以容易地 在这样的方法中急剧改变。
而且,对于单通道情形已知的量化策略,诸如反正弦或LAR表示法, 涉及到个体标量值,并且不能直接应用到多通道情形的预测参数矩阵。
另一个问题是对于多通道系统,前向和后向预测系统没有附加的知 识就不能直一妄互相构建。
因此,当前还不知道用于多通道预测矩阵编码和量化的有效方法。所 以, 一种用于多通道编码/解码的改进的办法将是有利的,且尤其是一种 允许提高的灵活性、低的复杂性、筒易的实现、多通道预测参数的有效编 码/解码、减小的数据速率、改进的质量和/或改进的性能的办法将是有利
的。、 -、-,、'、',。'、"一 、, ;,。'''
除一个或多个上述的缺点。
按照本发明的第 一方面,提供了 一种用于编码多通道信号的编码器, 包括用来确定对于多通道信号的线性预测编码参数矩阵的装置;用于从 线性预测编码参数矩阵生成反射矩阵的装置;用于编码反射矩阵以生成编 码的反射矩阵数据的编码装置;以及用于生成包括反射矩阵数据的对于多 通道信号的编码数据的装置。
本发明可以允许多通道信号的改进编码。可以得到编码(和解码)处 理过程的改进的质量和/或有效的数据速率。可以得到具有高质量-数据速 率比的编码信号的有效传输。
尤其是,可以得到预测数据的改进的编码。具体地,使用编码的反射 矩阵来传输对于多通道信号的预测数据,可以允许信号的高性能编码。具 体地,编码可包括参数的量化,以及量化误差的影响可以通过反射矩阵的编码而被緩和且/或控制。
反射矩阵可以是前向和/或后向反射矩阵。多通道信号例如可以是立 体声或环绕声音频信号、或者例如可以是一幅图像的不同行。
按照本发明的可选特征,反射矩阵是正规化(norma 1 ized)的反射矩阵。
这可以允许改进的性能,以及可以具体地允许导致改进的编码质量对 数据速率比的编码。
按照本发明的可选特征,正规化的反射矩阵或是正规化的前向反射矩 阵或是正规化的后向反射矩阵,以及编码的数据还包括正规化前向反射矩 阵和正规化后向反射矩阵的相关数据链接参数。
相关数据链接参数例如可以是与正规化前向反射矩阵和正规化后向 反射矩阵相关联的协方差矩阵。相关数据链接参数可以使能从正规化反射 矩阵重新构建前向和后向反射矩阵。
这可以允许改进的性能,以及可以具体地允许一种导致改进的编码质 量对数据速率比的编码,因为仅仅需要包括进用于或是正规化前向反射矩 阵或是正规化后向反射矩阵的其中之一 的数据。
按照本发明的可选特征,编码装置包括用于分解反射矩阵以生成分解 的反射矩阵和用于编码该分解的反射矩阵以生成编码的反射矩阵数据的 装置。
这个特征可以允许改进的编码和/或实际的实现。预测数据的更有效 编码可以从矩阵分解的结果得到。在许多情形下,对于分解的矩阵数据可 以得到与对于传统的单通道预测数据相类似的特征,且可以使用类似的编 码和特定的量化技术。因此,在许多情形下可以得到改进的后向兼容性。
按照本发明的可选特征,编码装置被安排成从分解的反射矩阵来确定 特征多项式,以及分解的反射矩阵的编码包括特征多项式的编码系数。
按照本发明的可选特征,所述分解是本征值分解。
本征值分解可以提供特别有利的性能。例如,可以生成特别适用于编 码以及尤其是量化的数据,由此,允许高质量-数据速率比性能。替换地 或另外地,该特征可以允许实际的实现。
按照本发明的可选特征,编码的反射矩阵数据包括以下组中的至少一 个或多个的量化数据,即本征值数据和本征向量数据。
本征值和本征向量数据可以提供用于编码预测数据的特别有利的数
据。本征向量数据例如可包括对于本征向量的角度指示。
按照本发明的可选特征,编码装置可操作来响应于至少 一个本征值而 修改量化特性。
这可以改进性能,以及可以允许对于多通道信号的当前特性的编码的 动态最佳化。
按照本发明的可选特征,所述分解是奇异值分解(SVD)。 奇异值分解可以提供特别有利的性能。例如,可以生成特别适用于编
码以及尤其是量化的数据,由此,允许高质量-数据速率比性能。替换地
或另外地,该特征可以允许实际的实现。
按照本发明的可选特征,编码的反射矩阵数据包括至少一个奇异值的
量化数据。
奇异值数据可以提供用于编码预测数据的特别有利的数据。 按照本发明的可选特征,编码装置可操作来响应于至少一个奇异值而 修改量化特性。
这可以改进性能,以及可以允许对于多通道信号的当前特性的编码的
动态最佳化。
按照本发明的可选特征,编码装置包括用于通过分解的反射矩阵的参 数的量化而生成编码的反射矩阵数据的装置。
可以得到改进的性能,和/或可以使实现变得容易。量化可包括非线 性映射和/或非均勻量化。具体地,在许多实施例中,本发明可以允许类 似于4^应用于传统单通道信号的那些的量化技术,诸如对数面积比(LAR) 或反正弦表示法。
按照本发明的第二方面,提供了 一种用于解码多通道信号的解码器, 包括用来接收对于多通道信号的编码数据的装置,该编码数据包括对于
多通道信号的反射矩阵的编码反射矩阵数据;用于通过解码反射矩阵数据 而确定反射矩阵;从反射矩阵确定对于多通道信号的线性预测编码参数矩
道信号的装置。
本发明可以允许多通道信号的改进解码。可以得到编码和解码处理过 程的改进的质量和/或有效的数据速率。可以得到具有高质量-数据速率比 的编码信号的有效的传输和接收。
按照本发明的第三方面,提供了一种编码多通道信号的方法,包括
确定对于多通道信号的线性预测编码参数矩阵;从线性预测编码参数矩阵 生成反射矩阵;编码反射矩阵以生成编码的反射矩阵数据;以及生成包括 反射矩阵数据的对于多通道信号的编码数据。
按照本发明的第四方面,提供了一种解码多通道信号的方法,包括 接收对于多通道信号的编码数据,该编码数据包括对于多通道信号的反射 矩阵的编码反射矩阵数据;通过解码反射矩阵数据而确定反射矩阵;从反 射矩阵确定对于多通道信号的线性预测编码参数矩阵;以及根据线性预测 编码参数通过线性预测解码而生成多通道信号。
按照本发明的第五方面,提供了一种编码的多通道信号,包括对于反 射矩阵的编码反射矩阵数据,该反射矩阵与多通道信号的线性预测编码参 数矩阵相关联。
按照本发明的第六方面,提供了一种计算机程序产品,用于执行编码 和/或解码多通道信号的方法。
按照本发明的第七方面,提供了 一种用于发送多通道信号的发送机, 包括用来确定对于多通道信号的线性预测编码参数矩阵的装置;用于从 线性预测编码参数矩阵生成反射矩阵的装置;用于编码反射矩阵以生成编 码的反射矩阵数据的编码装置;用于生成包括反射矩阵数据的对于多通道 信号的编码数据的装置;以及用于发送编码数据的装置。
按照本发明的第八方面,提供了 一种用于接收多通道信号的接收机, 包括用来接收对于多通道信号的编码数据的装置,该编码数据包括对于 多通道信号的反射矩阵的编码反射矩阵数据;用于通过解码反射矩阵数据 而确定反射矩阵的装置;用于从反射矩阵确定对于多通道信号的线性预测 编码参数矩阵的装置;以及用于根据线性预测编码参数通过线性预测解码 而生成多通道信号的装置。
按照本发明的第九方面,提供了 一种用于传输多通道信号的传输系
统,包括发送机和用于接收多通道信号的接收机,其中发送机包括用来
确定对于多通道信号的线性预测编码参数矩阵的装置;用于从线性预测编
码参数矩阵生成反射矩阵的装置;用于编码反射矩阵以生成编码的反射矩
阵数据的编码装置;用于生成包括反射矩阵数据的对于多通道信号的编码
数据的装置;和用于发送编码数据的装置;而接收机包括用于接收编码
数据的装置;用于通过解码反射矩阵数据而确定反射矩阵的装置;用于从 反射矩阵确定对于多通道信号的线性预测编码参数矩阵的装置;以及用于
根据线性预测编码参数通过线性预测解码而生成多通道信号的装置。
按照本发明的第十方面,提供了一种发送多通道信号的方法,包括 确定对于多通道信号的线性预测编码参数矩阵;从线性预测编码参数矩阵 生成反射矩阵;编码反射矩阵以生成编码的反射矩阵数据;生成包括反射 矩阵数据的对于多通道信号的编码数据;以及发送该编码数据。
按照本发明的第十一方面,提供了一种接收多通道信号的方法,包 括接收对于多通道信号的编码数据,该编码数据包括对于多通道信号的 反射矩阵的编码反射矩阵数据;通过解码反射矩阵数据而确定反射矩阵; 从反射矩阵确定对于多通道信号的线性预测编码参数矩阵;以及根据线性 预测编码参数通过线性预测解码而生成多通道信号。
按照本发明的第十二方面,提供了 一种用于发送和接收多通道信号的 方法,包括确定对于多通道信号的线性预测编码参数矩阵;从线性预测 编码参数矩阵生成反射矩阵;编码反射矩阵以生成编码的反射矩阵数据; 生成包括反射矩阵数据的对于多通道信号的编码数据;发送编码数据;接 收对于多通道信号的编码数据;通过解码反射矩阵数据而确定反射矩阵; 从反射矩阵确定对于多通道信号的线性预测编码参数矩阵;以及根据线性 预测编码参数通过线性预测解码而生成多通道信号。
按照本发明的第十三方面,提供了一种包括如前所定义的编码器的音 频记录设备。
按照本发明的第十四方面,提供了一种包括如前所定义的解码器的音 频播放设备。
按照本发明的第十五方面,提供了一种编码的多通道信号,包括对于 多通道信号的编码数据,该编码数据包括对于多通道信号的反射矩阵的编 码反射矩阵数据,该反射矩阵对应于用于多通道信号的基于线性预测编码 的线性预测编码参数矩阵。
按照本发明的第十六方面,提供了其上存储有这样的信号的贮存媒体。
从下文描述的实施例将明白本发明的这些和其它方面、特征与优点, 并将参照实施例对之进行阐述。
下面参照附图,仅仅借助例子,来描述本发明的实施例,其中


图1显示按照本发明的某些实施例的、用于立体声音频信号的编码 图2显示按照本发明的某些实施例的、用于立体声音频信号的解码
器;
图3显示按照本发明的某些实施例的、用于立体声音频信号的编码器 的单元;
图4显示按照本发明的某些实施例的、用于立体声音频信号的解码器 的单元;
图5显示按照本发明的某些实施例的、用于编码器的可能的处理步骤 的一个特定例子;
图6显示按照本发明的某些实施例的、用于编码器的可能的处理步骤 的一个特定例子;
图7显示按照本发明的某些实施例的、用于编码器的可能的处理步骤
的一个特定例子;以及
图8显示按照本发明的某些实施例的、用于多通道信号通信的传输系统。
以下的说明集中在本发明的可应用于编码和解码立体声音频信号的 实施例。然而,将会理解,本发明并不限于这种应用,而是可应用于许多 其它多通道信号。
图1显示按照本发明的某些实施例的、用于立体声音频信号的编码 器。编码器IOO接收由x,和X2表示的数字化(采样的)左和右音频信号。
为了清晰和简明起见,假设X,和X2只包括实值,但将会理解,在某些实施
例中,这些值可以是复数。
该编码器处理在个体帧中的采样的输入信号Xi、 x2。因此,输入信号 x卜X2被分段成给定尺寸(例如,相应于20毫秒间隔)的多个样本块。该 编码器然后继续去生成对于每个个体帧的预测数据和残留信号。
立体声样本Xh X2被馈送到预测控制器101,它确定在编码和解码处 理过程期间要被应用的预测滤波器的参数。分析的结果^^皮编码以生成结果 数据b ,,其被馈送到参数解码器103,参数解码器103从编码数据^再生 预测参数。参数解码器10 3具体地应用与将在解码器中应用的相同的算法 和规则,由此确保被使用于编码的预测参数是与将被使用于解码的预测参 数基本上相同的。换句话说,由预测控制器101引入的任何编码误差或不
精确将等同地影响编码器和解码器的预观'J滤波器。
参数解码器103被耦合到线性预测分析器105,它使用由参数解码器 103确定的参数来实施线性预测滤波器。线性预测分析器105此外接收输 入信号样本x,和X2,以及确定在预测值与实际输入样本之间的误差信号y,
和y2。
误差信号yi和y2祐^t送到编码单元107,编码单元107编码和量化信 号y!和y2,以及生成相应的比特流b,和b2。另外,编码单元107可以生成 表示各种编码或信号特性的附加数据b。,包括例如采样速率、量化特性等等。
编码单元107和预测控制器101被耦合到复用器109,它把由编码器
生成的数据组合成组合的编码信号b。尤其是,编码的数据bn,、b。、卜和b2
可被组合成单个比特 流。
具体地,线性预测分析器105可以生成由下式给出的误差样本
<formula>formula see original document page 13</formula> (1)
<formula>formula see original document page 13</formula> (2)
其中N被称为预测阶数(即,^1考虑用于预测的过去的多通道输入样 本的数目)。预测矩阵Ak (k=l, ...,N)由下式给出
<formula>formula see original document page 13</formula> (3)
在z域中,这产生
<formula>formula see original document page 13</formula> (4)
<formula>formula see original document page 13</formula>(5)
其中Xjz)、 X2(z)、 YJz)和YJz)分别为Xl、 x2、 y,和y2的z-变换。 将会理解,通过用具有下式的全通滤波器2(力改变公式(4)和(5)的延 迟算子z—',可以得到替换的线性预测系统
<formula>formula see original document page 13</formula> (6)
其中|入|<1。 这相应于多通道巻曲线性预测(Warped Linear Prediction, WLP)系统。而且,基于Laguerre的线性预测系统可^皮映射 到WLP系统上。因此将很清楚,所建议的概念和办法同样地可应用于这样 的系统中的预测矩阵。
图2显示按照本发明的某些实施例的、用于立体声音频信号的解码器
200。
解码器200包括多路分解器201,它接收来自解码器100的比特流b。 多路分解器201继续去把比特流b分离成不同的比特流bm、 b。、 b,和b2。
解码器200还包括反向编码单元203,它被々贵送以比特流b。、 b,和b2。 反向编码单元203继续去生成分别作为yi和y2的重建的误差信号y、和
解码器200还包括预测参数处理器20乙它被馈送以比特流bm,并由此 确定预测参数。具体地,预测参数处理器207优选地确定被使用来重建多 通道信号的线性预测滤波器的滤波系数,基本上与在编码器100中使用的 办法相同。
预测参数处理器207和反向编码单元203 ^L耦合到线性预测合成器 205。线性预测合成器205在预测参数和误差信号y,,和y,2的基础上重建 多通道信号为x,,和x,2。
在图1和2的例子中,编码信号的预测参数由对于反射矩阵的编码反 射矩阵数据来代表,其中该反射矩阵与多通道信号的线性预测编码参数矩 阵相关联。
具体地,预测控制器101可以确定预测矩阵Ak并把这些矩阵映射到反 射矩阵。反射矩阵然后可被使用来生成编码的预测数据b^。同样地,预测 参数处理器207可以从接收的比特流bm确定反射矩阵,然后可以把反射矩 阵转换成预测矩阵A,k。反射矩阵被预测控制器101编码,以及反射矩阵的 使用允许高度有效的编码,它可以保持从单通道情形的反射系数知道的许 多有利的参数特性。
图3更详细地显示图1的预测控制器101。预测控制器101包括预测 参数生成器301,它生成对于多通道信号的线性预测编码参数矩阵。具体 地,预测参数生成器301 ^接收立体声输入样本Xl、 X2并生成预测矩阵Ak。
将会理解,可以使用任何适当的用于确定预测矩阵Ak的方法,而不会 有损本发明。例如,预测矩阵可被确定为牵涉到正规方程的最小平方最佳
化问题的解。在输入数据窗的情形下求解正规方程的有效方法(自相关方
法)由block-Levinson算法给出,block-Levinson算法在P. Delsarte 和Y. V. Genin的"Multichannel singular predictor polynomials (多 通道奇异预测器多项式),,,IEEE Trans. Circuits Systems, Vol. 35, 1988, 第190-200页中被公开。
预测参数生成器301被耦合到反射矩阵生成器303,后者从线性预测 编码参数矩阵生成反射矩阵。如果使用Mock-Levinson算法,则预测参 数生成器301和反射矩阵生成器303通常被有效地组合成单个功能单元。
对于单通道信号,已知在线性预测编码中使用的预测滤波器由多个反 射系数来表征。在语音信号中,预测滤波器是基于用不同直径的管道仿真 声道的物理模型。在每个不连续点,反射系数可表示一部分信号被向前发 送,而另一部分信号被反射。
对于单通道信号,通过使用反射系数模型可以得到多个优点。尤其 是,可以例如通过使用非线性映射、诸如反正弦或LAR (对数面积比)表 示法而达到反射系数的有效编码。
然而,对于多通道信号,还不知道对预测参数进行编码(包括量化) 的有效方式。使用基于反射系数的简单模型并不是切实可行的,因为多通 道系统不能用简单的系数来精确地代表。而且,预测矩阵数值的量化导致 甚至是对于较小的量化误差也在频域中有很大的失真,并且甚至可以导致 不稳定的合成滤波器。
在图1的编码器100中,反射矩阵生成器303生成反射矩阵。具体地, 对于多通道信号,可以使用与对于单通道编码器的类似的物理模型,但因 为不同的信号可以在管道不连续处交互作用,反射系数由反射矩阵来取 代。
因此,单通道情形的反射系数被改变成反射矩阵。然而,反射系数现 在变为反射矩阵的事实,可导致直接使用对于反射系数的量化策略是不适 当的。尤其是,直接使用反正弦或LAR表示法可能导致不想要的性能,因 为比起简单反射系数的量化误差,系统的特性和性能灵敏度对于矩阵分量 的量化误差是更敏感的。
在图1的编码器中,反射矩阵生成器303被耦合到反射参数编码器
bm。反射参数编码器305被耦合到复用器109,复用器109通过把比特流
b^与来自编码单元107的比特流b。、 b和b2复用而生成对于多通道信号的 编码数据b。因此,在编码信号中,-故使用于编码和解码的预测参数由表 示反射矩阵参数的数据来代表。
在图1的实施例中,反射矩阵可以是直接生成的前向和后向反射矩 阵。具体地,对于多通道系统,前向和后向预测系统在没有附加知识的情 况下不能直接互相构建。因此,为了允许解码器从反射矩阵重建预测参 数,可以发送前向和后向反射矩阵两者。
然而,为了减小数据速率和改善编码效率,前向和后向反射矩阵可以 例如由反射矩阵生成器303或反射参数编码器305来映射到正规化反射矩 阵上。在这样的实施例中,由反射参数编码器305编码并被包括在比特流 b,n中的反射矩阵可以仅仅是前向或后向反射矩阵之一。另外,可以确定附 加的协方差矩阵,它允许从后向反射矩阵确定前向反射矩阵,或反之亦 然。
具体地,利用来自这一个附加的协方差矩阵的信息,正规化反射矩阵 可被转译成前向和后向反射矩阵。
可以通过^ -Zjc,(")x,(")从输入信号来确定具有项n,j(i, j = l, 2)的协
方差矩阵R。。前向/后向矩阵、正规化反射矩阵和协方差矩阵之间的关系 在 P.Delsarte 详口 Y.V. Genin 白勺"Mul t ichannel singular predictor polynomials (多通道奇异预测器多项式)",IEEE Trans. Circuits Systems, Vol.35, 1988,第190-200页中描述。
因此,在图l的系统中,编码信号包括基于反射矩阵的预测参数的数 据。更具体地,建议使用正规化反射矩阵连同协方差矩阵,而不是使用前 向和后向反射矩阵,因为这可以减小编码信号的数据速率。
更具体地,预测矩阵Ak (k=l, ...,N)可以分别纟皮映射到前向和后向反射 矩阵rk和r,k。这种映射是可逆的,但实际上导致矩阵数目的加倍。
优选地,预测矩阵Ak分别纟皮映射到正规化前向和后向反射矩阵Ek和 E,k。 Ek和E,k之间的关系由E^E,p哈出,其中'表示转置。这样的简单关系
对于rk和r'k之间的关系是不存在的,以及具体地允许可以确定协方差矩阵
R。,它可被应用来使得映射(AJ —(Ek)是可逆的。这个矩阵R。包含输入信 号的互相关矩阵(或它的缩放版本)。因此,通过使用正规化反射矩阵之 一 (或是Ek或是E,k)加上R。,生成需要发送的N+l个矩阵,而不是对于 传输前向和后向反射矩阵所需要的2N个。
而且,正规化反射矩阵具有有利的属性。如果使用输入数据窗(也称 为自相关方法)得出预测参数,则正规化反射矩阵是收缩矩阵
(contracting matrix)(本征值和奇异值的绝对值小于1),并且因此 相关联的线性预测合成滤波器保证是稳定的。
图4更详细地显示图2的预测参数处理器207。预测参数处理器207 包括接收单元401,它接收来自多路分解器201的编码反射矩阵数据bm。 接收单元401被耦合到反射矩阵再生器403,它通过解码反射矩阵数据而 确定反射矩阵。例如,如果由反射参数编码器305进行的编码包括非均匀 量化,则反射矩阵再生器403把逆非均匀函数施加到所接收的参数值。
反射矩阵再生器4Q3还被耦合到预测参数再生器405,后者从反射矩 阵确定对于多通道信号的线性预测编码参数矩阵。具体地,预测参数再生 器405可以从正规化反射矩阵(或是Ek或是E'k)和协方差矩阵R。生成预 测参数A'k。
预测参数再生器405被耦合到线性预测合成器2。5,后者被馈送以再 生的预测参数A,k。线性预测合成器205然后通过在对信号y、和y、操作的 多通道线性预测合成滤波中应用预测参数A,k而继续去再生多通道信号。
在某些实施例中,反射矩阵可被分解以生成分解的反射矩阵,以及可 以通过编码且尤其是量化所分解的反射矩阵的参数而生成编码的反射矩 阵数据。因此,具体地,反射参数编码器305 (或等价地反射矩阵生成器 303 )可以具体地通过分解正规化的前向和/或后向反射矩阵而生成分解的 反射矩阵。同样地,反射矩阵再生器403可以通过执行分解的逆操作而生 成正规化的前向和/或后向反射矩阵。
在本例中,反射矩阵被分解成导致有效地保持主要矩阵刻画(major matrix characterization )的结构。尤其是,可以4吏用本4正值分解(EVD ) 和/或奇异值分解(SVD)。
这种办法的优点在于,本征值和奇异值具有的特性通常类似于被使用 于单通道信号的反射系数的许多特性。尤其是,量化的影响是相当的,并 且因此反射参数编码器305可以使用非常类似于被用于单通道反射系数的 量化过程。而且,由这些分解而得到的附加信息(具体地是EVD的本征值 和SVD的酉矩阵)可^f皮有效地量化。如果响应于本征值或奇异值而调整量 化精度,则可以得到特别有利的性能。
在本征值分解的情形下,可以使用以下的公式 J^-附『1, (7)
其中W是矩阵(被适当地正规化)本征向量,以及E是在它的对角线 上包含本征值(e!和e2)的对角矩阵,以及假设这两个本征值是不相同的。 E的行列式等于行列式Ek。本征值的特性类似于对于单通道信号的反射系 数的特性。然而,对于实矩阵Ek,本征值可以是实数或可以表现为复共轭 对。在任何情形下,本征值的绝对值小于l。
在实本征值的情形下,它们可以以与对于单通道信号的反射系数相同 的方式被加工处理,且具体地,可以使用在范围(-l,l)内的非均匀量化 (包括映射到反正弦或LAR,后随在这些域中的均匀量化)。对于复本征 值,可以使用不同的策略。例如,可以得到半径,并以与实本征值相似的 方式对它进行映射,以及可以按取决于半径的精度来确定和量化复数的角 度。在这种情形下,比特流bM可包括关于数值是实数还是复数的指示。
在其它实施例中,两个本征值(复共轭或实数)被使用来生成实二阶 多项式P"即所谓的矩阵Ek的特征多项式。该二阶多项式的数据然后可以 通过将其映射到反射系数(并且使用反正弦或LAR表示法)或映射到LSF 随后进行量化,来进行发送。
对于本征向量,可以进一步区分两种情形。如果本征值是实数且不相 同,则在W中存在两个实本征向量,该W可以用以下两个角度来描述
^fcos(a) cos(P)) (8)
这里优于SVD说明的优点在于,每个本征值被耦联到一个本征向量, 以使得可以直接从相关联的本征值来确定角度的量化的精度。替换地,矩 阵W可被描述为
^ = , (9)
其中t是按照下式的正交矩阵 'cos(y) -sinCy)、
sinCy) cos("Y)
以及W2由下式给定:
(10) <formula>formula see original document page 19</formula>(11)
、sin(S) -sin(S)乂
其中不失一般性,0<|s|<tt/2。 a、 (3和y、 S之间的关系是坐标变换。 角度Y基本上是a和(3的中间(halfway)。角度s的两倍是角度a和p之间的
差值。由于参数Y的变化实际上是整个系统的旋转,所以这个参数可被均 匀地量化。矩阵W的所有可能的病态(ill-conditioning )归于W"其佳_
之作为行列式-sin(2S)。所以,量化S可以以这样的方式来完成,即在 该行列式中的相对变化大致是恒定的。
在复本征值的情形下,复本征向量也可以用两个角度来描述,虽然与 实本征向量的情形相比对这些角度的解译是明显不同的。为了有效的数据 传输,这些角度的精度优选地耦联到复本征值,尤其是耦联到它的半径。 替换地,矩阵W可被描述为
<formula>formula see original document page 19</formula>(12)
即,用半径n、 r2和一个角度小来描述,其中0<|(])|<兀。由于允许对 本征向量进行缩^L的事实,这可^^皮重新写为
<formula>formula see original document page 19</formula> (13)
其中
其中ce!T和s=± 1,以及 e舛
应当指出,l的行列式等于±1,以及l的行列式等于2jsin(2(J))。参 数c可以在对数标度上被均勻地量化。角度(()可以类似于参数s那样地^L加 工处理。
如果本征值是实数且相同,则分解公式7不成立,替代地可以使用以 下的分解
<formula>formula see original document page 19</formula>(15)
<formula>formula see original document page 19</formula>
(16)
其中e-e,-e2是本征值,I是单位矩阵,ot是与本征向量相关联的角度, 以及d是常数。如以前那样,本征值可以被映射到二阶多项式(P2),映 射到反射系数并在反正弦或LAR域中被量化。角度a可以有效地均勻量化。 参数d是表示由a定义的矩阵的权重与单位矩阵I相比较的比值。参数d 可以在对数域中^皮量化。
在解码器处,所接收的本征向量的参数必须被解译。这个解译取决于 本征值的特性,因为对于实的且不相同的本征值、复本征值、和相同的本 征值存在不同的参数。因此,接收机必须确保不会由于本征值按所施加 的量化的函数改变它们的性质(character)而出现错误(例如,因为复 本征值的虚数值被量化为零,导致实量化值而不是复量化值)。
可以使用不同的策略来解决这个问题。 一个选项是在比特流中指示本 征值的原始性质。如果本征值因为量化而已经被改变的话,可以由解码器 使用这个指示来恢复本征值的本性。另一个选项是以这样的方式来控制本 征值量化,即所量化的本征值的性质(实数、复数、相同的)保持为不改 变。例如,复数值的量化不可能包括零值。再一个选项是(在编码器中) 检验本征值的性质是否已由于量化而改变,以及选择对应于新性质的适当 参数。
后者的程序过程的例子如下。如果在本征值的量化平面中,复共轭对 和实本征值被映射到相同的表示上(例如,LAR),则可j艮设地,也有被 映射到这个表示上的、有e产e2的本征值对。粗略地,对于这个量化片 (quantization tile),乘积e"2基本上是恒定的。参凄ty、 5或小、c因 此可被省略并由最佳参数d、 a来替代。由于在解码器处量化策略是已知 的,所以解码器知道对于每个量化的本征值对、该量化策略是否已改变了 本征值性质。在那种情形下,两个本征值被取为所接收的本征值(即,实 数且相同)的几何平均值,以及本征向量信息;故(正确地)解译为是d和 a。
图5显示按照本发明的某些实施例的、用于编码器的可能处理步骤的 一个特定例子。显然,许多变化是可能的,例如,LAR映射可以由反正弦 映射来替代。从输入矩阵生成本征向量参数是由参数ei和e2驱动的,正如 先前讨论的。正如提到的,当生成本征向量参数时,考虑由于量化造成的 在这些数值的性质(实数/复数)方面的可能混淆。更精巧地,这可以基 于所量化的本征值的性质来完成,因为这是在解码器处实际上可得到的信
解码器实施逆处理过程。它接收量化的参数,并重建e,和e2。在给定 这些数值后,接收机知道哪个本征向量数据被包含在比特流中或者是y、 S或者是s、 c、小或者是oc、 d。然后可以构建矩阵Ek。
下面将描述一个特定的例子,其中应用反射矩阵的奇异值分解。
在奇异值分解的情形下,可以使用以下的公式
五,匿', (17)
其中通常U和V是酉矩阵,以及S是包含奇异值的对角矩阵 0)
S= n' (18)
其中ct一0。假定Ek是实矩阵,则所有的矩阵U、 S和V是实的。 为了方便起见,在所描述的特定例子中使用稍微不同的定义。在本例
中,S的对角元素不限于非负数,而是替代地酉矩阵U和V限于旋转矩阵。
S的对角元素仍旧被称为奇异值。
对于稳定的线性预测合成滤波器,| |<1。
奇异值的特性类似于反射系数的那些特性,并因而可以以与对于单通 道信号的反射系数相似的方式来对它们进行加工处理,以及具体地,可以 使用在范围(-l,l)内的非均匀量化(包括映射到反正弦或LAR,后随在 这些域中的均匀量化)。
作为特定的例子,可以量化最大的奇异值并以反正弦、LAR或LSF表 示法来发送它,以及可以量化奇异值的绝对值之间的比值r (0《r《l), 并将之与符号参数一起发送。优选地,r被映射到对数标度,然后被均匀 地量化。在另一个替换例中,当把两个奇异值解译为反射系数时,可以构 建二阶最小相位多项式,它可以被量化并以标准方式(反正弦、LAR或LSF) 被发送。
矩阵u和V相应于旋转,这样,这两个矩阵的每个被耦联到单个参数 旋转角度。这些角度处在有限的范围
内,以及可以按取决于奇异 值的精度被量化。在奇异值等于零的极端情形下,任何角度都满足,所以 需要的精度为无(none)。在大的奇异值(接近于单位元素(unity)) 的情形下,非常精细的分辨率将是适当的。
用于描述U和V的角度的量化格栅的精度可以是基于不同的策略。例 如,可以在最大绝对奇异值或它们的绝对值的(算术或几何)平均值的基
础上来选择该精度。可替换地,用oc和p旋转角度来表示U=R (a)和VT-R (-P)后,可以得到以下公式
<formula>formula see original document page 22</formula>(19)
由此可以看出,系统的行列式I-z—^k不依赖于(a+(3)/2。所以,角度 y=(a+(3)/2可以用均匀量化器进行量化。角度S-(ot-(3)/2是行列式中的因 子,且它可以取决于奇异值而被最好地量化。
尤其是,S= (a-p) /2可以被量化成使得与矩阵相关联(并确定本征值) 的特征方程保持不变。这可以通过利用下式引入反射系数k而完成
<formula>formula see original document page 22</formula> (20)
可以使用用于操控反射系数的单通道方法,例如,映射到LAR或反正 弦域。优选地,在k的计算中cn和G2是量化的 和cj2,因为这个关系在解 码器中必须被倒转,以及那里仅有量化的奇异值是可得到的。解码器映射 k—S是多义的。为了解决多义性,也可以发送一个额外的比特s。
图6显示按照本发明的某些实施例的、用于编码器的可能处理步骤的 一个特定例子。显然,许多变化是可能的,例如,LAR映射可以由反正弦 映射来替代。正如提到的,反射系数k不单是5的而且也是 、①的函数, 以及对于在解码器处的倒转,使用量化值①、①可以是有利的,因为这些 值是在解码器处可得到的。
解码器实施逆处理过程。它接收量化的参数,并重建①和①。在给定 这些值后,接收机能够从k和s重建S。从y和5,可以重建旋转矩阵U和V。 随后,可以重建矩阵Ek。
在某些实施例中,本征值和奇异值分解两者可以一起被使用。因此, 反射矩阵可被分解为本征值和奇异值分解两者。组合在二阶多项式(P2) 中的本征值和量化属于这个多项式的反射系数(k,和k2),给出了对于特
征方程的精确控制(如对于EVD方法)。奇异值可被映射到比值C= I G!/CT2 I
上。这样的比值可以在对数标度上有效地均匀地量化。参数a和(3可被组合 成丌(a+(3)/2 (如在SVD方法中那样)以及可被均匀地量化。
图7显示按照本发明的某些实施例的、用于编码器的可能处理步骤的 一个特定例子。显然,许多变化是可能的,例如,LAR映射可以由反正弦
映射来替代。
解码器实施逆处理过程。它接收量化的参数,并重建e!和e2。在给定 这些值和c后,接收机能够重建S。从e,、 e2、 。、 CT2可以重建参数S。类 似于SVD情形,会出现多义性,这可以通过额外的比特s来解决。从S和y, 可以构建旋转矩阵U和V。
在所有的这三个例子中(即,EVD、 SVD和组合的EVD/SVD),每个(正 规化的)反射矩阵导致两个系数(E中的本征值或S中的奇异值),通过 某种调整,它们可以像单通道线性预测系统中的反射系数那样被加工处 理。伴随矩阵(V和U,或W)可以按取决于本征值或奇异值的特性的精度 (比特数)和/或解译而被编码。
如前所述,逆映射(EJ —(Pk)需要具有协方差矩阵(正定的厄米特矩 阵)性质的附加矩阵R。
产11 八2 r21 r22
(21)
其中r12=r21。这可^皮重写为
r22
p p
(p p力
(22)
其中『V^^和相关系数P-WV^"22。相关系数是介于-l与l之间的
值,以及可以以围绕o值的较低精度、在非均勻格栅上被有效地量化。数
值pi可以在dB标度上被有效地量化。数值本身对于映射(EJ — (PJ
并不重要,不需要被发送。
替换地,矩阵R。可以通过前面提到的机制(SVD或EVD)被分解,在
这种情形下,仅仅需要发送奇异值(或本征值)与一个角度的比值(由于 这个矩阵的特定的结构)。
图8显示按照本发明的某些实施例的、用于多通道信号通信的传输系 统800。传输系统800包括发送机801,它通过网络805 —具体地可以是互 联网一^皮耦合到接收机8 03。
在这个特定的例子中,发送机是信号记录设备而接收机是信号播放设 备,但将会理解,在其它实施例中,发送机和接收机可被使用于其它应用。 例如,发送机和/或接收机可以是代码转换功能性的一部分,以及例如可 以提供到其它信号源或目的地的对接。
在这个支持信号记录功能的特定例子中,发送机801包括数字化器
807,它接收模拟多通道信号,然后通过采样和模拟-数字转换将该信号转 换成数字PCM信号。
发送机801 ;故耦合到图1的编码器100,编码器100如前所述地编码 PCM信号。编码器100被耦合到网络发送机809,其接收编码信号并接口 到互联网,通过互联网805发送编码信号到接收机803。
接收机803包括网络接收机811,它接口到互联网805以接收来自发 送才几801的编码信号。
网络接收机811被耦合到图2的解码器200。解码器200接收编码信 号,并如前所述地解码该信号。
在这个支持信号播放功能的特定例子中,接收机803还包括信号播放 器813,它接收来自解码器200的解码的多通道信号,并把它呈现给用户。 具体地,信号播放器813可包括数字-模拟转换器、放大器和对于输出多 通道音频信号所需要的扬声器。
将会理解,为了清晰起见,以上的说明参照不同的功能单元和处理器 来描述本发明的实施例。然而,很明显,可以使用在不同的功能单元或处 理器之间的任何适当的功能性分布,而不会有损本发明。例如,被例示成 由分开的处理器或控制器执行的功能性可以由同一个处理器或控制器来 执行。因此,对特定功能单元的引用仅仅被看作是对用于提供所描述的功 能性的适当装置的引用,而不表示严格的逻辑或物理结构或组织。
本发明可以以任何适当的形式来实施,包括硬件、软件、固件或其任 何组合的形式。本发明可以任选地至少部分地^皮实施为在一个或多个数据 处理器和/或数字信号处理器上运行的计算机软件。本发明的实施例的单 元和部件可以以任何适当的方式^皮物理地、功能地和逻辑地实施。事实 上,所述功能性可以在单个单元中、在多个单元中或作为其它功能单元的 一部分被实施。这样,本发明可以在单个单元中被实施,或者可以被物理 地和功能地分布在不同的单元和处理器之间。
虽然本发明是结合某些实施例来描述的,但本发明不打算限于这里阐 述的特定形式。而是,本发明的范围仅仅由所附权利要求来限制。另夕卜, 虽然特征可能表现为是结合特定的实施例描述的,但本领域技术人员将认 识到,所描述的实施例的各种特征可以按照本发明被组合。在权利要求 中,术语"包括"不排除其它单元或步骤的存在。
此外,虽然各个地列出,但多个装置、元件或方法步骤可以由例如单 个单元或处理器来实施。另外,虽然各个特征可能被包括在不同的权利要 求中,但这些特征有可能被有利地组合,以及在不同的权利要求中包括, 并不意味着特征的组合不是可行的和/或不是有利的。另外,在一种类别 的权利要求中包括一个特征,并不意味着限于这个类别,而是表示如适合 的话该特征同样地可应用于其它权利要求类别。而且,在权利要求中特征 的次序并不意味着特征必须按之工作的任何特定次序,尤其是,在方法权 利要求中各个步骤的次序并不意味着必须按这个次序来执行这些步骤。相 反地,可以按任何适当的次序来执行这些步骤。另外,单数的引用不排除 复数。因此,对"一"、"一个"、"第一"、"第二"等等的引用并不排除复 数。在权利要求中的参考标号仅仅被提供来作为阐明性的例子,无论如何 不应当被解读为限制权利要求的范围。
权利要求
1.一种用于编码多通道信号的编码器(100),包括-用于确定对于多通道信号的线性预测编码参数矩阵的装置(301);-用于从线性预测编码参数矩阵生成反射矩阵的装置(303);-用于编码反射矩阵以生成编码的反射矩阵数据的编码装置(305);以及-用于生成包括反射矩阵数据的对于多通道信号的编码数据的装置(109)。
2. 权利要求1中要求的编码器,其中反射矩阵是正规化的反射矩阵。
3. 权利要求2中要求的编码器,其中正规化的反射矩阵或是正规化 的前向反射矩阵或是正规化的后向反射矩阵,以及该编码数据还包括正规 化前向反射矩阵和正规化后向反射矩阵的相关数据链接参数。
4. 权利要求l的编码器,其中编码装置(305 )包括用于分解反射矩 阵以生成分解的反射矩阵和用于编码该分解的反射矩阵以生成编码反射 矩阵数据的装置。
5. 权利要求4的编码器,其中编码装置(305 )被安排成从分解的反 射矩阵确定特征多项式,以及其中分解的反射矩阵的编码包括该特征多项 式的编码系数。
6. 权利要求4的编码器,其中所述分解是本征值分解。
7. 权利要求6的编码器,其中编码的反射矩阵数据包括以下组中的 至少 一个或多个的量化数据-本征值数据;和 -本征向量数据。
8. 权利要求6的编码器,其中编码装置(305 )可操作来响应于至少 一个本征值而修改量化特性。
9. 权利要求4的编码器,其中所述分解是奇异值分解(SVD)。
10. 权利要求9的编码器,其中编码的反射矩阵数据包括至少一个奇 异值的量化数据。
11. 权利要求9的编码器,其中编码装置(305 )可操作来响应于至少一个奇异值而修改量化特性。
12. 权利要求4的编码器,其中编码装置(305 )包括用于通过分解 的反射矩阵的参数的量化而生成编码的反射矩阵数据的装置。
13. —种用于解码多通道信号的解码器,包括-用于接收对于多通道信号的编码数据的装置(401),该编码数据 包括对于多通道信号的反射矩阵的编码反射矩阵数据;-用于通过解码反射矩阵数据而确定反射矩阵的装置(403 );-用于从反射矩阵确定对于多通道信号的线性预测编码参数矩阵的装 置(405 );以及-用于根据线性预测编码参数通过线性预测解码而生成多通道信号的 装置(205 ) D
14. 一种编码多通道信号的方法,包括-确定对于多通道信号的线性预测编码参数矩阵;-从线性预测编码参数矩阵生成反射矩阵;-编码反射矩阵以生成编码的反射矩阵数据;以及-生成包括反射矩阵数据的对于多通道信号的编码数据。
15. —种解码多通道信号的方法,包括-接收对于多通道信号的编码数据,该编码数据包括对于多通道信号 的反射矩阵的编码反射矩阵数据;-通过解码反射矩阵数据而确定反射矩阵;从反射矩阵确定对于多通 道信号的线性预测编码参数矩阵;以及-根据线性预测编码参数通过线性预测解码而生成多通道信号。
16. —种编码的多通道信号,包括对于反射矩阵的编码反射矩阵数 据,该反射矩阵与多通道信号的线性预测编码参数矩阵相关联。
17. —种用于执行权利要求14或权利要求15的方法的计算机程序产口O o
18. —种用于发送多通道信号的发送机(801 ),包括-用于确定对于多通道信号的线性预测编码参数矩阵的装置(301);-用于编码反射矩阵以生成编码的反射矩阵数据的编码装置(305 );-用于生成包括反射矩阵数据的对于多通道信号的编码数据的装置 (109 );以及-用于发送编码数据的装置。
19. 一种用于接收多通道信号的接收机(803 ),包括-用于接收对于多通道信号的编码数据的装置(401),该编码数据包括对于多通道信号的反射矩阵的编码反射矩阵数据;-用于通过解码反射矩阵数据而确定反射矩阵的装置(403 );-用于从反射矩阵确定对于多通道信号的线性预测编码参数矩阵的装置(405 );以及-用于根据线性预测编码参数通过线性预测解码而生成多通道信号的 装置(205 )。
20. —种用于传输多通道信号的传输系统(800 ),包括 -发送机(801 ),包括-用于确定对于多通道信号的线性预测编码参数矩阵的装置(301);-用于编码反射矩阵以生成编码的反射矩阵数据的编码装置(305 ); -用于生成包括反射矩阵数据的对于多通道信号的编码数据的装置 (109);和-用于发送编码数据的装置;以及-用于接收多通道信号的接收机(803 ),包括-用于接收编码数据的装置(401);-用于通过解码反射矩阵数据而确定反射矩阵的装置(403 ); -用于从反射矩阵确定对于多通道信号的线性预测编码参数矩阵的装 置(405 );以及-用于根据线性预测编码参数通过线性预测解码而生成多通道信号的 装置(205 )。
21. —种发送多通道信号的方法,包括-确定对于多通道信号的线性预测编码参数矩阵;-从线性预测编码参数矩阵生成反射矩阵;-编码反射矩阵以生成编码的反射矩阵数据;-生成包括反射矩阵数据的对于多通道信号的编码数据;以及-发送编码数据。
22. —种接收多通道信号的方法,包括-接收对于多通道信号的编码数据,该编码数据包括对于多通道信号 的反射矩阵的编码反射矩阵数据;-通过解码反射矩阵数据而确定反射矩阵;-从反射矩阵确定对于多通道信号的线性预测编码参数矩阵;以及 -根据线性预测编码参数通过线性预测解码而生成多通道信号。
23. —种发送和接收多通道信号的方法,包括-确定对于多通道信号的线性预测编码参数矩阵;_从线性预测编码参数矩阵生成反射矩阵;-编码反射矩阵以生成编码的反射矩阵数据;-生成包括反射矩阵数据的对于多通道信号的编码数据;-发送编码数据;-接收对于多通道信号的编码数据;-通过解码反射矩阵数据而确定反射矩阵;-从反射矩阵确定对于多通道信号的线性预测编码参数矩阵;以及 -根据线性预测编码参数通过线性预测解码而生成多通道信号。
24. —种包括按照权利要求1的编码器的音频记录设备(801 )。
25. —种包括按照权利要求13的解码器的音频播放设备(803 )。
26. —种编码的多通道信号,包括对于多通道信号的编码数据,该编码数据包括对于多通道信号的反射矩阵的编码反射矩阵数据,所述反射矩 阵对应于用于多通道信号的基于线性预测编码的线性预测编码参数矩阵。
27. —种其上存储有按照权利要求26的信号的贮存媒体。
全文摘要
多通道编码器(100)包括多通道线性预测分析器(105),用于多通道信号的线性预测编码。预测控制器(101)包括预测参数生成器(301),其生成对于多通道信号的线性预测编码参数矩阵,该参数矩阵然后被映射到反射矩阵。反射矩阵具体地可以是正规化的后向或前向反射矩阵。反射矩阵由反射参数编码器(305)来编码,并且在复用器(109)中与其它的编码数据相组合以生成对于多通道信号的编码数据。反射参数编码器(305)具体地可以使用本征值分解和奇异值分解来分解反射矩阵,且最终得到的数据可被量化以进行传输。解码器(200)接收该编码数据,并通过执行逆操作而得到预测参数。
文档编号G10L19/06GK101180675SQ200680018101
公开日2008年5月14日 申请日期2006年5月9日 优先权日2005年5月25日
发明者A·C·登布林克, A·比斯瓦斯 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1