音频编码的制作方法

文档序号：2819679阅读：140来源：国知局

专利名称：音频编码的制作方法
技术领域：
本发明总体上涉及音频编码，更具体地涉及编码一组具有相关分量的音频信号。
国际申请WO99/04505描述了一种只对在感觉上有关联的大量噪声源(诸如位于特定频率范围内噪声的全部声音能量)进行编码的方法，通过这种编码方法可以丢弃在感觉上无关的音频信息，从而获得较大比例的信号压缩。在本方法中，以频带为基础检测输入信号中类似于噪声的分量。用参数表示类似于噪声的分量，并且只发送替换后的频谱系数的全部能量。在解码器中，对于替换后的频谱系数通过插入具有希望功率的随机噪声源来重构编码的音频声道。
在多音频声道在实际中表现出一定程度的互相关联的情况下，这种直接的替换会使得产生的听觉不自然。这种不自然的感觉应归因于人耳能够辨别出来自不同方向的音频信号之间的相关性这一事实。信号之间的相关性决定了该“立体声声象”，即声音源的空间感觉。如果双声道扬声器配置的左声道和右声道信号完全相关，那么人的听觉系统将把它感知为位于扬声器之间的一个声源。如果信号不相关，它将被感知为位于左扬声器以及右扬声器的两个独立声音源。部分相关的信号将通常被感知为扬声器之间的宽广音源。负相关甚至能够导致声音源被感知为位于扬声器基座的外部。所以，如果失去了左右扬声器的声音相关性，那么想要的立体声效果也就消失了，并且听者所感觉到的声音也不太自然。
换言之，如果多音频声道产生的声音反映的是通过所述声道记录的单独音频源，那么利用非相关噪声源来重构所述音频源就会显得不自然。
在上述的申请中，试图通过编码一个比特值来补偿上述影响，在激活状态，触发一合成器以使左右声道使用相同的噪声源。在通常的非激活状态，左右声道从独立的噪声源合成。
尽管与固有使用非相关噪声源的音频声道合成相比这种配置提供了改进，但是合成的声音仍不太自然，这是因为实际上没有使用在编码音频声道中描述声道之间相关程度的信息。所以，当使用已知的方法时仅能部分地重构原始声音，并且耳朵仍旧感觉缺乏自然的听觉。
本发明的目的是提供改进的音频编码，其中利用在声道之间保留的相关度，使得在感觉上接近原始状态地重构多音频声道中分量成为可能。为了该目的，本发明提供了一种如独立权利要求中所定义的编码方法、解码方法、编码器、解码器、数据载体和信号。在从属权利要求中定义了有利的实施例。
根据本发明的第一方面，为了编码具有相关分量的一组音频信号，根据所述音频信号之间的相关性确定源的组合，当在所述组合中的源相互不相关或基本上不相关时，源的所述组合以保留相关性的方式合成所述分量。所述组合代表了各个源、以及为了合成分量应该如何组合这些源。在编码器和解码器中都可以执行这种合成。
根据本发明的实施例，音频信号中的分量由这样的源组成，所述的源用于合成在所述音频信号中至少一个频带内的、在感觉上有关联并保留了相互关系的噪声分量。这些合成源可以相互不相关。所以，这些源可以由独立的发生器容易地进行重构。
在一个优选实施例中，本发明还包括这一步骤通过为源确定一组用于合成所述源的参数和一组用于产生所述源的组合的变换参数，从而对源进行编码。
而且，本发明的优选实施例包括发送一组用于合成各个源的所述参数、并发送一组用于形成所述多个源的所述变换参数的步骤。更具体而言，所述合成参数和所述变换参数是通过正交化/去相关所述音频声道组的相关矩阵而确定的。对于音频声道之间的随时间变化的互相关，所述去相关可以是在逐帧的基础上执行的。帧的大小可以取决于时间帧，在整个所述的时间帧中，正交声道相关被认为是常量。去相关为本领域中的公知常识，例如参见J.Edward Jackson，JohnWiley&Sons公司基本分量用户手册(A User’Guide to PrincipalComponents John Wiley&Sons，Inc)，1991年，第1-25页。
本发明可优选地应用于将该音频信号组分割为一组选择频带的情况，其中至少一个频带包括类似于噪声的信号。所述音频信号中的非噪声分量可以通过正弦编码被编码。
可以对被编码并发送的音频信号进行解码，还可以合成相应的多声道的、保留了相关性的音频信号。
编码器和解码器可以是在物理上不同的信号处理设备，或呈现为单个信号处理设备中的一个或多个单元。发送可以为无线发送，或通过互联网发送，实际上，可以为任何类型的发送。还可以通过物理数据载体，诸如磁盘或CD-rom等等执行该发送。
根据附图本发明的其它目的和特征将变得显而易见，其中

图1示意性示例了根据本发明执行编码方法的编码设备；图2示意性示例了根据本发明执行编码方法的解码设备。
图1示出了编码四声道音频信号的编码器1。该音频声道由四个复合箭头2表示，每个复合箭头2表示四个声道中的一个音频声道。对于本发明，声道的实际数量是无关紧要的，很明显，这是因为只要存在一个以上的声道，本发明的方法就能够应用于任何音频系统中。音频声道2包括音频信号，该信号位于包括噪声分量的至少一个频带中。在实际的实施例中，包含可听频率分量的音频信号通常被分到几个(通常为对数比例的)频带中，但也可以直接在全带宽音频信号上执行根据本发明的方法。本发明的方法可以应用于每个频带或特定数量个频带(特别是在人耳对相关信号敏感的有关频带中)。
在滤波级3对多声道信号2进行滤波。滤波器3将该音频信号分离为噪声部分4和非噪声部分5。信号2的非噪声部分5被指向正弦编码电路6。该电路6产生表示所述音频信号2的非噪声音频信息的、经压缩的编码数据7。
噪声部分4被指向以按照本发明的保留相关性的方式对噪声进行编码的电路8。在所述电路8中，确定所述音频信号之间的相关性并识别噪声源的组合，以便去掉在所述组合中各个噪声源之间的相关性，从而使噪声源的所述组合以保留相关性的方式合成所述噪声分量。
通过测量音频声道2的自相关系数和互相关系数来确定所述音频信号之间的相关性。这种相关信息可以表示为相关矩阵，该相关矩阵表示自相关系数和互相关系数。在该矩阵中，系数<S(i)S(i)>表示声道i的自相关；系数<S(i)S(j)>表示声道i和声道j之间的互相关；i和j为一些表示所述多声道系统的一个特定声道的整数。
根据该相关矩阵计算一组变换参数9。该变换参数9被馈送到发射机10。变换参数9与合成噪声源的有关参数相关。这些变换参数可以包括源的自相关，所述的自相关对应于每个不相关噪声信号的能量，并包括表示所述噪声源之间特定联系的互相关。解码器接收这些参数9，用于对一组产生的噪声源执行逆变换，这将参考图2进一步说明。
然后变换参数9与正弦编码的非噪声信号7组合，并作为编码信号11通过发射机10发送。发送可以为无线发送，或通过互联网发送，实际上可以为任何类型的发送。还可以通过物理数据载体(诸如磁盘或CD-rom)等执行发送。
在图2中，通过将信号11解码为一组音频信号21的解码器12大致示出了图1方案的逆方案。信号11包括根据本发明的方法用于形成多个噪声源的一组变换参数。
在第一分离级13，从信号11中提取变换参数9和编码的非噪声信号7。非噪声信号7被馈送到正弦解码器14，并输出音频声道21的非噪声分量51。
馈送变换参数9到包括一组独立(随机)噪声发生器16的噪声源发生级15。变换参数9指示每个噪声发生器16(包括可能为零的电平)的噪声电平；另外指示其它的参数，例如，可以为噪声源规定一种包络形式。噪声发生器16产生根据该组变换参数9而形成的、互不相关的噪声源的组合，借此合成对于音频信号21的、在感觉上有关联并保留了相关性的噪声分量141。在组合级17，合并保留了相关性的噪声分量41和非噪声部分51并输出音频声道21，这些音频声道为图1的音频声道2的在感觉上有关联的重构。
本领域的普通技术人员很清楚，本发明并不限制于参考附图所描述的这些实施例，而是可以包括各种类型的变型。例如，尽管在所述的实施例中利用的是正弦编码来对信号的非噪声分量进行编码，但是也可以应用其它类型的编码方法，诸如波形编码或霍夫曼编码。而且，包括非噪声分量的音频声道作为整体可以根据上述变换参数进行变换。此外，可以使用不同参数等来应用其它类型的噪声编码。本方法可以应用于多声道音频系统的音频声道的单独相关频带。该方法还可以应用于多声道音频系统的所选择数量的声道中。这些变型和其它变型被认为包含在由附属权利要求书保护保护的范围内。
附图标记1、编码器
2、复合箭头3、滤波级4、噪声部分5、非噪声部分6、正弦编码电路7、编码数据8、噪声编码电路9、变换参数10、发射机11、编码信号12、解码器13、分离级14、正弦解码器15、噪声源发生级16、噪声发生器17、组合级
权利要求
1.一种用于编码一组具有相关分量的音频信号的方法，该方法包括以下步骤-根据所述音频信号之间的相关性来确定所述源的组合，在所述的组合中的源互不相关或基本不相关，使得源的所述组合以保留相关性的方式来合成所述分量。
2.根据权利要求1所述的方法，还包括步骤-将该组音频信号编码为编码信号，其中该编码信号包括一组用于产生源的所述组合的变换参数，和-发送该编码信号。
3.根据上述权利要求的任一项所述的方法，其中在逐帧的基础上确定所述源。
4.根据上述权利要求的任一项所述的方法，其中通过正弦编码对所述音频信号中的非噪声分量进行编码。
5.根据上述权利要求的任一项所述的方法，其中通过对该组音频信号的相关矩阵执行去相关来确定所述变换参数。
6.根据上述权利要求的任一项所述的方法，其中该组音频信号被分到一组选择的频带中，其中所述频带中的至少一个频带包括类似于噪声的信号。
7.一种用于合成一组具有相关分量的音频信号的方法，该方法包括以下步骤-接收编码信号，该编码信号包括一组用于产生源的组合的变换参数，在所述组合中的源互不相关或基本上不相关，使得源的所述组合以保留相关性的方式合成所述分量；-响应于所述编码信号，产生一组合成源；以及-通过将每个音频信号形成多个所述分量来产生该组音频信号。
8.一种用于编码一组具有相关分量的音频信号的编码器，该设备包括根据所述音频信号之间的相关性来确定源的组合，在所述的组合中的源互不相关或基本不相关，使得源的所述组合以保留相关性的方式来合成所述分量。
9.一种用于编码音频声道的编码器，该编码器包括-用于在所述音频声道的至少一个频带中检测在一组音频信号中的每个音频信号之间的互相关和自相关的装置；和-用于根据所述音频信号之间的相关性确定源的组合的处理装置，在所述组合中的源互不相关或基本不相关，使得源的所述组合以保留相关性的方式合成所述分量。
10.一种根据权利要求9或10所述的编码器，还包括-用于将该组音频信号编码为编码信号的装置，其中该编码信号包括一组用于产生源的所述组合的变换参数，和-用于发送该编码信号的发送装置。
11.一种用于合成一组音频信号的解码器，该解码器包括-用于接收编码信号的接收装置，该编码信号包括一组用于产生源的组合的变换参数，在所述组合中的源互不相关或基本不相关，使得源的所述组合以保留相关性的方式合成所述分量；-一组响应于该编码信号而产生源的发生器；以及-合成装置，该合成装置响应于该组变换参数为每个音频信号形成多个所述分量，从而合成所述音频信号。
12.一种包括编码信号的数据载体，包括一组用于形成多个源的变换参数，在所述组合中的源互不相关或基本不相关，使得源的所述组合以保留相关性的方式合成所述分量。
13.一种包括一组用于形成多个源的变换参数的编码信号，在所述组合中的源互不相关或基本不相关，使得源的所述组合以保留相关性的方式合成所述分量。
全文摘要
利用多声道音频编码系统中的源对一组具有相关分量的音频信号进行编码的方法。该方法包括根据所述音频信号之间的相关性来确定所述源的组合的步骤，在所述的组合中的源基本不相关，使得源的所述组合以保留相关性的方式合成所述分量。该方法还包括通过为每个源确定一组用于合成所述源的参数和一组用于产生源的所述组合的变换参数来对这些源进行编码的步骤。
文档编号G10L19/012GK1589466SQ02823224
公开日2005年3月2日申请日期2002年11月22日优先权日2001年11月23日
发明者L·M·范德克霍夫, A·W·J·奥门申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：L.M.范德克霍夫;A.W.J.奥门
技术所有人：皇家飞利浦电子股份有限公司
我是此专利的发明人

上一篇：感觉噪声替换的制作方法
上一篇：从电信号中去除噪声的方法和装置的制作方法