使用复值滤波器组的音频信号的编码和解码的制作方法

文档序号:2829238阅读:161来源:国知局
专利名称:使用复值滤波器组的音频信号的编码和解码的制作方法
技术领域
本发明涉及音频信号的编码和/或解码,特别涉及音频信号的波形编码/解码。
背景技术
在过去几十年,随着数字信号表示和通信逐渐替代了模拟表示和通信,各种源信号的数字编码逐渐变得重要。例如,移动电话系统是基于数字语音编码,诸如用于移动通信的全球系统。而且,媒体内容、诸如视频和音乐的发布也逐渐基于数字内容编码。
传统地,音频编码主要使用波形编码,其中下层波形已经被数字化并被高效编码。例如,典型的波形编码器包括将该信号转换到频率子带域的滤波器组。基于伪声学模型,应用掩蔽阈值,并且将所得到的子带值高效地量化和编码,例如使用哈夫曼编码。
波形编码器的范例包括所熟知的MPEG-1 Layer3(通常称之为MP3)或AAC(高级音频编码)编码方案。
近些年,已经提出了许多编码技术,其并不直接对该下层波形进行编码,而是其特征在于通过多个参数的编码信号。例如,对于语音编码,该编码器和解码器可以是基于人类语音声道的模型,并且可以对用于该模型的各种参数和激励信号进行编码来代替编码该波形。这些技术通常称之为参数编码技术。
而且,可以结合波形编码和参数编码来提供特别高效和高质量的编码。在这些系统中,这些参数可以参照一部分已经被波形编码的信号来描述该信号的另一部分。例如,已经提出其中将低频进行波形编码并且通过一个描述相对于低频的高频属性的参数扩展对高频进行编码的编码技术。作为另一范例,已经提出了多信道信号编码,其中例如对单一信号进行波形编码,并且参数扩展包括指示在该共同信号上各个信道是如何变化的参数数据。
参数扩展编码技术的范例包括频谱带复制(SBR)、参数立体声(PS)和空间音频编码(SAC)技术。
当前,该SAC技术被开发用来高效地编码多信道音频信号。该技术部分地基于该PS编码技术。类似于该PS范例,SAC是基于注释,其中由M个信道组成的多信道信号可以通过由N个信道组成的信号和少量表示该空间线索的参数高效地表示,并且N<M。典型的应用包括作为波形编码的单一或立体声信号加上空间参数编码的常规5.1信号表示。该空间参数可以内嵌于该核心单一或立体声比特流的辅助数据部分中,以形成后向兼容扩展。
类似于该SBR和PS技术,为了从时域表示转换到频域表示(或相反),SAC使用复数(伪)正交镜像滤波器(QMF)组。这些滤波器组的特征就是以因子2高效地过采样这些复值子带域信号。这样就进行这些复值子带域信号的后处理操作不会引入折叠失真。
参数扩展的另一个共同特征就是在典型的情况下,这些技术都不会获得透明的音频质量级,即会引入一些质量降低。
为了将诸如SBR、PS和SAC的参数扩展向透明音频质量扩展,最好使用波形编码器对该复子带域信号的某些部分,例如对某一数量的频带进行编码。
一种直接的方式包括将该复子带域的这些部分转换回到该时域的第一转换。然后可以将现有的波形编码器(例如AAC)应用于所得到的该时域信号。然而,这种方式具有许多缺点。
具体地,由于使用不同的转换在该频域和时域之间反复转换,所得到的编码器和解码器复杂度较高,并且具有较高的计算负荷。例如,如果参数扩展会使用对QMF合成之后所获得的时域信号进行编码,那么对应的解码器将包括完整的波形解码器(例如AAC微分解码器),并且另外包括分析QMF组。这样由于计算复杂度而比较昂贵。
而且,有利的是在所使用的参数扩展与通过该参数扩展对该信号元素进行的波形编码之间具有相关性。
例如,一种系统可以包括例如AAC和SBR(HE-AAC)或者AAC和SAC编码。如果该系统允许通过波形编码增强SBR或SAC扩展,那么逻辑上也可以使用AAC,以对在QMF合成之后所获得的时域信号进行编码。然而,使用该相同扩展的另一系统,例如MPEG-1 Layer II和SBR的组合优选地将会使用另一波形编码系统MPEG-1 Layer II。相应地,将该波形编码增强与该参数扩展工具耦合、而不是与核心编码器耦合将会有利。
因此,一种改进的系统将会是有利的,并且特别是一种能够增加灵活性、减少复杂度、减少计算负荷、在所应用的编码的不同元素之间具有简化的交互操作、改进(例如可标定的)音频质量和/或改进性能的编码和/或解码系统将会是有利的。

发明内容
相应地,本发明在寻找以单独或任何组合能优选减轻、减缓或消除一个或多个上述缺陷。
根据本发明的一方面,提供一种用于通过波形解码产生时域音频信号的解码器,该解码器包括用于接收编码数据流的装置;用于通过解码该编码数据流的数据值产生第一子带信号的装置,该第一子带信号对应于该时域音频信号的临界采样的复子带域信号表示;用于通过子带处理从该第一子带信号产生第二子带信号的转换装置,该第二子带信号对应于该时域音频信号的非临界采样的复子带域信号表示;以及用于从该第二子带信号产生该时域音频信号的合成滤波器组。
本发明可以得到改进的解码器。可以获得减少复杂度的解码器和/或可以减少该计算资源要求。特别地,合成滤波器组可以用于对用于该时域音频信号的参数扩展进行解码和用于波形解码。可以获得波形解码和参数解码之间的通用性。特别地,该合成滤波器组可以是类似于在参数扩展编码技术、诸如在SBR、PS和SAC中典型地用于参数解码的QMF滤波器组。
该转换处理器设置为通过子带处理产生该第二子带信号,而不需要将该第一子带信号转换回到时域的任何转换。
该解码器可以进一步包括用于在该合成滤波器组的合成操作之前对该第二子带信号执行非折叠(non-alias)信号处理的装置。
根据本发明的可选特征,该第一子带信号的每一子带包括多个子子带(sub-subband),并且该转换装置包括用于从该第一子带信号的子子带产生第二子带信号的子带。
这样可以提供高效转换第一子带信号的装置。该特征可以提供用于补偿该合成滤波器组的子带滤波器的频率响应的高效和/或低复杂度装置。
根据本发明的可选特征,该第二子带信号的每一子带包括折叠带和非折叠带,并且其中该转换装置包括用于将第一子带信号分的子子带割成第二子带信号的第一子带带的折叠子子带和第二子带信号的第二子带的非折叠子带的分割装置,该折叠子带和该非折叠子带在该时域信号中具有对应的频率间隔。
这样可以提供转换该第一子带信号的高效装置。特别地,其可以允许从单个信号分量产生源自时域音频信号中的相同频率的不同子带中的信号分量。
根据本发明的可选特征,该分割装置包括蝶形结构。
这样可以得到特别高效的实施和/或高性能。该碟形结构可以使用一个零值输入和一个子子带数据值输入来产生对应于第二子带的不同子带的两个输出值。
根据本发明的另一方面,提供一种用于编码时域音频信号的编码器,该编码器包括用于接收时域音频信号的装置;用于从时域音频信号产生第一子带信号的第一滤波器组,第一子带信号对应于时域信号的非临界采样的复子带域表示;用于通过子带处理从第一子带信号产生第二子带信号的转换装置,该第二子带信号对应于时域音频信号的临界采样的复子带域表示;以及用于通过编码第二子带信号的数据值产生波形编码数据流的装置。
本发明可以得到改进的编码器。可以获得减少复杂度的编码器和/或可以减少计算资源需要。可以获得波形编码和参数编码之间的通用性。特别地,该第一滤波器组可以是QMF滤波器组,其典型地用于在参数扩展编码技术、诸如在SBR、PS和SAC中进行参数编码。
可以得到改进的解码音频质量。例如,该时域音频信号可以是来自参数编码的残留信号。该波形编码信号可以提供增加透明度的信息。
该转换处理器设置为通过子带处理产生第二子带信号,而不需要将第一子带信号转换回到时域的任何转换。
根据本发明的可选特征,该编码器进一步包括用于使用第一子带信号对时域音频信号进行参数编码的装置。
本发明可以使用参数和波形编码得到下层信号的高效和/或高质量的编码。在参数和波形编码之间可以共用功能。该参数编码可以是参数扩展编码,诸如SBR、PS或SAC编码。该编码器特别地可以提供参数扩展编码的某些或全部子带的波形编码。
根据本发明的可选特征,该转换装置包括用于为第一子带信号的每一子带产生多个子子带的第二滤波器组。
这样可以提供高效转换第一子带信号的装置。该特征可以提供用于补偿第一子带的子带滤波器的频率响应的高效和/或低复杂度装置。
根据本发明的可选特征,该第二滤波器组是被奇数堆叠的(oddlystacked)。
这样可以提高性能,并得到复子带域中正和负频之间的改进分离。
根据本发明的可选特征,每一子带包括对于该子带的折叠带的某些折叠子子带的和对应于该子带的非折叠带的某些非折叠子子带,并且其中该转换装置包括用于将第一子带带的折叠子子带与第二子带的非折叠子子带组合的组合装置,该折叠子子带与该非折叠子子带在时域信号中具有对应的频率间隔。
这样可以提供高效转换第一子带信号的装置。特别地,其可以允许将源自时域音频信号中相同频率的不同子带中的信号分量组合成单个信号分量。这样可以得到数据速率的降低。
根据本发明的可选特征,组合装置设置用来减少折叠带中的能量。
这样可以改进性能和/或得到数据速率降低。特别地,折叠带中的能量可以减少,并且可以忽略该折叠带。
特别地,组合装置可以进一步包括用于通过第二子带的折叠子带对第一子带带的非折叠子子带进行补偿的装置。特别地,该组合装置可以包括用于从第一子带的非折叠子子带减去第二子带的折叠子带的系数的装置。
根据本发明的可选特征,该组合装置包括用于产生第一子带中的第一折叠子子带和第二子带中的第一非折叠子子带的非折叠和信号的装置。
这样可以得到特别高效的实施和/或高性能。
根据本发明的可选特征,该组合装置包括用于产生非折叠和信号的碟形结构。
这样可以得到特别高效的实施和/或高性能。该碟形结构特别可以是其中只产生一个输出值的半碟形结构。
根据本发明的可选特征,该碟形结构的至少一个系数取决于该第一滤波器组的一个滤波器的频率响应。
这样可以得到高效的实施和/或高性能。
根据本发明的可选特征,该转换装置设置为不包括编码数据流中折叠带的数据值。
这样对于给定数据速率,可以得到高的编码音频质量。
根据本发明的可选特征,该编码器进一步包括用于在将第一子带信号转换为第二信号之前对其执行非折叠信号处理的装置。
这样可以提高性能。本发明可以得到高效实施的波形编码器,其具有临界采样的输出信号,同时允许对各个子带执行信号处理,而不会引入折叠误差。
根据本发明的可选特征,该编码器进一步包括用于在将第一子带信号转换为第二信号之前对其进行相位补偿的装置。
这样可以提高性能和/或提供高效的实施。
根据本发明的可选特征,该第一滤波器组是QMF滤波器组。
本发明可以得到高效波形编码,其使用在诸如SBR、PS、SAC的许多参数编码中所使用的QMF滤波器。于是,可以获得波形和参数编码技术的改进的兼容性和/或改进的功能性共享和/或改进的交互操作性。
根据本发明的另一方面,提供一种通过波形解码产生时域音频信号的方法,该方法包括接收编码数据流;通过解码该编码数据流的数据值产生第一子带信号,该第一子带信号对应于该时域音频信号的临界采样的复子带域信号表示;通过子带处理从该第一子带信号产生第二子带信号,该第二子带信号对应于该时域音频信号的非临界采样的复子带域表示;以及合成滤波器组从该第二子带信号产生该时域音频信号。
根据本发明的另一方面,提供一种编码时域音频信号的方法,该方法包括接收该时域音频信号;第一滤波器组从该时域音频信号产生第一子带信号,该第一子带信号对应于该时域信号的非临界采样的复子带域表示;通过子带处理从该第一子带信号产生第二子带信号,该第二子带信号对应于该时域音频信号的临界采样的复子带域表示;以及通过编码该第二子带信号的数据值产生波形编码数据流。
根据本发明的另一方面,提供一种用于接收音频信号的接收机,该接收机包括用于接收编码数据流的装置;用于通过解码该编码数据流的数据值产生第一子带信号的装置,该第一子带信号对应于该时域音频信号的临界采样的复子带域信号表示;用于通过子带处理从该第一子带信号产生第二子带信号的转换装置,该第二子带信号对应于该时域音频信号的非临界采样的复子带域表示;以及用于从该第二子带信号产生该时域音频信号的合成滤波器组。
根据本发明的另一方面,提供一种用于发送编码音频信号的发送机,该发送机包括用于接收时域音频信号的装置;用于从该时域音频信号产生第一子带信号的第一滤波器组,该第一子带信号对应于该时域信号的非临界采样的复子带域表示;用于通过子带处理从该第一子带信号产生第二子带信号的转换装置,该第二子带信号对应于该时域音频信号的临界采样的复子带域表示;用于通过编码该第二子带信号的数据值产生波形编码数据流的装置;以及用于发送该波形编码数据流的装置。
根据本发明的另一方面,提供一种用于传输时域音频信号的传输系统,该传输系统包括发送机,其包括用于接收该时域音频信号的装置;用于从该时域音频信号产生第一子带信号的第一滤波器组,该第一子带信号对应于该时域信号的非临界采样的复子带域表示;用于通过子带处理从该第一子带信号产生第二子带信号的转换装置,该第二子带信号对应于该时域音频信号的临界采样的复子带域表示;用于通过编码该第二子带信号的数据值产生波形编码数据流的装置;以及用于发射该波形编码数据流的装置;和接收机,其包括用于接收编码数据流的装置;用于通过解码该编码数据流的数据值产生第三子带信号的装置,该第三子带信号对应于该时域音频信号的临界采样的复子带域信号表示;用于通过子带处理从该第三子带信号产生第四子带信号的转换装置,该第四子带信号对应于该时域音频信号的非临界采样的复子带域表示;以及用于从该第四子带信号产生该时域音频信号的合成滤波器组。
根据本发明的另一方面,提供一种接收音频信号的方法,该方法包括接收编码数据流;通过解码该编码数据流的数据值产生第一子带信号,该第一子带信号对应于该时域音频信号的临界采样的复子带域信号表示;通过子带处理从该第一子带信号产生第二子带信号,该第二子带信号对应于该时域音频信号的非临界采样的复子带域表示;以及合成滤波器组从该第二子带信号产生该时域音频信号。
根据本发明的另一方面,提供一种传输编码音频信号的方法,该方法包括接收该时域音频信号;第一滤波器组从该时域音频信号产生第一子带信号,该第一子带信号对应于该时域信号的非临界采样的复子带域表示;通过子带处理从该第一子带信号产生第二子带信号,该第二子带信号对应于该时域音频信号的临界采样的复子带域表示;通过编码该第二子带信号的数据值产生波形编码数据流;以及传输该波形编码数据流。
根据本发明的另一方面,提供一种传输和接收时域音频信号的方法,该方法包括一个发送机接收该时域音频信号;第一滤波器组从该时域音频信号产生第一子带信号,该第一子带信号对应于该时域信号的非临界采样的复子带域表示;通过子带处理从该第一子带信号产生第二子带信号,该第二子带信号对应于该时域音频信号的临界采样的复子带域表示;通过编码该第二子带信号的数据值产生波形编码数据流;以及传输该波形编码数据流;和一个接收机接收该波形编码数据流;通过解码该编码数据流的数据值产生第三子带信号,该第三子带信号对应于该时域音频信号的临界采样的复子带域信号表示;通过子带处理从该第三子带信号产生第四子带信号,该第四子带信号对应于该时域音频信号的非临界采样的复子带域表示;以及合成滤波器组从该第四子带信号产生该时域音频信号。
根据本发明的另一方面,提供一种用于执行任何上述方法的计算机程序产品。
将要参照此后所描述的实施例对本发明的这些和其它方面、特征以及优点进行清楚的说明。


将要参照附图,仅仅通过举例的形式描述本发明的实施例,其中图1所述为根据本发明的某些实施例用于通信音频信号的传输系统100;图2所述为根据本发明某些实施例的编码器;图3所述为根据本发明某些实施例的编码器的某些元件的范例;图4所述为根据本发明某些实施例的解码器;图5所述为根据本发明某些实施例的编码器;图6所述为分析和合成滤波器组的范例;图7所述为QMF滤波器组频谱的范例;图8所述为降采样QMF子带滤波器谱的范例;图9所述为QMF子带谱的范例;图10所述为子带滤波器组的频谱的范例;
图11所述为碟形转换结构的范例。
具体实施例方式
图1所述为根据本发明的某些实施例用于通信音频信号的传输系统100。该传输系统100包括通过具体可以为互联网的网络105与接收机103耦合的发送机101。
在该具体范例中,该发送机101是信号记录装置,并且该接收机是信号播放装置103,但要理解的是,在其它实施例中,发送机和接收机可以在其它应用中使用并用于其它目的。例如,该发送机101和/或该接收机103可以是代码转换功能的一部分,并且例如可以提供与其它信号源或目的地的交互。
在其中支持信号记录功能的具体范例中,该发送机101包括数字转换器107,其接收模拟信号,并通过采样和模拟数字转换将其转换为数字PCM信号。
发送机101与图1的编码器109耦合,其根据编码算法对PCM信号进行编码。编码器100与网络发送机111耦合,其接收编码信号并与互联网105接口。网络发送机可以通过互联网105向接收机103传输编码信号。
接收机103包括网络接收机113,其与互联网105接口并被设置为从发送机101接收编码信号。
网络接收机111与解码器115耦合。解码器115接收编码信号并根据解码算法对其进行解码。
在其中支持信号播放功能的具体范例中,接收机103进一步包括信号播放器107,其从解码器115接收解码音频信号并将其提供给用户。具体地,按照用于输出解码音频信号的需要,该信号播放器113可以包括数字模拟转换器、放大器和扬声器。
图2更加详细的描述了图1的编码器109。编码器109包括接收机201,其接收所要编码的时域音频信号。可以从任何外部或内部源接收该音频信号,诸如从本地信号存储接收。
接收机与第一滤波器组203耦合,其产生包括多个不同子带的子带信号。具体地,第一滤波器组203可以是诸如在SBR、PS和SAC参数编码中所熟知的QMF滤波器组。于是第一滤波器组203产生第一子带信号,其对应于时域信号的非临界采样的复子带域表示。在该具体范例中,第一子带信号具有的过采样因子为2,如用于复调制QMF滤波器所熟知的。
由于通过因子2过采样每一QMF频带,所以可以对单个子带执行许多信号处理操作,而不会引入任何折叠失真。例如,每一单个子带例如可以被标定和/或可以增加或减少其它子带等。于是在某些实施例中,该编码器109进一步包括用于对QMF子带执行非折叠信号处理的装置。
第一子带信号对应于通常通过诸如SBR、PS和SAC的参数扩展编码器所产生的子带信号。于是,可以使用第一子带信号来产生用于时域信号的参数扩展编码。另外,相同的子带信号在图2的编码器109中也用于时域信号的波形编码。于是,编码器109可以使用相同的滤波器组203用于信号的参数和波形编码。
第一子带信号的复值子带域表示的波形编码中的主要困难在于其没有形成紧凑表示,即其以因子2被过采样。编码器109直接将复值子带域表示转换成为非常类似于当直接对原始时域信号应用修改的离散余弦变换(MDCT)时已经得到的表示的表示(例如参见H.Malvar,“SignalProcessing with Lapped Transforms”,Artech House,Boston,London,1992,其是关于MDCT的描述)。这个MDCT类似的表示是被临界采样。这样,该信号适合于已知的感知音频编码技术,可以应用其以对所得到的表示进行高效编码,产生高效波形编码。
特别地,该编码器109包括转换处理器205,其通过对第一子带信号的各个子带应用复变换,从第一子带信号产生第二子带信号。该第二子带信号对应于时域音频信号的临界采样的复子带域表示。
于是在编码器109中,转换处理器205将与当前典型的参数扩展编码器兼容的QMF滤波器组输出转换为临界采样的MDCT类似的子带,其近似对应于典型地在常规波形编码器中所产生的子带信号。
于是,不是使用QMF和MDCT转换,在子带域中直接处理第一子带信号,以产生可以当作常规波形编码器的MDCT信号对待的第二子带信号。于是,可以应用用于编码子带信号的已知技术,并可以从参数扩展编码得到例如残余信号的高效波形编码,而不需要转换到时域,于是可以不需要QMF合成滤波器。
在范例中,编码器109包括与转换处理器205耦合的编码处理器207。编码处理器207从转换处理器205接收第二临界采样的MDCT类似的子带信号,并使用常规波形编码技术,包括量化、标定因子、哈夫曼编码等对其进行编码。将所得到的编码数据嵌入编码数据流中。该数据流可以进一步包括其它编码数据,诸如参数编码数据。
如在下面将要详细描述,转换处理器205利用第一滤波器组203的基本(或原型)滤波器的信息来组合来自非折叠带(或通带)中不同子带的信号分量,并用来删除来自折叠带(或阻带)的信号分量。相应地,可以忽略每一子带的折叠带频率成分,得到没有过采样的临界采样信号。
具体地,如下所述,转换处理器205包括第二滤波器,其产生QMF滤波器组的每一子带的多个子子带。于是,这些子带被进一步分为子子带。由于QMF滤波器之间的交叠,时域信号的给定信号分量(也就是特定频率的正弦)可以得到两个不同QMF子带中的信号分量。第二滤波器组会进一步划分这些子带,以使得在第一QMF子带的一个子子带和第二QMF子带的一个子子带中表示信号分量。将这两个子子带信号的数据值馈送到组合器,其组合这两个信号,以产生单个信号分量。然后通过编码处理器207编码单个信号分量。
图3所述为转换处理器205的某些元件的范例。特别地,图3描述了用于第一QMF子带的第一转换滤波器组301和用于第二QMF子带的第二转换滤波器组303。然后将来自对应于相同频率的子子带的信号馈送到组合器305,其产生用于子子带的单个输出数据值。
要理解的是,解码器115可以执行编码器109的逆操作。图4更加详细地描述了解码器115。
该解码器包括接收机401,其从该网络接收机113接收由编码器109编码的信号。将编码信号传送到解码处理器403,其对编码处理器207的波形编码进行解码,从而重新创建临界采样子带信号。将该信号馈送到解码转换处理器405,其通过执行转换处理器205的逆操作重新创建非临界采样子带信号。然后将非临界采样信号馈送到QMF合成滤波器407,其产生原始时域音频编码信号的解码版本。
特别地,解码转换处理器405包括分割器,诸如逆碟形结构,其重新产生子子带中的信号分量,包括折叠和非折叠带中的信号频带。然后将子子带信号馈送到合成滤波器组,其对应于编码器109的转换滤波器组301、303。这些滤波器组的输出对应于非临界采样子带信号。
下面将更加详细地描述本发明的具体实施例。这些实施例的描述将参照图5的编码器结构500进行。该编码器结构500具体地可以在图1的编码器109中实施。
编码器结构500包括64个频带分析QMF滤波器组501。
QMF分析子带滤波器可以描述如下。给定一个实值线性相位原型滤波器p(v),M频带复调制分析滤波器组可以通过分析滤波器被定义hk(v)=p(v)exp{iπM(k+1/2)(v-θ)},---(1)]]>子带指数k=0,1,…M-1。相位参数θ对后面的分析很重要。典型的选择是(N+M)/2,其中N是原型滤波器阶数。
给定实值离散时间信号x(v),通过使用hk(v)滤波(卷积)x(v)得到子带信号vk(n),并然后如图6左边所述以因子M降采样该结果,其描述了编码器109和解码器115的QMF分析和合成滤波器组的操作。
假定合成操作包括使用因子M上采样QMF子带信号,随后使用类似于等式(1)类型的复调制滤波器进行滤波,将结果相加,并最后取实数部分的两倍,如图6的右边所述。在这种情况下,通过实值线性相位原型滤波器p(v)的适当设计,可以得到实值输入信号x(v)的近乎完美重建,如P.Ekstrand,“Bandwidth extension of audio signals byspectral band replication”,Proc,1stIEEE Benelux Workshop onModel based Process ing and Coding of Audio(MPCA-2002),pp.53-58,Leuven,Belgium,November 15 2002中所示。
在下面,让Z(ω)=Σn=-∞∞z(n)exp(-inω)]]>为离散时间信号z(n)的离散时间傅立叶变换。
除了QMF组的近乎完美的重构属性之外,假定p(v)的离散傅立叶变换P(ω)基本上在频率区间[-π/M,π/M]之外不存在。
降采样复子带域信号的傅立叶变换被给定为Yk(ω)=exp(-i(k+1/2)θ/M)MΣl=0M-1P(ω-π(1l+k+1/2)M)×(ω-2πlM)---(2)]]>其中k是子带指数,并且M是子带的数目。由于假定原型滤波器的频率响应是有限的,所以对于每一ω,等式2中的和只包含一项。
图7和图8中所示为对应的仿效的绝对频率响应。
具体地,图7所述为降采样之前复QMF组501的第一少数频率带的仿效的频率响应。图8所述为对于偶(顶部)和奇(底部)子带k的降采样复QMF组的效仿的频率响应。于是如图8所示,QMF滤波器组的中心在降采样之后对于偶数编号的子带将折叠到π/2,并且对于非偶数编号的子带将折叠到-π/2。
图8描述了复QMF组的过采样的效果。对于具有偶指数k和奇指数k的频带,重建(原始实值)信号分别不需要频率谱的负和正部分。该降采样滤波器组的这些频率谱部分将被称之为折叠带或阻带,而其它部分将表示为通带或非折叠带。要注意,该折叠带包含在其它子带的频谱的通带中也存在的信息。这个特殊属性将用来得出高效编码机制。
要理解的是,折叠和非折叠带包括冗余信息,并且根据一个可以确定另一个。也要理解的是,可以使用折叠和非折叠的互补解释。
如下面所要示出,通过在降采样分析滤波器组501的每一输出端应用某种类型的附加滤波器组503,并在附加滤波器组501的输出之间应用某种碟形结构505,可以将对应于QMF分析滤波器组的折叠带(或阻带)的能量减少到零或可以忽略的值。
结果,可以丢弃信息的一半,即该滤波器组输出的一半。结果就得到临界采样表示。该表示非常类似于通过对原时域采样进行MDCT变换所得到的表示,并因此近似类似于通过典型波形编码器、诸如MP3或AAC所产生的子带信号。相应地,在波形编码处理器507中可以对临界采样信号直接应用波形编码技术,不需要转换到时域之后产生MDCT子带。然后通过比特流处理器509将所得到的编码数据包括在比特流中。
图9所述为对包含两个正弦的信号进行QMF子带产生的效果。
在复频域中(诸如通过FFT方式所得到的),每一正弦将作为正频和负频在频谱中显示出来。现在假定8个频带的复QMF组(在图5的范例中采用了64个频带的组)。在降采样之前,正弦将作为所示的频谱A至H显示出来。如图所示,每一正弦出现在两个子带中,例如,低频频谱线出现在对应于第一QMF子带的频谱A和对应于第二QMF子带的频谱B中。
在图9的下部分中描述了对QMF组进行的降采样处理,其中频谱I显示了在降采样之前的频谱。降采样处理可以解释如下。首先,将频谱分割成为M个频谱A至H,其中M是降采样因子(M=8),对于第一和第二子带分别如I和K中所示。再将每一单个分割的频谱扩展(伸展)到完整的频率范围。然后将所有各个分割的和扩展的频谱相加,对于第一和第二子带分别得到如频谱J和L中所示的频谱。
总而言之,由于每一单个子带的滤波器具有超过子带之间的频率间隔的带宽,所以时域信号的信号分量会产生两个不同子带中的信号分量。而且,其中一个信号分量会落在一个子带的折叠带中,并且另一个信号分量会落在另一个子带的非折叠带中。
于是如频谱J和L中所示,在复QMF组的最终输出频谱中,这些分量还会出现在两个子带中,例如低频频谱线出现在第一子带的通带和第二子带的阻带中。两种情况下频谱线的幅度通过(偏移)原型滤波器的频率响应给出。
根据图5的实施例,引入另外一组复变换(滤波器组503),其中对子带的输出应用每一变换。这样用来将这些子带的频率谱进一步分割成为多个子子带。
然后将QMF子带的通带中的每一子子带与相邻QMF子带中折叠带的对应子子带组合。在该范例中,将包括频谱J中的低频正弦的子子带与频谱L中低频正弦组合,于是将从时域信号的相同低频正弦出现的两个信号分量被组合成为单个信号分量。
而且,为了补偿QMF原型滤波器的频率响应,在组合之前通过频率响应的相对幅度对来自每一子子带的值进行加权(假定在每一子子带中,QMF原型滤波器的幅度响应为常数)。
该阻带中的信号分量可以被忽略或通过来自通带的值被补偿,从而有效地减少了折叠带中的能量。于是,转换处理器207的操作可以看作对应于将从每一频率出现的两个信号分量的能量集中到一个QMF子带的通带中的单个信号分量。于是,由于折叠或阻带中的信号值可以忽略,所以可以得到通过2进行的高效降采样,得到临界采样信号。
如下将要示出,可以通过使用碟形结构得到信号分量的组合(以及消除折叠带中的信号分量)。
原则上,(通过滤波器组503)对子带信号应用另一(50%交叠)复变换将产生因子为2的另一上采样。然而,所选择的变换具有能够减少50%数据的某种对称属性。可以认为所得到的变换等同于对实数应用MDCT和对虚数应用MDST。两个都是临界采样变换,于是没有上采样出现。
更详细地,滤波器组503可以是由R=2Q个频带组成的复调制的滤波器组。对于每一子带k,对于每一子带的滤波器组503的仿效频率响应的范例如同10中所示。如图可以看到,滤波器组被奇数堆叠,并且没有居中在DC值周围的子带。相反,在该范例中,子带的中心频率在零周围对称,并且第一子带的中心频率在半个子带频率偏移的周围。
降采样因子在第二组中为Q,并且对于r=-Q、-Q+1、…Q-1,其通过分析滤波器被定义gr(v)=w(v)exp{iπQ(r+1/2)(v-1/2)}---(3)]]>其中实值原型窗w(v)要使得w(v)=w(-v-1-Q)。熟知的是,可以设计该窗,使得可以从具有滤波器等于(3)的实部或(3)的虚部的滤波器组中的分析中得到完美重建。在这些情况下,只有R=2Q个子带的Q满足正频率或负频率。一个优秀范例是修改的离散余弦变换MDCT。
然而在图5的实施例中,使用滤波器503替代地分析复值信号z(n),以因子Q进行降采样所得到的信号,并取实部。对应的合成操作包括以因子Q进行上采样和通过复调制滤波器进行合成滤波fr(v)=w(v-Q)exp{iπQ(r+1/2)(v+1/2)},---(4)]]>将R=2Q个子带上的结果相加,r=-Q、-Q+1、…Q-1,并最后将所得到的结果除以2。
如果原型窗w(v)被设计为给出上述实值组中的完美重建,那么在复数情况下合成和分析的组合操作会完美地重建复值信号z(n)。为了看到这一点,让C表示具有等于(3)的实部的分析滤波器的分析组,并让S表示具有等于(3)的负虚部的分析滤波器的分析组。那么复数分析组(3)可以被写作E=C-iS。将复信号写作z=ξ+iη,然后给出Re{Ez}=Re{(C-iS)(ξ+iη)}=Cξ+Sη.(5)这里,对于正频率r=0、…Q-1以及负频率r=-Q、…-1都评估等式(5)。注意到,在(3)中将r改变到-1-r得到分析滤波器的复共轭,因此对于正频率r=0、…Q-1,分析(5)给出对Cξ+Sη和Cξ-Sη的访问。对于分析,信息可以容易地重建为Cξ和Sη,使用对应的实值的分析滤波器从其可以完美地重建ξ和η。我们省略了提供重建等于复分析、实部、复合成以及除2操作的要求的简单细节。
滤波器结构与Karp T.,Fliege N.J,.在“Modified DFT FilterBanks with Perfect Reeons truction”,IEEE Transactions onCircuits and Systems-IIAnalog and Digital Signal Processing,Vo l.46,No.11,1999年11月,中所提出的修改的DFT(MDFT)滤波器组相关,但与其并不完全一致。原则上不同在于本滤波器组是被奇数堆叠,这样有利于下面所提出的混合结构。
对于每一k=0、1、...M-1以及r=-Q、-Q+1、...Q-1,让vk,r(n)为通过使用分析滤波器503分析复QMF分析信号yk(v)、以因子Q进行降采样并取实部所得到的子子带信号。这样就以原始采样速率的1/(QM)的采样速率给出了总数为2QM个的实值信号。因此,得到以因子2进行过采样的表示。参照图8和10,方便地通过下式定义通带信号 类似地,根据如下来定义上面所称的阻带或“折叠带”信号 观察到这两个信号都是临界采样的。
下一步骤是利用一件事实如果时间信号是频率在π/(2M)≤Ω≤π-π/(2M)的纯正弦信号,并且如果(1)中θ=0,那么yk(n)=P{Ω-π2M(2k+1)}Cexp(iΩMn).---(8)]]>其中C是复常数。结果,由于调制的线性相位QMF原型滤波器的响应,相邻的QMF频带于是会包含具有相同频率和相位但是具有不同幅度的复正弦。于是如前所述,产生两个信号分量一个位于一个QMF子带的通带中,并且一个位于相邻子带的折叠带中。
将对应的子带采样对转换为加权和与差因此会得到非常小的差。在描述该转换的细节之前,应该指出的是,如果θ=0的假设不满足,那么QMF采样优选地应该在预旋转(pre-twiddle)处理器511中根据下式通过被预乘(预旋转)来进行相位补偿y~k(n)=exp(iπθ(k+1/2)/M)yk(n).---(9)]]>可替换地,在预旋转处理器中也可以由碟形结构通过符号取反(signnegation)进行另外的kπ相位跳变。
对于k=0、...M-2,和与差信号定义为sk,r(n)=βk,rbk,r(n)+αk,rak+1,r(n)dk+1,r(n)=-αk,rbk,r(n)+βk,rak+1,r(n),r=Q/2,...,Q-1,]]>sk+1,r(n)=βk,rbk+1,r(n)+αk,rak,r(n)dk,r(n)=αk,rbk+1,r(n)-βk,rak,r(n),r=0,...,Q/2-1.]]>(10)对于第一个和最后一个QMF频带,该定义被替换为s0,r(n)=β0,rb0,r(n)+α0,ra0,Q-1-r(n)d0,Q-1-r(n)=α0,rb0,r(n)-β0,ra0,Q-1-r(n),r=0,...,Q/2-1]]>sM-1,r(n)=βM-1,rbM-1,r(n)+αM-1,raM-1,Q-1-r(n)dM-1,Q-1-r(n)=-αM-1,rbM-1,r(n)+βM-1,raM-1,Q-1-r(n),r=Q/2,...,Q-1]]>(11)图11所述为对应的转换碟形结构。这些碟形结构类似于在MPEG-1Layer III(MP3)中所使用的结构。然而,一个重要的差别在于,使用mp3的所谓反折叠碟形来减少实值的滤波器组的通带中的折叠。在实调制的滤波器组中,不可能在子带的正频率和负(复)频率之间进行区分。在合成步骤中,该子带中的一个正弦因此通常在输出中产生两个正弦。其中一个的折叠正弦位于离正确频率非常远的频率处。该实组反折叠碟形的目的是通过将第二混合组合成引入两个相邻实QMF组来抑制折叠正弦。本方法实质上与将来自第二混合组的复正弦馈送给复QMF子带的情况不同。这样在最终输出中产生只有一个正确定位的正弦,并且MP3的折叠问题不再出现。碟形结构505的目的只是当省略该差信号d时,修正组合分析与合成操作的幅度响应。
注意到,如果将转换系数设置为βk,r=1并且αk,r=0,那么信号对(s,d)将刚好是信号对(b,a)的拷贝。这可以通过选择性的方式完成,因为(10)和(11)的结构使得计算可以在适当的时候完成。这对于只为QMF频带的子带调用混合滤波器组结构的情况具有重要性。只要βk,r2+αk,r2>0,那么所有这些和与差操作都是可逆的,并且如果βk,r2+αk,r2=1,那么该转换是正交的。
对应的合成步骤非常类似于(10)和(11),并且对于本领域的技术人员都是清楚的。通过预旋转处理器511进行的预旋转的逆操作也是这样的。本方法教导了当选择βk,Q-1-r=βk,r并且αk,Q-1-r=αk,r时,信号dk,r(n)变得非常小,并且
βk,r=KP(πM(r+1/2Q-12))αk,r=KP(πM(r+1/2Q+12)),r=0,...,Q/2-1,---(12)]]>其中K是归一化常数。
因此,在假定每一子带k的附加滤波器组是被临界采样并优选进行重建的情况下,折叠带的子子带域信号的近似值实际上将过采样的表示减少到近乎类似于原时域采样的MDCT的临界采样表示。这样就能够通过类似于公知的波形编码器的方式对复子带域信号进行高效编码。对于典型的转换长度Q=16,丢弃对应于阻带或折叠带的转换系数的重建误差为约34dB。
可替换地,为了得到更好的重建,可以将对应于阻带或折叠带的转换系数另外编码到对应于通带的系数。这样对于在Q非常小(例如Q<8)的情况或者在QMF组的性能较差的情况下是有利的。
在图5的该范例中,应用(10)和(11)的和-差碟形505,以得到在这种情况下只保留有主要分量的信号对(s,d)。在下一步骤,对所得到的信号使用例如标定因子编码和量化的常规波形编码技术。将该编码系数嵌入到比特流中。
解码器按照相反的过程进行。首先,从比特流中解复用系数并将其解码。然后,应用编码器的逆碟形操作,之后合成滤波和后旋转(post-twiddling),以得到复子带域信号。最后可以通过QMF合成组将这些转换到时域。
要理解的是,为了清楚的目的,已经结合不同的功能单元和处理器对本发明的实施例进行了上面的描述。然而显然,在不同的功能单元或处理器之间可以使用任何适当的功能分配,而不会破坏本发明。例如,所述用来通过单独处理器或控制器执行的功能可以通过同一处理器或控制器来执行。因此,特定功能单元的参考只是被看作对提供所述功能的适当装置的参考,而不是指示严格的逻辑或物理结构或组织。
本发明可以通过适当的方式实施,包括硬件、软件、固件或者它们的任何组合。本发明可选地可以至少部分地实施为运行于一个或多个数据处理器和/或数字信号处理器上的计算机软件。本发明实施例的元件和组件可以通过任何适当的方式物理地、功能地或逻辑地实施。实际上,可以在单个单元中、在多个单元中或者作为其它功能单元的部件实施该功能。这样,本发明可以在单个单元中实施,或者可以在不同单元和处理器之间物理地或功能地分配。
虽然已经结合某些实施例描述了本发明,但是其并非意欲限于这里所陈述的特定形式。相反,本发明的范围仅通过所附权利要求书限定。相应地,虽然可能结合特殊的实施例会出现一个特征,但是本领域的熟练技术人员会认识到,根据本发明可以组合所述实施例的各种特征。在该权利要求书中,词语包括并不排除存在其它元件或步骤。
而且,虽然单独列出了多个装置、元件或方法步骤,但是其可以通过例如单个单元或处理器实施。相应地,虽然在不同的权利要求中可能包括单独的特征,但是可以将它们有利地组合起来,并且不同权利要求中的包括物并不意味着这些特征的组合是不可行的或有利的。而且,在一种类型的权利要求中包括的特征并不意味着限于这种类型,而相反表示该特征同样地可以适当应用于其它权利要求类型。而且,该权利要求中特征的顺序并不意味着该特征必须工作的任何具体顺序,并且特别地,方法权利要求中单个步骤的顺序并不意味着必须按照该顺序执行该步骤。相反,可以按照任何适当的顺序执行这些步骤。另外,单数标记并不排除有多个。于是标记“一个”、“第一”、“第二”等并不排除有多个。权利要求中的附图标记仅仅作为明示范例而提供,而不应该作为是对权利要求范围的任何限定。
权利要求
1.一种用于通过波形解码产生时域音频信号的解码器,该解码器包括用于接收编码数据流的装置(401);用于通过解码该编码数据流的数据值产生第一子带信号的装置(403),该第一子带信号对应于时域音频信号的临界采样的复子带域信号表示;用于通过子带处理从第一子带信号产生第二子带信号的转换装置(405),该第二子带信号对应于时域音频信号的非临界采样的复子带域表示;以及用于从第二子带信号产生时域音频信号的合成滤波器组(407)。
2.根据权利要求1的解码器,其中第一子带信号的每一子带包括多个子子带,并且转换装置(405)包括第二合成滤波器组,用于从第一子带信号的子子带产生第二子带的子带。
3.根据权利要求2的解码器,其中第二子带信号的每一子带包括折叠带和非折叠带,并且其中转换装置(405)包括用于将第一子带信号的子子带分割成第二子带信号的第一子带带的折叠子子带和第二子带信号的第二子带的非折叠子带的分割装置,该折叠子带和该非折叠子带在时域信号中具有对应的频率间隔。
4.根据权利要求3的解码器,其中分割装置包括碟形结构。
5.一种用于编码时域音频信号的编码器,该编码器包括用于接收时域音频信号的装置(201);用于从时域音频信号产生第一子带信号的第一滤波器组(203),该第一子带信号对应于时域信号的非临界采样的复子带域表示;用于通过子带处理从第一子带信号产生第二子带信号的转换装置(205),该第二子带信号对应于时域音频信号的临界采样的复子带域表示;以及用于通过编码第二子带信号的数据值产生波形编码数据流的装置(207)。
6.根据权利要求5的编码器,进一步包括用于使用第一子带信号对时域音频信号进行参数编码的装置。
7.根据权利要求5的编码器,其中转换装置包括用于为第一子带信号的每一子带产生多个子子带的第二滤波器组(301,303)。
8.根据权利要求7的编码器,其中第二滤波器组(301,303)是奇数堆叠的。
9.根据权利要求7的编码器,其中每一子带包括对应于子带的折叠带的一些折叠子子带和对应于子带的非折叠带的一些非折叠子子带,并且其中转换装置(205)包括用于将第一子带带的折叠子子带与第二子带的非折叠子子带组合的组合装置(305),该折叠子子带与该非折叠子子带在时域信号中具有对应的频率间隔。
10.根据权利要求9的编码器,其中组合装置(305)用来减少在折叠带中的能量。
11.根据权利要求9的编码器,其中组合装置(305)包括用于产生第一子带中的第一折叠子子带和第二子带中的第一非折叠子子带的非折叠和信号。
12.根据权利要求11的编码器,其中组合装置(305)包括用于产生非折叠和信号的碟形结构。
13.根据权利要求12的编码器,其中碟形结构的至少一个系数取决于第一滤波器组(203)的一个滤波器的频率响应。
14.根据权利要求9的编码器,其中转换装置(205)被设置为不包括在编码数据流中的折叠带的数据值。
15.根据权利要求5的编码器,进一步包括用于在将第一子带信号转换为第二信号之前对其执行非折叠信号处理的装置。
16.根据权利要求5的编码器,进一步包括用于在将第一子带信号转换为第二信号之前对其执行相位补偿的装置(511)。
17.根据权利要求5的编码器,其中第一滤波器组(230)为QMF滤波器组。
18.一种通过波形解码来产生时域音频信号的方法,该方法包括接收编码数据流;通过解码该编码数据流的数据值产生第一子带信号,该第一子带信号对应于时域音频信号的临界采样的复子带域信号表示;通过子带处理从第一子带信号产生第二子带信号,该第二子带信号对应于时域音频信号的非临界采样的复子带域表示;以及合成滤波器组从第二子带信号产生时域音频信号。
19.一种编码时域音频信号的方法,该方法包括接收时域音频信号;第一滤波器组从该时域音频信号产生第一子带信号,该第一子带信号对应于时域信号的非临界采样的复子带域表示;通过子带处理从第一子带信号产生第二子带信号,该第二子带信号对应于时域音频信号的临界采样的复子带域表示;以及通过编码第二子带信号的数据值来产生波形编码数据流。
20.一种用于接收音频信号的接收机,该接收机包括用于接收编码数据流的装置(401);用于通过解码该编码数据流的数据值产生第一子带信号的装置(403),该第一子带信号对应于时域音频信号的临界采样的复子带域信号表示;用于通过子带处理从第一子带信号产生第二子带信号的转换装置(405),该第二子带信号对应于时域音频信号的非临界采样的复子带域表示;以及用于从第二子带信号产生时域音频信号的合成滤波器组(407)。
21.一种用于传输编码音频信号的发送机,该发送机包括用于接收时域音频信号的装置(201);用于从时域音频信号产生第一子带信号的第一滤波器组(203),该第一子带信号对应于时域信号的非临界采样的复子带域表示;用于通过子带处理从第一子带信号产生第二子带信号的转换装置(205),该第二子带信号对应于时域音频信号的临界采样的复子带域表示;用于通过编码第二子带信号的数据值来产生波形编码数据流的装置(207);以及用于发送波形编码数据流的装置。
22.一种用于传输时域音频信号的传输系统,该传输系统包括发送机,其包括用于接收时域音频信号的装置(201);用于从时域音频信号产生第一子带信号的第一滤波器组(203),该第一子带信号对应于时域信号的非临界采样的复子带域表示;用于通过子带处理从第一子带信号产生第二子带信号的转换装置(205),该第二子带信号对应于时域音频信号的临界采样的复子带域表示;用于通过编码第二子带信号的数据值产生波形编码数据流的装置(207);以及用于发送波形编码数据流的装置;和接收机,其包括用于接收波形编码数据流的装置(401);用于通过解码该编码数据流的数据值产生第三子带信号的装置(403),该第三子带信号对应于时域音频信号的临界采样的复子带域信号表示;用于通过子带处理从第三子带信号产生第四子带信号的转换装置(405),该第四子带信号对应于时域音频信号的非临界采样的复子带域表示;以及用于从第四子带信号产生时域音频信号的合成滤波器组(407)。
23.一种接收音频信号的方法,该方法包括接收编码数据流;通过解码该编码数据流的数据值产生第一子带信号,该第一子带信号对应于时域音频信号的临界采样的复子带域信号表示;通过子带处理从第一子带信号产生第二子带信号,该第二子带信号对应于时域音频信号的非临界采样的复子带域表示;以及合成滤波器组从第二子带信号产生时域音频信号。
24.一种发送编码音频信号的方法,该方法包括接收时域音频信号;第一滤波器组从时域音频信号产生第一子带信号,该第一子带信号对应于时域信号的非临界采样的复子带域表示;通过子带处理从第一子带信号产生第二子带信号,该第二子带信号对应于时域音频信号的临界采样的复子带域表示;通过编码第二子带信号的数据值产生波形编码数据流;以及发送该波形编码数据流。
25.一种发送和接收时域音频信号的方法,该方法包括一个发送机接收时域音频信号;第一滤波器组从时域音频信号产生第一子带信号,该第一子带信号对应于时域信号的非临界采样的复子带域表示;通过子带处理从第一子带信号产生第二子带信号,该第二子带信号对应于时域音频信号的临界采样的复子带域表示;通过编码第二子带信号的数据值产生波形编码数据流;以及发送该波形编码数据流;和一个接收机接收波形编码数据流;通过解码该编码数据流的数据值产生第三子带信号,该第三子带信号对应于时域音频信号的临界采样的复子带域信号表示;通过子带处理从第三子带信号产生第四子带信号,该第四子带信号对应于时域音频信号的非临界采样的复子带域表示;以及合成滤波器组从第四子带信号产生时域音频信号。
26.一种用于执行根据权利要求18、19、23、24或25的任一项的方法的计算机程序产品。
27.一种包括根据权利要求1的解码器的音频播放装置。
28.一种包括根据权利要求5的编码器的音频记录装置。
全文摘要
一种编码器(109),包括接收时域音频信号的接收机(201)。第一滤波器组(203)从时域音频信号产生第一子带信号,其中该第一子带信号对应于时域信号的非临界采样的复子带域表示;转换装置(205)通过子带处理从第一子带信号产生第二子带信号,该第二子带信号对应于时域音频信号的临界采样的复子带域表示;编码处理器(207)然后通过编码第二子带信号的数据值产生波形编码数据流。转换装置(205)通过直接子带转换产生第二子带信号,而不需要转换回到时域。本发明能够具有低复杂度地对典型地在参数编码中产生的过采样子带信号进行波形编码。解码器执行相反的操作。
文档编号G10L19/02GK101053019SQ200580037757
公开日2007年10月10日 申请日期2005年10月31日 优先权日2004年11月2日
发明者L·F·威勒摩斯, E·G·P·舒伊杰斯 申请人:皇家飞利浦电子股份有限公司, 编码技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1