音频信号编码的制作方法

文档序号:2829003阅读:181来源:国知局
专利名称:音频信号编码的制作方法
技术领域
本发明涉及一种编码器,包括用于输入频段内的音频信号帧的输入,用于将频段划分为至少较低频段和较高频段的分析滤波器,用于对较低频段的音频信号进行编码的第一编码块,用于对较高频段的音频信号进行编码的第二编码块,以及模式选择器,用于在至少第一模式和第二模式之间选择编码器的工作模式,在第一模式中只对较低频段上的信号进行编码,在第二模式中对较低和较高频段上的信号进行编码。本发明还涉及一种设备,包括一种编码器,该编码器包括用于输入频段内的音频信号帧的输入,用于将频段划分为至少较低频段和较高频段的分析滤波器,用于对较低频段的音频信号进行编码的第一编码块,用于对较高频段的音频信号进行编码的第二编码块,以及用于在至少第一模式和第二模式之间选择编码器的工作模式的模式选择器,在第一模式中,只对较低频段上的信号进行编码,并在第二模式中,对较低和较高频段上的信号进行编码。本发明还涉及一种系统,包括一种编码器,该编码器包括用于输入频段内的音频信号帧的输入,至少一个用于对语音形式的音频信号执行第一激励的第一激励块,以及用于对非语音形式的音频信号执行第二激励的第二激励块。本发明进一步涉及一种用于压缩频段内的音频信号的方法,将该频段划分为至少较低频段和较高频段,用第一编码块对较低频段的音频信号进行编码,用第二编码块对较高频段的音频信号进行编码,以及在至少第一模式和第二模式之间选择编码模式,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。本发明涉及一种用于对频段内的音频信号帧进行编码的模块,将频段划分为至少较低频段和较高频段,该模块包括用于对较低频段的音频信号进行编码的第一编码块,用于对较高频段的音频信号进行编码的第二编码块,以及用于在至少第一模式和第二模式之间选择模块的工作模式的模式选择器,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。本发明涉及一种包括机器可执行步骤的计算机程序产品,该步骤用于压缩被至少划分为较低频段和较高频段的频段内的音频信号,用于由第一编码块对较低频段的音频信号进行编码,用于由第二编码块对较高频段的音频信号进行编码,以及用于在至少第一模式和第二模式之间选择编码的模式,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。本发明涉及一种包括比特流的信号,其包括用于解码器解码比特流的参数,该比特流是由频段内的音频信号帧编码而来的,该频段被划分为至少较低频段和较高频段,并且为该信号定义至少第一模式和第二模式,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。
背景技术
在很多音频信号处理应用中,对音频信号进行压缩以降低处理音频信号时的处理能力要求。例如,在数字通信系统中,音频信号通常作为模拟信号被捕捉到,在模拟-数字(A/D)转换器中进行数字化,并继而进行编码,之后在移动站等用户设备和基站之间的无线空中接口上进行传输。编码的目的是压缩所数字化的信号,并且以最小的数据量在空中接口上传输,同时保持可接受的信号质量等级。由于在蜂窝通信网络中,无线空中接口上的无线信道容量有限,这点非常重要。还有一些应用中,将所数字化音频信号存储在存储介质中,用以日后对音频信号进行再现。
压缩可以是有损或者无损的。在有损压缩中,在压缩期间会丢失某些信息,其中,不可能从所压缩信号中完全重建原始信号。在无损压缩中,通常不会丢失信息。因此,通常可以从所压缩信号中完全重建原始信号。
在电话业务中,语音的带宽通常限制在大约200Hz和3400Hz之间。A/D转换器用以将模拟语音信号转换为数字信号的典型采样率或者是8kHz,或者是16kHz。音乐或者非语音信号可包含高于普通语音带宽的频率分量。在某些应用中,音频系统应当能够处理大约20Hz至20000kHz之间的频段。那种信号的采样率应当至少为40000kHz,以避免混叠。应当注意到,上述各值只是非限制的示例。例如,在某些系统中,音乐信号的较高限制可能远远低于所述20000kHz。
然后对所采样的数字信号进行编码,通常在一帧一帧的基础上,得到数字数据流,其比特率由用于编码的编解码器确定。比特率越高,所编码的数据就越多,这使得对输入帧的表示越准确。然后可以对所编码的音频信号进行解码,使其通过数字-模拟(D/A)转换器,以重建尽可能接近原始信号的信号。
理想的编解码器将使用尽可能少的比特对音频信号进行编码,由此优化信道容量,同时产生所解码的音频信号,该信号尽可能与原始音频信号接近。实际上,编解码器的比特率和所解码音频的质量之间通常存在一种折衷。
目前,存在多种不同的编解码器,例如,自适应多速率(AMR)编解码器、自适应多速率宽带(AMR-WB)编解码器以及扩展自适应多速率宽带(AMR-WB+)编解码器,其为用于对音频信号进行压缩和编码而开发。AMR由第三代合作伙伴计划(3GPP)开发,用于GSM/EDGE和WCDMA通信网络。另外,还考虑到,AMR将在分组交换网络中使用。AMR基于代数码激励线性预测(ACELP)编码。AMR、AMR WB和AMR WB+编解码器分别包括8、9和12激活比特率,并且还包括语音激活检测(VAD)和非连续传输(DTX)功能。目前,AMR编解码器中的采样率是8kHz,AMR-WB编解码器中的采样率是16kHz。显然,上述编解码器、编解码模式和采样率只是非限制性的示例。
音频编解码器带宽扩展算法通常应用编码功能以及来自核心编解码器的编码参数。也就是,将所编码的音频带宽分为两个,其中较低频段由核心编解码器处理,较高频段则使用来自核心频段(例如,较低频段)的编码参数和信号的知识进行编码。由于在大多数情况下,低和高音频段彼此相关,也可以在某种程度上在高频段内使用低频段参数。使用来自低频段编码器的参数以有助于高频段编码显著降低了高频段编码的比特率。
分频段编码算法的一个示例是扩展AMR-WB(AMR-WB+)编解码器。核心编码器包含全部源信号编码算法,而高频段编码器的LPC激励信号是从核心编码器复制而来或者是在本地生成的随机信号。
低频段编码使用代数码激励线性预测(ACELP)类型或者基于变换的算法。基于输入信号特性在算法之间进行选择。ACELP算法通常用于语音信号以及用于短暂信号,而音乐和声调形式的信号通常使用变换编码进行编码,以更好地处理频率解析度。
高频段编码使用线性预测编码,以对高频段信号的频谱包络进行建模。为了节省比特率,激励信号是通过将低频段激励向上采样至高频段来生成的。也就是,通过将其变换至高频段,在高频段重新使用低频段激励。另一种方法用于生成高频段的随机激励信号。通过经由高频段LPC模型过滤该缩放了的激励信号,重建合成的高频段信号。
扩展AMR-WB(AMR-WB+)编解码器应用分频段结构,其中,在编码过程之前将音频带宽划分为两部分。对两个频段进行独立的编码。但是,为了最小化比特率,使用上述带宽扩展技术对较高频段进行编码,其中,高频段编码部分依赖于低频段编码。在这种情况下,用于线性预测编码(LPC)合成的高频段激励信号是从低频段编码器复制而来的。在AMR-WB+编解码器中,低频段范围是从0至6.4kHz,而高频段对于16kHz的采样频率是从6.4至8kHz,对于24kHz的采样率是从6.4至12kHz。
在音频流期间,AMR-WB+编解码器也能够在模式之间切换,只要采样频率没有发生变化。从而,可能在AMR-WB模式和使用16kHz采样频率的扩展模式之间进行切换。例如可以在传输条件需要从较高比特率模式(扩展模式)变化为较低比特率模式(AMR-WB模式)时使用这个功能,以降低网络中的拥塞。相似地,如果网络条件的变化允许从较低比特率模式变化为较高比特率模式以实现更好的音频质量,AMR-WB+可以从AMR-WB模式变化为其中一种扩展模式。从使用高频段扩展编码的编码模式变化为仅仅使用核心频段编码的模式可以简单地通过在这种模式发生变化时立即切断高频段扩展来实现。相似地,当从核心频段模式变化为使用高频段扩展的模式时,通过开启高频段扩展,立即全面引入高频段。由于带宽扩展编码,AMR-WB+扩展模式所提供的音频带宽宽于AMR-WB模式的带宽,这可能在切换发生太快时引起令人讨厌的听觉效果。用户可能认为在从较宽音频段变化为较窄音频段时,也就是,从扩展模式变化为AMR-WB模式时,可听到音频带宽的这种变化尤其令人烦扰。

发明内容
本发明的一个目的在于提供一种改进的方法,用于在编码器中对音频信号进行编码,以用于在具有不同带宽的模式之间切换时降低令人烦扰的听觉效应。
本发明所基于的思想是,当从窄带模式(AMR-WB模式)到宽带模式(AMR-WB+)的变化发生时,不是立即开启高频段扩展,而只是缓慢地将幅度提高至最终值,以避免太快速的变化。相似地,当从宽带模式变化为窄带模式时,不是立即切断高频段扩展的影响,而是渐进地缩小,以避免干扰效应。
根据本发明,通过使用于高频段合成的激励增益乘以在所选时间窗口内从零到一以小步长增长的缩放因子,在参数等级上实现高频段扩展信号的这种渐进地引入。在例如AMR-WB+编解码器中,可以使用320ms(4个80ms的AMR-WB+帧)的窗口长度,以提供高频段音频影响足够缓的斜度。以高频段音频影响斜度的相同方式,在这种情况下,通过使用于高频段合成的扩展增益乘以在所选时间段内从一到零以小步长降低的缩放因子,可以在参数等级上实现高频段信号的渐进结束。但是,在这种情况下,我们并不在实际切换至核心频段模式发生时就更新可用高频段扩展的参数。但是,可以通过使用在切换为核心模式之前最后一帧所接收的高频段扩展参数以及从在核心模式中所接收的帧中获得的激励信号执行高频段合成。这个方法的一个稍作修改的版本将在切换之后修改用于高频段合成的LPC参数,其方式使得,LPC滤波器的频率响应渐进地逼近更平坦的频谱。例如,这可以通过计算实际所接收LPC滤波器和在ISP域内提供平坦频谱的LPC滤波器的加权平均值来实现。这种方法可能在具有高频段扩展参数的最后一帧碰巧包括清晰的频谱峰值的情况下提供改进的音频质量。
依照本发明的方法提供与时域中直接缩放相似的效果,而在参数等级上进行缩放是在计算上更加有效的解决方案。
依照本发明的编码器主要特征在于,编码器进一步包括缩放器,以关联于编码器的工作模式的变化,控制第二编码块渐进地改变编码块的编码属性。
依照本发明的设备主要特征在于,编码器进一步包括缩放器,以关联于编码器的工作模式的变化,控制第二编码块渐进地改变编码块的编码属性。
依照本发明的系统主要特征在于,系统进一步包括缩放器,以关联于编码器的工作模式的变化,控制第二编码块渐进地改变第二编码块的编码属性。
依照本发明的方法主要特征在于,关联于工作模式的变化,渐进地改变第二编码块的编码属性。
依照本发明的模块主要特征在于,模块进一步包括缩放器,以关联于模块的工作模式的变化,控制第二编码块渐进地改变第二编码块的编码属性。
依照本发明的计算机程序产品主要特征在于,计算机程序产品进一步包括机器可读步骤,用于关联于工作模式的变化,渐进地改变第二编码块的编码属性。
依照本发明的信号主要特征在于,在所述第一模式和所述第二模式之间变化时,渐进地改变有关所述较高频段的信号参数中的至少一个。
与上述现有技术方法相比较,本发明提供一种用于降低由于在不同带宽模式之间切换而产生的听觉效果的解决方案。因此,可以改进音频信号质量。本发明提供与时域中直接缩放相似的功能,而且,在参数等级上执行缩放是在计算上更加有效的解决方案。


图1表示有关依照本发明使用两个频段滤波器组以及用于每个音频段的独立编码和解码块的分频段编码解码概念的简化图,图2表示依照本发明的编码设备的一个示例性实施方式,图3表示依照本发明的解码设备的一个示例性实施方式,图4a表示在现有技术编码器中从窄带到宽带的频段切换的频谱图,图4b表示在本发明一个实施方式的编码器中从窄带到宽带的频段切换的频谱图,图4c表示当在现有技术编码器以及在本发明一个实施方式的编码器中频段从窄带切换为宽带时,时间轴上所编码高频段信号的能量,图5a表示在现有技术编码器中从宽带到窄带的频段切换的频谱图,图5b表示在本发明一个实施方式的编码器中从宽带到窄带的频段切换的频谱图,图5c表示当在现有技术编码器以及在本发明一个实施方式的编码器中频段从宽带切换为窄带时,时间轴上所编码的高频段信号的能量,图6表示依照本发明的一个系统示例。
具体实施例方式
图1表示依照本发明一个示例实施方式使用两个频段滤波器组以及对于每个音频段使用独立编码和解码块的分频段编码和解码概念。来自信号源1.2的输入信号首先通过分析滤波器1.3进行处理,在分析滤波器1.3中,将音频段划分为至少两个音频段,也就是,划分为较低频率音频段和较高频率音频段,并且临界地进行向下采样。然后分别在第一编码块1.4.1中对较低频率音频段进行编码,并且在第二编码块1.4.2中对较高频率音频段进行编码。音频段基本上彼此独立地进行编码。将复用的比特流从发射设备1通过通信信道2传送至接收设备3,在接收设备3中,分别独立地在第一解码块3.3.1和第二解码块3.3.2中对低频段和高频段进行解码。将所解码的信号进行向上采样至原始采样频率,在这之后,合成滤波器组3.4合并所解码的音频信号,以形成合成音频信号3.5。
在工作于16kHz采样音频信号的AMR-WB+的情况下,将8kHz音频段划分为0-6.4和6.4-8kHz频段。在分析滤波器1.3之后,使用临界向下采样。也就是,低频段向下采样至12.8kHz(=2*(0-6.4)),将高频段重新采样至3.2kHz(=2*(8-6.4))。
例如,第一编码块1.4.1(低频段编码器)和第一解码块3.3.1(低频段解码器)可以是AMR-WB标准编码器和解码器,而第二编码块1.4.2(高频段编码器)和第二解码器3.3.2(高频段解码器)可以实现为独立编码算法,实现为带宽扩展算法或者实现为这些的组合。
在下文中,将参考图2详细描述依照本发明一个示例性实施方式的编码设备1。编码设备1包括输入块1.2,用于在必要时对输入信号进行数字化、滤波以及成帧。输入信号的数字化由输入采样器1.2.1以输入采样频率实现。在一个示例性实施方式中,输入采样器频率或者是16kHz,或者是24kHz,但是显然也可以使用其它采样频率。在这里应当注意到,输入信号的形式可能已经适用于进行编码过程。例如,可能在前面的阶段已经对输入信号进行了数字化,并且存储在存储介质中(未示出)。将输入信号的帧输入到分析滤波器1.3。分析滤波器1.3包括滤波器组,其中,将音频段划分为两个或多个音频段。在这个实施方式中,滤波器组包括第一滤波器1.3.1和第二滤波器1.3.2。例如,第一滤波器1.3.1是在较低音频段的上限处具有截止频率的低通滤波器。例如,截止频率大约是6.4kHz。例如,第二滤波器1.3.2是带通滤波器,其带宽从第一滤波器1.3.1的截止频率上至音频段的上限。例如,对于16kHz采样频率带宽是6.4kHz-8kHz,对于24kHz采样频率带宽是6.4kHz-12kHz。如果在编码器1.4输入处,音频信号的频段上限小于或者等于采样频率的一半时,第二滤波器1.3.2也可能是高通滤波器,也就是,只有低于上限的频率通过分析滤波器1.3。也可能将音频段划分为多于两个的音频段,其中,分析滤波器可包括用于每个音频段的滤波器。但是,在下文中假设,只使用两个音频段。
对滤波器组的输出进行临界向下采样,以降低传输音频信号所必要的比特率。在第一采样器1.3.3中对第一滤波器1.3.1的输出进行向下采样,在第二采样器1.3.4中对第二滤波器1.3.2的输出进行向下采样。例如,第一采样器1.3.3的采样频率是第一滤波器1.3.1带宽的一半。例如,第二采样器1.3.4的采样频率是第二滤波器1.3.2带宽的一半。在这个示例性实施方式中,第一采样器1.3.3的采样频率是12.8kHz,第二采样器1.3.4的采样频率对于16kHz的输入音频信号采样频率是6.4kHz,对于24kHz的输入音频信号采样频率是11.2kHz。
来自第一采样器1.3.3的采样输入到第一编码块1.4.1中进行编码。来自第二采样器1.3.4的采样分别输入到第二编码块1.4.2中进行编码。第一编码块1.4.1分析该采样,以确定哪种激励方法是最适合的一种用于对输入信号进行编码的方法。可能有两种或多种激励方法供选择。例如,对非语音(或者非语音形式)信号(例如,音乐)选择第一激励方法,对语音(或者语音形式)信号选择第二激励方法。第一激励方法产生例如TCX激励信号,并且第二激励方法产生例如ACELP激励信号。
在选择激励方法之后,在第一编码块1.4.1中在一帧一帧的基础上对采样进行LPC分析,以找到与输入信号最佳匹配的参数组。存在一些可供选择的方法实现这个目的,并且这些方法为本领域中熟练的技术人员所已知,其中不必在本申请中描述LPC分析的细节。
将所选激励方法的信息以及LPC参数传送至第二编码块1.4.2。在第二编码块1.4.2使用在第一编码块1.4.1中产生的相同激励。在这个示例性实施方式中,通过将较低频率音频段激励向上采样至较高频率音频段,产生第二编码块1.4.2的激励信号。也就是,通过将其变换至较高频率音频段,在高频段处重新使用低频段激励。用于描述AMR-WB+编解码器中较高频率音频信号的参数是LPC合成滤波器,其定义所合成信号的频谱特性,以及一组用于控制所合成音频的幅度的激励信号的增益参数。
例如,在量化和信道编码块1.5中对第一编码块1.4.1和第二编码块1.4.2所生成的LPC参数和激励参数进行量化和信道编码,并且在传输至传输信道,例如,通信网络604(图6)之前,将其由流生成块1.6合并(复用)在同一个传输流中。但是,不必传送参数,而是例如可以将其存储在存储介质中,并且在后面的阶段取回以进行传输和/或解码。
下面,将详细描述当在第一编码模式和第二编码模式之间进行切换时依照本发明一个示例实施方式的方法。第一编码块例如是窄带编码模式,第二编码模式例如是宽带编码模式。
定义指示模式变化持续时间长度的时间参数T。时间参数T用于渐进地改变编码模式。时间参数的值例如是320ms,其等于帧长度F(AMR-WB+编码器中为80ms)的四倍。显然,也可以对时间参数T使用其它值。还定义乘数M以及步长值S,以在模式变化期间由第二编码块使用。定义步长值,使得其指示在模式变化时使用多大的步长。例如,如果时间参数T等于四个帧(4*FL),则步长值等于0.25(=1/4),也就是,可以通过将帧长度除以时间参数计算步长值(=F/T)。
首先,假设编码器1使用第一编码模式,并且将进行到第二编码模式的变化。在第一编码块1.4.1中继续较低频率音频信号的编码,如上所述。将模式指示器(未示出)设定为一个状态,指示选择了第二编码模式。除此之外,如果必要,将编码模式的信息和LPC参数以及其它参数从第一编码块1.4.1传送至第二编码块1.4.2。在第二编码块1.4.2中,并未由此使用所接收的LPC参数,而是进行对至少某些参数的修改。将乘数M设置为零。在这之后,通过将LPC增益参数组乘以乘数M,对LPC增益参数组进行修改。在当前帧(一组采样)的编码过程中,第二编码块1.4.2使用所修改的LPC参数。然后,对于下一帧,乘数M增加步长值S,并且如上所述地对LPC增益参数组进行修改。对于每个连续帧重复上述过程,直至乘数M到达值1,从那开始使用1,并且继续编码器1的第二编码模式(宽带模式)工作。
接下来,假设编码器1正在使用第二编码模式,并且进行到第一编码模式的变化。在第一编码块1.4.1中继续较低频率音频信号的编码,如上所述。将模式指示器设定为一个状态,指示选择了第一编码模式。在这个阶段,并未将编码模式的信息和LPC参数从第一编码块1.4.1正常传送至第二编码块1.4.2。因此,对于将要工作的编码模式的渐进变化,某些安排是必要的。在第一可供选择的实施方式中,第二编码块1.4.2已经存储了在对模式变化之前的最后一帧进行编码中所用的LPC参数。然后,将乘数M设定为一,LPC增益参数组乘以乘数M,并且在对模式变化之后的第一帧进行编码中使用修改的LPC增益参数组。对于后面的帧,乘数M减少步长值S,使LPC参数组乘以乘数M,并且对那个帧进行编码。重复上述步骤(改变乘数值,修改LPC参数组,以及对帧进行编码),直至乘数到达零值。在那之后,只有第一编码块1.4.1继续编码过程。
作为一个示例,用于放大和缩小的向量可以如下所示。向量包含64个元素,表示一个元素用于5ms子帧。这表示,在320ms期间进行放大/缩小。
gain_hf_ramp[64]={0.01538461538462,0.03076923076923,0.04615384615385,0.06153846153846,0.07692307692308,0.09230769230769,0.10769230769231,0.12307692307692,0.13846153846154,0.15384615384615,0.16923076923077,0.18461538461538,0.20000000000000,0.21538461538462,0.23076923076923,0.24615384615385,0.26153846153846,0.27692307692308,0.29230769230769,0.30769230769231,0.32307692307692,0.33846153846154,0.35384615384615,0.36923076923077,0.38461538461538,0.40000000000000,0.41538461538462,0.43076923076923,
0.44615384615385,0.46153846153846,0.47692307692308,0.49230769230769,0.50769230769231,0.52307692307692,0.53846153846154,0.55384615384615,0.56923076923077,0.58461538461538,0.60000000000000,0.61538461538462,0.63076923076923,0.64615384615385,0.66153846153846,0.67692307692308,0.69230769230769,0.70769230769231,0.72307692307692,0.73846153846154,0.75384615384615,0.76923076923077,0.78461538461538,0.80000000000000,0.81538461538462,0.83076923076923,0.84615384615385,0.86153846153846,0.87692307692308,0.89230769230769,0.90769230769231,0.92307692307692,0.93846153846154,0.95384615384615,0.96923076923077,0.98461538461538}当在第二编码块1.4.2中对较高频段进行放大时,第二编码块1.4.2的激励增益乘以值1,其索引指向缩放向量。索引值是5ms编码子帧的个数。因此,在模式切换之后,在第一子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的第一元素。在第二子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的第二元素,等等。
当在第二编码块1.4.2中对较高频段进行缩小时,第二编码块1.4.2的激励增益也乘以值1,其索引指向缩放向量。索引值是5ms编码子帧的个数,但是反向索引指针。因此,在模式切换之后,在第一子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的最后一个元素。在第二子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的倒数第二个元素,等等。
当对较高频段进行缩小(例如,模式从AMR-WB+切换为AMR-WB)时,第二编码块1.4.2的最后一个编码语音参数(LPC参数、激励和激励增益)用于在不使用第二编码块1.4.2的工作模式时在第一个320ms期间生成较高频段。
一个示例伪代码可以如下所述ExcGain2=ExcGain2*gain_hf_ramp(ind)Exc_hf(1:n)=ExcGain2*Exc_lf(1:n)Output_hf=synth(LPC_hf,exc_hf,mem),其中ExcGain2=Excitation_gain_in_the_second_encoding_blockgain_hf_ramp =缩放向量Exc_lf=来自第一编码块的激励向量(带宽0-6,4kHz)Exc_hf=来自第二编码块的激励向量(带宽6,4-8,0kHz)Output_hf =对于较高频段的合成信号Synth =建立合成信号的函数LPC =LP滤波器系数Mem =LP滤波器的存储器这个方法的一个稍作修改的版本将在切换之后修改用于高频率音频段合成的LPC参数,其方式使得,LPC滤波器的频率响应渐进地逼近更加平坦的频谱。例如,这可以通过计算实际所接收的LPC滤波器以及在ISP域中提供平坦频谱的LPC滤波器的加权平均来实现。在具有较宽带宽扩展参数的最后一帧碰巧包括清晰的频谱峰值的情况下,这种方法可能提供改进的音频质量。
也可以基于以诸如LPC或者其它参数为基础的音频信号特性,自适应地实现放大/缩小。代替线性的缩放向量,缩放向量也可以是非线性的。缩放向量也可以对于放大和缩小有所不同。
在下面,将参考图3详细描述依照本发明的解码设备3。从传输信道2接收到所编码的音频信号。解复用器3.1将属于较低频率音频段的参数信息解复用到第一比特流,将属于较高频率音频段的参数信息解复用到第二比特流。然后在必要时,在信道解码和反量化块3.2中对比特流进行信道解码以及反量化。
第一信道解码比特流包含第一编码块1.4.1所生成的LPC参数和激励参数,并且在使用宽带模式时,第二信道解码比特流包含第二编码块1.4.2所生成的LPC增益组和其它LPC参数(描述LPC滤波器特性的参数)。
将第一比特流输入到第一解码块3.3中,其依照所接收的LPC增益和其它参数进行LPC滤波(低频段LPC合成滤波),以形成合成的较低频率音频段信号。在滤波器3.3.1之后有一个第一向上采样器3.3.2,用于将所解码和滤波的信号采样至原始采样频率。
当在比特流中存在时,将第二比特流输入到第二解码块3.4中,其依照所接收的LPC增益和其它参数进行LPC滤波(高频段LPC合成滤波),以形成合成的较高频率音频段信号。在乘法器3.4.1中,将第一比特流的激励参数乘以LPC增益参数组。将所乘的激励参数输入到滤波器3.4.2,其中,也输入第二比特流的其它LPC参数。滤波器3.4.2在输入到滤波器3.4.2的参数的基础上,重建较高频率音频段信号。在滤波器3.4.2之后有一个第二向上采样器3.4.3,用于将所解码和滤波的信号采样至原始采样频率。
第一向上采样器3.3.2的输出与合成滤波器组3.5的第一滤波器3.5.1相连。分别地,第二向上采样器3.4.3的输出与合成滤波器组3.5的第二滤波器3.5.2相连。第一滤波器3.5.1和第二滤波器3.5.2的输出相连,作为合成滤波器组3.5的输出,其中,输出信号是重建的音频信号,或者是宽带或者是窄带,取决于在对音频信号进行编码中所用的模式。
显然,所编码的音频信号不是必须如图1所示从通信信道2接收,而也可以是先前存储在存储器介质中的编码比特流。
如上所述,本发明提供一种方法,以在从使用高频段扩展编码的编码模式变化为仅仅使用核心频段编码的模式时渐进地切断高频段扩展的影响。在相对短的时间段内,例如,在几百毫秒内,从全值到零逐步改变高频段影响的幅度将使音频带宽的变化更加平滑,对于用户更不明显,提供改进的音频质量。同样地,当发生从核心频段模式到使用高频段扩展编码的模式的变化时,不会立即全值引入高频段影响,而是其幅度在相对短时间窗口期间以小步长从零缩放到全值,以引入具有改进音频质量的平滑切换。
尽管本发明主要用于16kHz采样音频,但是,在图4a-5c中,24kHz采样音频信号作为切换的示例。因此,AMR-WB+工作在24kHz采样音频信号上。将12KHz音频段划分为0-6.4和6.4-12kHz频段。在滤波器组之后使用临界向下采样。也就是,将低频段向下采样至12.8kHz,将高频段重新采样至11.2kHz(=2*(12-6.4))。
分别地,图4a表示执行从窄带到宽带的现有技术切换的情况,图4b表示执行依照本发明的切换的情况。图4c表示在现有技术以及依照本发明的切换的情况下,所编码高频段信号的总能量。
分别地,图5a表示执行从宽带到窄带的现有技术切换的情况,图5b表示执行依照本发明的切换的情况。图5c表示在现有技术以及在依照本发明的切换的情况下,所编码高频段信号的总能量。
图6表示依照本发明的一个系统示例,其中,可以应用分频段编码和解码过程。系统包括一个或多个音频源601,产生语音和/或非语音音频信号。在必要时,由A/D转换器602将音频信号转换为数字信号。将数字信号输入到发射设备600的编码器603,在发射设备600中,依照本发明进行编码。必要时在编码器603中对所编码的信号也进行量化和编码,以用于传输。发射机604,例如,移动通信设备600的发射机,将经过压缩和编码的信号传送至通信网络605。接收设备606的接收机607从通信网络605接收信号。将所接收的信号从接收机607传送至解码器608,以进行解码、反量化以及解压缩。解码器608执行对所接收比特流的解压缩,以形成合成的音频信号。然后,可以在例如扩音器609中将所合成的音频信号转换为音频。
本发明可以实现在不同类型的系统中,尤其是在低速率传输中,用于获得比现有技术系统更有效的压缩。依照本发明的编码器1可以实现在通信系统的不同部件中。例如,编码器1可以实现在可能具有有限的信号处理能力的移动通信设备中。
本发明至少可以部分地实现作为计算机程序产品,包括机器可执行步骤,用于执行本发明方法的至少某些部分。编码设备1和解码设备3包括控制块,例如,数字信号处理器和/或微处理器,其中,可以使用计算机程序。
显然,本发明并不仅仅限于上述的实施方式,而是可以在所附权利要求书的范围内对其进行修改。
权利要求
1.一种编码器(1),包括用于输入频段内的音频信号帧的输入(1.2),用于将该频段划分为至少较低频段和较高频段的滤波器(1.3),用于对该较低频段的音频信号进行编码的第一编码块(1.4.1),用于对该较高频段的音频信号进行编码的第二编码块(1.4.2),以及用于在至少第一模式和第二模式之间选择编码器的工作模式的模式选择器,在该第一模式中只对该较低频段上的信号进行编码,并在该第二模式中对该较低和较高频段二者上的信号进行编码,其特征在于,所述编码器(1)进一步包括缩放器,以关联于该编码器的工作模式的变化,控制该第二编码块(1.4.2)渐进地改变该第二编码块(1.4.2)的编码属性。
2.根据权利要求1所述的编码器(200),其特征在于,所述编码属性包括增益参数,其中,所述缩放器包括计算元件,以关联于编码器的工作模式的变化渐进地改变该增益参数。
3.根据权利要求2所述的编码器(200),其特征在于,安排在所述第一编码块(1.4.1)中定义激励,安排有关该激励的信息分发至所述第二编码块(1.4.1)用于对所述较高频段的信号进行编码,以及所述第二编码块(1.4.1)包括用于将该增益参数与所述较高频段信号的编码相关联的装置,其中,安排所述计算元件渐进地改变该增益参数,以便由所述第二编码块(1.4.2)加以使用。
4.根据权利要求1、2或3所述的编码器(200),其特征在于,定义时间参数(T),指示该模式变化持续时间的长度。
5.根据权利要求4所述的编码器(200),其特征在于,为所述时间参数(T)定义的值为320ms。
6.根据权利要求4或5所述的编码器(200),其特征在于,定义步长值(S),指示在该编码属性渐进变化时所用步长为多大。
7.根据权利要求6所述的编码器(200),其特征在于,定义所述步长值(S),以指示在64个步长内渐进地执行所述编码属性的变化。
8.根据权利要求6所述的编码器(200),其特征在于,定义向量,包含对于该编码属性变化的每个步长的增益的缩放因子。
9.根据权利要求1至8中任何一个权利要求所述的编码器(200),其特征在于,其包括采样器(1.2),用于对音频信号进行采样以及形成所采样的音频信号帧。
10.根据权利要求4所述的编码器(200),其特征在于,定义所述时间参数(T),指示该模式变化所持续的帧个数。
11.根据权利要求1至10中任何一个权利要求所述的编码器,其特征在于所述编码器是AMR-WB编码器。
12.根据权利要求11所述的编码器,其特征在于,该编码块(1.4.2)的该渐进变化的编码属性包括激励、LPC和增益参数。
13.一种设备(600),包括一种编码器(1),该编码器包括用于输入频段内的音频信号帧的输入(1.2),用于将该频段划分为至少较低频段和较高频段的分析滤波器(1.3),用于对该较低频段的音频信号进行编码的第一编码块(1.4.1),用于对该较高频段的音频信号进行编码的第二编码块(1.4.2),以及用于在至少第一模式和第二模式之间选择该编码器的工作模式的模式选择器,在该第一模式中,只对该较低频段上的信号进行编码,在该第二模式中,对该较低和较高频段二者上的信号进行编码,其特征在于,该编码器(1)进一步包括缩放器,以关联于该编码器的工作模式的变化,控制该第二编码块(1.4.2)渐进地改变该编码块(1.4.2)的编码属性。
14.根据权利要求13所述的设备(600),其特征在于,所述编码属性包括增益参数,其中,所述缩放器包括计算元件,以关联于该编码器的工作模式的变化,渐进地改变该增益参数。
15.一种系统,包括编码器(1),该编码器包括用于输入频段内的音频信号帧的输入(1.2),用于将该频段划分为至少较低频段和较高频段的滤波器(1.3),用于对该较低频段的音频信号进行编码的第一编码块(1.4.1),,用于对该较高频段的音频信号进行编码的第二编码块(1.4.2),以及用于在至少第一模式和第二模式之间选择该编码器的工作模式的模式选择器,在该第一模式中,只对该较低频段上的信号进行编码,在该第二模式中,对该较低和较高频段二者上的信号进行编码,其特征在于,该系统进一步包括缩放器,以关联于该编码器的工作模式的变化,控制该第二编码块(1.4.2)渐进地改变该第二编码块(1.4.2)的编码属性。
16.根据权利要求15所述的系统,其特征在于,所述编码属性包括增益参数,其中,所述缩放器包括计算元件,以关联于该编码器的工作模式的变化渐进地改变增益参数。
17.一种用于在频段内压缩音频信号的方法,将该频段划分为至少较低频段和较高频段,通过第一编码块(1.4.1)对该较低频段的音频信号进行编码,通过第二编码块(1.4.2)对该较高频段的音频信号进行编码,以及在至少第一模式和第二模式之间选择编码模式,在该第一模式中只对该较低频段上的信号进行编码,在该第二模式中对该较低和较高频段二者上的信号进行编码,其特征在于,关联于工作模式的变化,渐进地改变该第二编码块(1.4.2)的编码属性。
18.根据权利要求17所述的方法,其特征在于,所述编码属性包括增益参数,其中关联于工作模式的变化渐进地改变该增益参数。
19.根据权利要求18所述的方法,其特征在于,在所述第一编码块(1.4.1)中定义所述增益参数,以用于控制对所述较低频段信号的编码,将所述增益参数分发至所述第二编码块(1.4.1),其中渐进地改变所述第二编码块(1.4.2)所使用的增益参数。
20.根据权利要求17、18或19所述的方法,其特征在于,定义时间参数(T),指示该模式变化持续时间的长度。
21.根据权利要求20所述的方法,其特征在于,定义步长值(S),指示在该编码属性渐进变化时所用步长为多大。
22.根据权利要求17至21中任何一个权利要求所述的方法,其特征在于,对该音频信号进行采样,并且从所采样的音频信号形成帧。
23.根据权利要求22所述的方法,其特征在于,定义参数(T),指示该模式变化所持续的帧个数。
24.根据权利要求17至23中任何一个权利要求所述的方法,其特征在于,在编码中使用LPC激励以产生一组LPC参数,其中渐进地改变其中至少一个该LPC参数。
25.一种用于对频段内的音频信号帧进行编码的模块,该频段被划分为至少较低频段和较高频段,该模块包括用于对该较低频段的音频信号进行编码的第一编码块(1.4.1),用于对该较高频段的音频信号进行编码的第二编码块(1.4.2),以及用于在至少第一模式和第二模式之间选择该模块的工作模式的模式选择器,在该第一模式中,只对该较低频段上的信号进行编码,在该第二模式中,对该较低和较高频段二者上的信号进行编码,其特征在于,该模块进一步包括缩放器,以关联于该模块的工作模式的变化,控制该第二编码块(1.4.2)渐进地改变该第二编码块(1.4.2)的编码属性。
26.根据权利要求25所述的模块,其特征在于,所述编码属性包括增益参数,其中,所述缩放器包括计算元件,以关联于该编码器的工作模式的变化渐进地改变该增益参数。
27.一种计算机程序产品,包括用于在频段内压缩音频信号的机器可执行步骤,该频段被划分为至少较低频段和较高频段,该机器可执行步骤包括用于由第一编码块(1.4.1)对该较低频段的音频信号进行编码的步骤,用于由第二编码块(1.4.2)对该较高频段的音频信号进行编码的步骤,以及用于在至少第一模式和第二模式之间选择编码的模式的步骤,在该第一模式中只对该较低频段上的信号进行编码,在该第二模式中对该较低和较高频段二者上的信号进行编码,其特征在于,该计算机程序产品进一步包括用于关联于该工作模式的变化渐进地改变该第二编码块(1.4.2)的编码属性的机器可执行步骤。
28.根据权利要求27所述的计算机程序产品,其特征在于,所述编码属性包括增益参数,其中,所述计算机程序产品包括机器可执行步骤,用于关联于该编码器的工作模式的变化渐进地改变该增益参数。
29.一种包括比特流的信号,包括解码器解码所述比特流的参数,该比特流由频段内的音频信号帧编码而来,该频段被划分为至少较低频段和较高频段,以及为该信号定义至少第一模式和第二模式,在该第一模式中,只对该较低频段上的信号进行编码,在该第二模式中,对该较低和较高频段二者上的信号进行编码,其特征在于,在所述第一模式和所述第二模式之间进行模式变化时,渐进地改变有关所述较高频段的信号参数的其中至少一个。
30.根据权利要求29所述的信号,其特征在于所述编码属性包括增益参数,其中,所述信号包括所述增益参数,所述增益参数关联于该编码器的工作模式的变化渐进地进行改变。
全文摘要
本发明涉及一种编码器(1),包括用于输入频段内的音频信号帧的输入(1.2),用于将频段划分为至少较低频段和较高频段的分析滤波器(1.3),用于对较低频段的音频信号进行编码的第一编码块(1.4.1),用于对较高频段的音频信号进行编码的第二编码块(1.4.2),以及用于在至少第一模式和第二模式之间选择编码器的工作模式的模式选择器。在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。编码器(1)进一步包括缩放器,以关联于编码器的工作模式的变化,控制第二编码块(1.4.2)渐进地改变第二编码块(1.4.2)的编码属性。本发明还涉及一种设备、解码器、方法、模块、计算机程序产品和信号。
文档编号G10L19/24GK1942928SQ200580011492
公开日2007年4月4日 申请日期2005年4月14日 优先权日2004年4月15日
发明者帕西·奥雅拉, 雅里·马基南, 阿里·拉卡尼米 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1