瞬态检测器以及用于支持音频信号的编码的方法

文档序号:2831813阅读:167来源:国知局

专利名称::瞬态检测器以及用于支持音频信号的编码的方法
技术领域
:本发明涉及对音频信号进行操作的瞬态检测器以及用于支持音频信号的编码的方法。
背景技术
:编码器是一种能够分析诸如音频信号之类的信号并以编码的形式输出信号的设备、电路或计算机程序。所得到的信号通常用于传输、存储和/加密的目的。另一方面,解码器是一种能够反转编码器操作的设备、电路或计算机程序,因为其接收编码的信号并输出解码的信号。在大多数现有技术的编码器(例如音频编码器)中,在频域中分析输入信号的每个帧。这一分析的结果被量化和编码,并且然后根据应用进行传输或存储。在接收侧(或者当使用所存储的编码信号时),后面是合成过程的相应解码过程使得有可能在时域中恢复信号。编解码器通常用于压縮/解压縮信息(例如音频和视频数据)以便通过带宽受限的通信信道进行高效的传输。特别地,市场高度需要以低比特率传输和存储音频信号,同时保持高的音频质量。例如,在传输资源或存储受限的情况下,低比特率操作是必要的成本因素。例如在移动通信系统中的流式传输和消息接发应用中通常是这种情况。在图1中示意性地示出使用音频编码和解码的音频传输系统的一般实例。整个系统基本上包括在发射侧的音频编码器IO和发射模块(TX)20以及在接收侧的接收模块(RX)30和音频解码器40。音频信号可以被认为是准稳态的,即短时间段的稳态。例如,基于变换的音频编解码器将信号分成短时间段即帧,并且依赖于准稳态性来实现高效的压縮。音频信号可以包含在频谱或振幅中的许多快速变化,即所谓的瞬态。期望检测这些瞬态,以使音频编解码器可以采取适当的动作来避免瞬态可能在例如基于变换的音频编解码器中引起的听得到的赝象(artifact)(例如前回声效应,即在时间上的量化噪声扩散)。因为这个原因,所以结合音频编解码器来使用瞬态检测器。瞬态检测器分析音频信号,并且负责将所检测到的瞬态用信号通知给编码器。存在操作在时域中的瞬态检测器以及操作在频域中的瞬态检测器。例如,瞬态检测器通常作为到窗切换模块的输入而被包括在音频编解码器中[1、2]。
发明内容然而,通常需要更高效的音频编码以及用于支持包括瞬态检测器的音频编码的改进的机制和实现方式。4本发明的一般目的是提供一种对音频信号进行操作的改进的瞬态检测器。还有一个目的是提供一种用于支持音频信号的编码的方法。这些和其他目的由所附的专利权利要求所限定的本发明来满足。本发明人已认识到,当在时域中执行瞬态检测并且编解码器基于重叠变换来操作时,给定帧中的瞬态也将影响后一帧的编码。因此,本发明的基本思想是提供一种瞬态检测器,所述瞬态检测器分析输入音频信号的给定帧n以基于给定帧n的音频信号特性来确定后一帧n+l的瞬态拖尾(hangover)指示符,以及将所确定的瞬态拖尾指示符用信号通知给相关联的音频编码器以实现后一帧n+l的适当编码。优选地,当帧n的音频信号特性包括表示瞬态的特性时,瞬态检测器确定后一帧n+1的指示瞬态的瞬态拖尾指示符。实际上,因此有可能以下面的这种方式来配置瞬态检测器如果检测到瞬态并且用信号通知给当前帧的编解码器,则瞬态检测器还将用信号通知与后一帧有关的瞬态拖尾。以这种方式可以确保,当编解码器基于重叠变换进行操作时还对后一帧采取适当的编码动作。本发明覆盖瞬态检测器以及用于支持音频信号的编码的方法这二者。当阅读下面对本发明的实施例的描述时将会认识到由本发明提供的其他优点。通过参考与附图一起得到的下面的描述,将会最好地理解本发明连同其更多的目的和优点,其中图1是示出使用了音频编码和解码的音频传输系统的一般实例的示意性框图。图2是示出根据本发明一个示例性实施例的与音频编码器相关联的新颖的瞬态检测器的示意性框图。图3A-B是示出在给定输入帧n中的瞬态可以如何影响后一帧的编码的示意图。图4是根据本发明一个示例性实施例的用于支持音频信号的编码的方法的示意性流程图。图5是示出可以如何将帧分成块以用于功率计算目的的实例的示意图。图6是示出具有高通滤波的瞬态检测器的实例的示意图。图7是示出根据本发明一个示例性实施例的具有瞬态拖尾检查的瞬态检测器的实例的示意图。图8A-B是示出根据本发明一个示例性实施例的瞬态的第一实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。图9A-B是示出根据本发明一个示例性实施例的瞬态的第二实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。图10A-B是示出根据本发明一个示例性实施例的瞬态的第三实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。图11是适合于全带扩展的示例性编码器的框图。图12是适合于全带扩展的示例性解码器的框图。具体实施例方式在全部附图中,相同的附图标记将被用于相应的或类似的元素。如先前所提到的那样,期望检测音频信号中的瞬态,以使音频编解码器可以采取适当的动作来避免瞬态可能在例如基于变换的音频编解码器以及更一般的是基于重叠变换来进行操作的音频编码器中引起的听得到的赝象(例如前回声效应)。前回声通常在具有尖锐上升(attack)的信号开始在紧接在低能量区域后的变换块的末端附近时出现。一般来说,瞬态由音频信号特性(例如在时域和/或频域中测量的振幅和/或功率)中的突变来表征。优选地,音频编码器被配置成在针对输入帧检测到瞬态时执行尤其适于瞬态的基于变换的编码(瞬态编码模式)。存在许多用于编码瞬态的不同的常规策略。然而,本发明人已认识到,当在时域中执行瞬态检测并且编解码器基于重叠变换来操作时,给定帧中的瞬态也将影响后一帧的编码。基于对重叠变换编解码器的操作的这一理解,引入新颖的瞬态检测器。图2是示出根据本发明一个示例性实施例的与音频编码器相关联的新颖的瞬态检测器的示意性框图。图2的瞬态检测器100基本上包括分析器110和信令模块120。要被相关联的音频编码器10编码的音频信号还作为到瞬态检测器100的输入而被传送。一般地,瞬态检测器在操作中用来检测音频信号的当前输入帧中的瞬态,并且将所述瞬态用信号通知给音频编码器以用于当前帧的适当编码。在该实例中,音频编码器io优选地是使用了重叠变换的基于变换的编码器。分析器110基于所接收的音频信号来执行合适的信号分析。优选地,瞬态检测器100分析音频信号的给定帧n以基于所述给定帧n的音频信号特性来在分析器110的新颖拖尾指示符模块中确定后一帧n+l的瞬态拖尾指示符。信令模块120在操作中用于将所确定的瞬态拖尾指示符用信号通知给相关联的音频编码器10以实现后一帧n+l的适当编码。可以使用任何合适的瞬态检测量度,例如短期与长期的能量比。因此有可能的是,瞬态检测器100不仅用信号通知当前帧n的瞬态,而且还基于对当前帧n的分析来用信号通知后一帧n+l的瞬态拖尾指示符。如在图3A-B中所示出的那样,当编码器基于重叠变换来操作时,给定输入帧中的瞬态可能影响后一帧的编码。例如,基于变换的音频编码器通常围绕时域到频域的变换来建立,所述时域到频域的变换例如是DCT(离散余弦变换)、改进的离散余弦变换(MDCT)或不同于MDCT的重叠变换。基于变换的音频编码器的共同特性是,它们对重叠采样块(即重叠帧)进行操作。图3A-B示出音频信号的输入帧,并且还示出被用作音频编码器的输入的所谓的重叠帧。在图3A中,示出两个连续的音频输入帧帧n-l和帧n。与输入帧n有关的基于变换的音频编码的输入由帧n和n-l来形成。在该实例中,输入帧n包括瞬态,并且基于变换的音频编码的输入将自然地包括该瞬态。在图3B中,示出两个连续的音频输入帧帧n和帧n+l。与输入帧n+l有关的基于变换的音频编码的输入由帧n和n+l来形成。如从图3B中可以看到的那样,帧n中的瞬态还将存在于用于与帧n+l有关的编码的变换的输入中。6应该注意,用于编码帧n的变换的输入以及用于编码帧n+l的变换的输入是重叠的。因此,这是将这些较大的变换输入块称作重叠帧的原因。如果在时域中执行瞬态检测并且编解码器利用重叠变换(例如改进的离散余弦变换(MDCT))来操作,则输入帧中的瞬态还将在后一帧中出现。因为瞬态不仅在检测到它的帧中被编码,而且还在后一帧中被编码,所以建议在瞬态检测器中引入拖尾。拖尾意味着,如果检测到瞬态并且用信号通知给当前帧的编解码器,则瞬态检测器还应该将在后一帧中检测到瞬态用信号通知给编解码器。以这种方式可以确保也对后一帧采取适当的编码动作。当将指示瞬态的拖尾指示符从瞬态检测器100的信令模块120用信号通知给音频编码器10时,编码器10执行帧n+l的所谓的瞬态编码;即使用适于编码包括瞬态的重叠帧块的所谓的瞬态编码模式。在所谓的瞬态编码模式中的适当的编码动作例如可以是,减小变换的长度以便以最差的频率分辨率为代价来改进时间分辨率。这例如可以通过下述操作来实现基于重叠帧来执行时域混叠(TDA)以生成相应的时域混叠帧,并且基于所述时域混叠帧来在时间上执行分段以生成至少两个段,所述段还被称为子帧。基于这些段,然后可以执行基于变换的频谱分析以便为每个段获得表示该段的频率内容的系数。应该理解,即使瞬态检测器100基于输入帧n+l的音频信号特性没有检测到瞬态(参见图3B),也可以无论如何基于源自从帧n中检测到的瞬态的拖尾而将瞬态拖尾指示用信号通知给音频编码器10。这违背了仅依赖于由瞬态检测器基于所考虑的最近的输入帧的音频信号特性的常规瞬态检测的现有技术中的主要趋势。利用根据现有技术的瞬态检测器,将检测不到帧n+l的瞬态(图3B),并且因此相关联的音频编码器将不使用瞬态编码模式,从而导致听得到的赝象(例如令人讨厌的前回声)。参考图4的示例性示意性流程图,可以把对高效音频编码的改进的支持概括如下在步骤S1中,接收到音频信号。在步骤S2中,分析给定帧n以基于所述给定帧n的音频信号特性来确定后一帧n+l的瞬态拖尾指示符。在步骤S3中,将瞬态拖尾指示符用信号通知给相关联的音频编码器以便相对于音频信号的后一帧n+l实现适当的编码动作。如上面所指示的那样,优选地,根据在正被分析的给定输入帧n内表示瞬态的音频信号特性的存在来确定瞬态拖尾指示符的值。拖尾指示符的值可以以许多不同的方式来表示,所述不同的方式包括True/False、l/0、+l/-1以及许多其他等同的表示。为了更好地理解本发明,现在将描述信号分析和检测机制的更详细的实例。按块的能量计算作为一个实例,瞬态检测器可以基于音频信号中的功率的波动。例如,要被编码的音频帧可以被分成几个块,如在图5中示出的那样。在每个块i中,计算短期功率Pst(i)。可以通过简单IIR滤波器来计算长期功率Ph(i),Plt(i)=aPlt(i-l)+(l-a)Pst(i),其中a是遗忘因子。当商Pd(i)/Ph(i-l)超过某一阈值时,瞬态检测器就用信号通知在块i中发现瞬态。按照能量来表示;对于每个块,执行短期能量E(n)与长期能量E^(n)之间的比较。每当能量比超过某一阈值时就可以认为瞬态被检测到<formula>formulaseeoriginaldocumentpage8</formula>其中RATIO是可以被设置为某一合适的值(例如7.8dB)的能量比阈值。这仅是检测量度的实例,并且本发明不限于此。高通滤波器和零交叉因为音频帧的块是短的,所以存在上述瞬态检测器触发稳态信号的风险,在这种情况下,低频正弦函数的波动看成是快速的功率变化。这一问题可以通过在功率计算之前添加高通滤波器来避免,如图6的实例中所示出的那样。图6的瞬态检测器100包括高通滤波器113、块能量计算模块114、长期平均模块115以及阈值比较模块116,以提供用于帧n的IsTransient(是瞬态)指示。高通滤波器113除去低频,从而导致仅较高频率的功率计算。上述问题的另一可能解决方案可以是,计算所分析的块中的零交叉的数目。如果零交叉的数目少,则认为信号仅包含低频并且瞬态检测器可以决定增加阈值或者将该块认为是无瞬态的。图7是示出根据本发明一个示例性实施例的具有瞬态拖尾检查的瞬态检测器的实例的示意图。图7的瞬态检测器100包括高通滤波器113、块能量计算模块114、长期平均模块115、阈值比较模块116、以及用于检查瞬态拖尾的模块112,以提供用于后一帧n+l的IsTransient拖尾指示。根据窗函数和/或位置的瞬态/拖尾检测可选地,瞬态检测器的信号分析器可以被配置成不仅依赖于瞬态的存在而且依赖于预定的窗函数和/或所述瞬态在正被分析的帧内的位置来确定瞬态拖尾指示符的值。在音频编码器中的变换之前,音频信号通常乘以窗函数。在基于改进的离散余弦变换(MDCT)的编解码器的情况下,窗函数常常是所谓的正弦窗,但是它也可以是Kaiser-Bessel窗或某一其他窗函数。窗函数通常在当前帧的开始以及前一帧的末端处具有最大值,而在当前帧的末端和前一帧的开始处接近于零。这意味着,在当前帧的末端附近的瞬态将被窗函数抑制并且因此用信号通知给编码器不大重要。如果瞬态被充分抑制,则不用信号通知编码器检测到瞬态甚至会是有益的。然而,当下一帧要被编码时,瞬态将处于前一帧的末端,即位于窗函数的最大值附近,并且用信号通知编码器检测到瞬态是必要的。所检测到的在帧的末端附近的瞬态应该因此导致拖尾被设置为1(或者等同的表示),而没有用信号通知编码器检测到的瞬态。这样,瞬态检测器用信号通知在后一帧中检测到瞬态。类似地,如果在帧的开始处检测到瞬态,则瞬态检测器应该用信号通知检测到瞬态,但是将拖尾设置为0(或者等同的表示),因为当下一帧被编码时该瞬态将被窗函数抑制。位于帧的中心的瞬态将出现在当前帧和后一帧二者中。因此应该用信号通知"检测到的瞬态"并且将拖尾设置为1。<table>tableseeoriginaldocumentpage9</column></row><table>表1:依赖于瞬态的位置的瞬态检测器的判定优选地关于窗函数来选择"帧的开始"、"帧的中心"以及"帧的末端"之间的精确边界。还应该理解,表1的1/0表示仅被用作实例。实际上,包括True/False和+1/-1的任何合适的表示都可以被用来指示拖尾/不拖尾。甚至有可能使用非二进制表示,例如概率指示。换句话说,瞬态检测器可以被配置成,如果在基于预定窗函数的加窗操作之后在帧n中表示瞬态的音频信号特性是能检测的,则确定后一帧n+l的指示瞬态的瞬态拖尾指示符。瞬态检测器还可以被配置成,如果在基于窗函数的加窗操作之后在帧n中表示瞬态的音频信号特性被抑制,则确定后一帧n+l的不指示瞬态的拖尾指示符。窗函数通常对应于被用于在相关联的音频编码器中对帧n进行变换编码、但是在时间上被向前移位了一个帧的窗函数(覆盖至少两个帧),如将在下面解释的那样。本发明引入了判定逻辑,其改变初步瞬态检测以便调整判定来应付重叠帧。这基于依赖于时间发生的某些瞬态不需要以特殊方式来处理这一事实。对于这样的情况,本发明将不考虑初步判定,并且用信号通知不存在瞬态。一般来说,本发明将改变初步瞬态检测以基于特定应用来调整判定。图8A-B是示出根据本发明一个示例性实施例的瞬态的第一实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。图8A示出用作变换的输入的帧n-l和帧n以及在应用该变换之前所使用的一个示例性窗函数。在帧n(帧的中心)中存在瞬态,并且在使用所选择的窗函数的窗操作之后,在该特定实例中该瞬态仍是能检测的。因此,瞬态检测指示符TD被设置为值1。为了拖尾指示的目的,帧n被用作分析帧,但是如在图8B中所示出的那样,窗函数被向前移位了一个帧。在该特定实例中,在通过移位的窗函数进行加窗之后帧n中的瞬态还是能检测的,并且因此拖尾指示H0被设置为值1。图9A-B是示出根据本发明一个示例性实施例的瞬态的第二实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。在使用所选择的窗函数的窗操作之后,在图9A的实例中,帧n(帧的开始)中的瞬态是能检测的。因此,瞬态检测指示符TD被设置为值1。在图9B的实例中,帧n中的瞬态被移位的窗函数抑制,并且因此拖尾指示HO被设置为值0。图10A-B是示出根据本发明一个示例性实施例的瞬态的第三实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。在图10A的实例中,帧n(帧的末端)中的瞬态被变换窗函数抑制,并且因此瞬态检测指示符TD被设置为O。如在图10B的实例中所示出的那样,在通过移位的窗函数进行加窗之后帧n中的瞬态是能检测的,并且因此拖尾指示HO被设置为1。通过使瞬态检测更进一步适于所选择的窗函数可以改进上述构思。在本发明的一个示例性实施例中,在短期能量除以长期能量并将商与阈值比较之前,可以在当前块处通过窗函数来定标短期能量。仍利用短期能量的未定标的版本来更新长期能量。如果由长期能量除的所定标的短期能量超过阈值,则瞬态检测器用信号通知检测到瞬态。类似地,在移位了一个帧长度的块的位置(当编码下一帧时该块的位置)处通过窗函数来定标短期能量。如果由长期能量除的所定标的短期能量超过阈值,则瞬态检测器将拖尾设置为l,否则设置为O。在本发明的一个优选示例性实施例中,瞬态检测器包括用于通过所选择的窗函数来定标帧n以产生第一定标帧的装置;用于基于所述第一定标帧来确定帧n的瞬态指示符的装置;用于通过在时间上向前移位了一个帧的窗函数来定标帧n以产生第二定标帧的装置;以及用于基于所述第二定标帧来确定后一帧n+l的瞬态拖尾指示符的装置。在下文中,将关于适合于"ITU-TG.722.lfullbandcodecextension"(现在被重新命名为ITU-TG.719标准)的特定示例性且非限制性编解码器实现来描述本发明。在该特定实例中,编解码器被呈现为低复杂性基于变换的音频编解码器,其优选地以48kHz的采样率操作,并且提供范围从20Hz—直到20kHz的全音频带宽。编码器以20ms的帧处理输入16比特线性PCM信号,并且编解码器具有40ms的总延迟。编码算法优选地是基于具有自适应时间分辨率、自适应比特分配以及低复杂性格型矢量量化的变换编码。另外,解码器可以通过信号自适应噪声填充或带宽扩展来代替非编码的频谱分量。图11是适合于全带信号的示例性编码器的框图。通过瞬态检测器来处理以48kHz采样的输入信号。根据对瞬态的检测,对输入信号帧应用高频率分辨率或低频率分辨率(高时间分辨率)变换。在稳态帧的情况下,自适应变换优选地是基于改进的离散余弦变换(MDCT)。对于非稳态帧,使用(基于时域混叠和时间分段的)更高时间分辨率变换,而不需要附加延迟并且在复杂性方面具有非常小的开销。非稳态帧优选地具有等同于5ms帧的时间分辨率(尽管可以选择任一任意的分辨率)。在某一个帧处检测到的瞬态也将触发在下一帧处的瞬态。瞬态检测器的输出是例如被表示为IsTransient的标志。如果检测到瞬态,则该标记被设置为值1或逻辑值TRUE或等同的表示,否则(如果没有检测到瞬态)该标志被设置为值O或逻辑值FALSE或等同的表示。将所获得的频谱系数分组成不等长度的频带会是有益的。估计每个频带的范数(norm),并且所得到的包括所有频带的范数的频谱包络被量化和编码。然后通过量化的范数来归一化所述系数。量化的范数被进一步基于自适应频谱加权而调整并且被用作比特分配的输入。归一化的频谱系数是基于为每个频带分配的比特而量化和编码的格型矢量。非编码频谱系数的大小被估计、编码并且传输到解码器。优选地,对编码的频谱系数以及编码的范数二者的量化指数应用霍夫曼编码。10图12是适合于全带信号的示例性解码器的框图。用于指示帧配置(即稳态或瞬态)的瞬态标志被首先解码。频谱包络被解码,并且在解码器处使用相同的比特精确的范数调整和比特分配算法以便重新计算比特分配,这对解码归一化的变换系数的量化指数来说是必需的。在解量化之后,优选地通过使用根据所接收的频谱系数(具有非零比特分配的频谱系数)而建立的频谱填充码本来重新生成低频非编码的频谱系数(分配的零比特)。噪声级调整指数可以被用来调整重新生成的系数的大小。优选地使用带宽扩展来重新生成高频非编码的频谱系数。解码的频谱系数和重新生成的频谱系数被混合并且产生归一化的频谱。应用解码的频谱包络,从而产生解码的全带频谱。最后,应用逆变换以恢复时域解码信号。这优选地通过对于稳态模式应用改进的离散余弦逆变换(頂DCT)或者对于瞬态模式应用更高时间分辨率变换的逆变换来执行。适于全带扩展的算法基于自适应变换编码技术。它对输入和输出音频的20ms帧进行操作。因为变换窗(基本函数长度)是40ms并且在连续输入帧和输出帧之间使用50%的重叠,所以有效先行缓冲器大小是20ms。因此,整个算法延迟是40ms,其是帧大小加上先行大小的和。在使用ITU-TG.719编解码器中经历的所有其他附加延迟归因于计算和/或网络传输延迟。本发明的优点包括低复杂性、时域计算(没有所需的频谱计算)以及/或者与基于拖尾值的重叠变换的兼容性。上述实施例仅作为实例而给出,并且应该理解本发明不限于此。保留此处所公开并且请求保护的基本潜在原理的进一步的修改、变化和改进都在本发明的范围内。参考文献[1]IS0/IECJTC/SC29/WG11,CD11172-3,〃COD頂GOFMOVINGPICTURESANDASSOCIATEDAUDIOFORDIGITALSTORAGEMEDIAATUPTOABOUT1.5MBIT/s,Part3AUDI0",1993.[2]IS0/IEC13818-7,"MPEG-2AdvancedAudioCoding,AAC",1997.权利要求一种对音频信号进行操作的瞬态检测器,其中所述瞬态检测器包括-用于分析所述音频信号的给定帧n以基于所述给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符的装置;以及-用于将所述确定的瞬态拖尾指示符用信号通知给相关联的音频编码器以实现所述后一帧n+1的适当编码的装置。2.根据权利要求1所述的瞬态检测器,其中,所述用于分析的装置被配置成根据在所述给定帧n中表示瞬态的音频信号特性的存在来确定所述后一帧n+l的所述瞬态拖尾指示符的值。3.根据权利要求2所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果所述给定帧n的所述音频信号特性包括表示瞬态的特性,则确定所述后一帧n+l的指示瞬态的瞬态拖尾指示符。4.根据权利要求2所述的瞬态检测器,其中,所述用于分析的装置被配置成还根据预定的窗函数来确定所述后一帧n+l的所述瞬态拖尾指示符的值。5.根据权利要求4所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果在基于所述窗函数的加窗操作之后在所述给定帧n中表示瞬态的音频信号特性是能检测的,则确定所述后一帧n+l的指示瞬态的瞬态拖尾指示符。6.根据权利要求4所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果在基于所述窗函数的加窗操作之后在所述给定帧n中表示瞬态的音频信号特性被抑制,则确定所述后一帧n+l的不指示瞬态的拖尾指示符。7.根据权利要求4所述的瞬态检测器,其中,所述窗函数对应于被用于在所述相关联的音频编码器中对所述音频信号的帧n进行变换编码、但是在时间上被向前移位了一个帧的窗函数。8.根据权利要求7所述的瞬态检测器,其中,所述相关联的音频编码器基于重叠变换以及使用了用于对帧进行编码的至少两个帧的相关联的窗函数来操作。9.根据权利要求4所述的瞬态检测器,其中,所述瞬态检测器包括-用于通过所述窗函数来定标所述给定帧n以产生第一定标帧的装置;-用于基于所述第一定标帧来确定所述给定帧n的瞬态指示符的装置;-用于通过在时间上向前移位一个帧的所述窗函数来定标所述给定帧n以产生第二定标帧的装置;以及_用于基于所述第二定标帧来确定所述后一帧n+l的瞬态拖尾指示符的装置。10.根据权利要求2所述的瞬态检测器,其中,所述用于分析的装置被配置成还根据所述瞬态在所述给定帧n中的位置来确定所述后一帧n+l的所述瞬态拖尾指示符的值。11.根据权利要求io所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果所述瞬态位于所述给定帧n的中心或末端,则确定所述后一帧n+l的指示瞬态的瞬态拖尾指示符。12.根据权利要求IO所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果所述瞬态位于所述给定帧n的开始,则确定所述后一帧n+l的不指示瞬态的瞬态拖尾指示符。13.根据在前权利要求中的任何一项所述的瞬态检测器,其中,所述瞬态检测器打算与使用了重叠变换的基于变换的音频编码器一起用于操作。14.根据权利要求1所述的瞬态检测器,其中,如果指示瞬态的瞬态拖尾指示符被用信号通知,则所述后一帧n+l的所述适当编码包括瞬态编码。15.—种支持音频信号的编码的方法,所述方法包括以下步骤_接收所述音频信号;_分析所述音频信号的给定帧n以基于所述给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符;以及-将所述瞬态拖尾指示符用信号通知给相关联的音频编码器以便相对于所述音频信号的所述后一帧n+l实现适当的编码动作。16.根据权利要求15所述的方法,其中,所述分析步骤包括根据在所述给定帧n中表示瞬态的音频信号特性的存在来确定所述后一帧n+1的所述瞬态拖尾指示符的值的步骤。17.根据权利要求16所述的方法,其中,所述分析步骤包括如果所述给定帧n的所述音频信号特性包括表示瞬态的特性则确定所述后一帧n+1的指示瞬态的瞬态拖尾指示符的步骤。18.根据权利要求16所述的方法,其中,所述分析步骤包括还根据预定的窗函数来确定所述后一帧n+l的所述瞬态拖尾指示符的值的步骤。19.根据权利要求18所述的方法,其中,所述窗函数对应于被用于在所述相关联的音频编码器中对所述音频信号的帧n进行变换编码、但是在时间上被向前移位了一个帧的窗函数。20.根据权利要求16所述的方法,其中,所述分析步骤包括还根据所述瞬态在所述给定帧n中的位置来确定所述后一帧n+l的所述瞬态拖尾指示符的值的步骤。21.根据权利要求15所述的方法,其中,所述用信号通知所述瞬态拖尾指示符的步骤使所述音频编码器能够在用信号通知指示瞬态的拖尾指示符时以适于编码包括瞬态的帧的编码模式来执行对所述后一帧n+l的编码。22.根据权利要求21所述的方法,其中,所述编码动作包括在用信号通知指示瞬态的拖尾指示符时减小变换长度以改进所述变换的时间分辨率。23.根据权利要求15所述的方法,其中,所述音频编码器是使用了重叠变换的基于变换的编码器。全文摘要瞬态检测器(100)分析(110)输入音频信号的给定帧n以基于给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符,以及将所述确定的瞬态拖尾指示符用信号通知(120)给相关联的音频编码器(10)以实现后一帧n+1的适当编码。文档编号G10L19/02GK101790756SQ200880104833公开日2010年7月28日申请日期2008年8月25日优先权日2007年8月27日发明者A·塔莱布,G·尤尔伯格申请人:爱立信电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1