使用时间分辨率能选择的低复杂性频谱分析/合成的制造方法与工艺

文档序号:11200318阅读:763来源:国知局
使用时间分辨率能选择的低复杂性频谱分析/合成的制造方法与工艺
本发明总体上涉及诸如信号压缩和音频编码之类的信号处理,更特别地涉及音频编码和音频解码以及相应的设备。

背景技术:
编码器是一种能够分析诸如音频信号之类的信号并以编码的形式输出信号的设备、电路或计算机程序。所得到的信号通常用于传输、存储和/加密的目的。另一方面,解码器是一种能够反转编码器操作的设备、电路或计算机程序,因为其接收编码的信号并且输出解码的信号。在大多数现有技术的编码器(例如音频编码器)中,在频域中分析输入信号的每个帧。该分析的结果被量化和编码,并且然后根据应用进行传输或存储。在接收侧(或者当使用所存储的编码信号时),后面是合成过程的相应解码过程使得有可能在时域中恢复信号。编解码器通常用于压缩/解压缩诸如音频和视频数据之类的信息以便通过带宽受限的通信信道进行高效的传输。特别地,市场高度需要以低比特率传输和存储音频信号,同时保持高的音频质量。例如,在传输资源或存储受限的情况下,低比特率操作是必要的成本因素。例如在移动通信系统中的流式传输和消息接发应用中通常是这种情况。在图1中示意性地示出使用音频编码和解码的音频传输系统的一般实例。整个系统基本上包括在发射侧的音频编码器10和发射模块(TX)20以及在接收侧的接收模块(RX)30和音频解码器40。公认的是,为了处理特别用于音频编码应用以及一般用于信号压缩的非稳态信号,必须格外小心。在音频编码中,被称为前回声失真的赝象(artifact)会出现在所谓的变换编码器中。变换编码器或更一般而言变换编解码器(编码器-解码器)通常基于时域到频域的变换,例如DCT(离散余弦变换)、改进的离散余弦变换(MDCT)或另一重叠变换。变换编解码器的共同特性是,它们对重叠采样块(即重叠帧)进行操作。由每个帧的变换分析或等效子带分析所产生的编码系数通常被量化和存储或者作为比特流传输到接收侧。解码器一接收到比特流就执行解量化和逆变换以便重构信号帧。前回声通常在具有尖锐上升(attack)的信号开始在紧接在低能量区域后的变换块的末端附近时出现。这种情况例如在编码打击乐器(例如响板、钟琴)的声音时出现。在基于块的算法中,当量化变换系数时,在解码器侧的逆变换将在时间上均匀地扩展量化噪声失真。这导致在时间上信号上升之前的低能量区域上的无掩蔽失真,如在图2A和2B所示,其中图2A示出原始的打击声音,以及图2B示出变换编码的信号,其显示出导致前回声失真的编码噪声的时间扩展。时间超前掩蔽(pre-mask)是人类听觉的心理声学特性,其具有掩蔽这一失真的潜力;然而这仅在变换块尺寸足够小以至于出现超前掩蔽时才有可能。前回声赝象减轻(现有技术)为了避免这种不期望的赝象,几种方法已经被提出并且被成功地应用。这些技术的一些已经被标准化并且在商业应用上很普遍。比特储存(bitreservoir)技术比特储存技术背后的思想是保存来自“容易”在频域中编码的帧的一些比特。此后使用所保存的比特以便适应要求高的帧,比如瞬态帧。这导致可变的瞬时比特率,通过某种调整可以使得平均比特率恒定。然而主要的缺点是,实际上需要非常大的储存以便处理某些瞬态,并且这导致非常大的延迟,从而使得该技术对会话式应用没有多大兴趣。另外,该方法仅稍微减轻了前回声赝象。增益修正以及时间噪声整形在频谱分析和编码之前,增益修正方法在时域中应用瞬态峰值的平滑。增益修正包络被作为辅助信息进行发送,并且被反向应用于逆变换信号,从而整形时间编码噪声。增益修正技术的主要缺点在于其对滤波器组(例如MDCT)分析窗的修正,因此引入滤波器组的频率响应的加宽。这可能在低频下尤其是在带宽超过临界频带的带宽的情况下导致问题。时间噪声整形(TNS)受到增益修正技术的启发。增益修正被应用于频域中并且对频谱系数进行操作。仅在对前回声敏感的输入上升期间应用TNS。该思想是在频率上而不是在时间上应用线性预测(LP)。这受如下事实的推动:在瞬态以及一般而言脉冲信号期间,通过使用LP技术来最大化频域编码增益。在AAC中TNS被标准化并且被证实提供对前回声赝象的良好减轻。然而,TNS的使用涉及LP分析和滤波,这显著增加编码器和解码器的复杂性。另外,LP系数必须被量化并且作为辅助信息而发送,这涉及进一步的复杂性和比特率开销。窗切换图3示出窗切换(MPEG-1,层III“mp3”),其中在长窗和短窗之间需要过渡窗“开始”和“停止”以保留PR(完全重构)特性。该技术首先由Ed1er[1]引入,并且广泛用于特别是在基于MDCT的变换编码算法的情况下的前回声抑制。窗切换是基于一检测到瞬态就改变变换的时间分辨率的思想。通常,这涉及将分析块长度从稳态信号期间的长持续时间改变到当检测到瞬态时的短持续时间。该思想是基于下面两种考虑:●应用于包含瞬态的短帧的短窗将最小化编码噪声的时间扩展,并且允许时间超前掩蔽生效和致使听不见失真。●向包含瞬态的短时间区域分配较高的比特率。尽管窗切换已经非常成功,但是它带来相当多的缺点。例如,编解码器的感知模型和无损编码模块必须支持不同的时间分辨率,这通常转化成增加的复杂性。另外,当使用重叠变换(例如MDCT)时,并且为了满足完全重构约束,窗切换需要在短块和长块之间插入过渡窗,如图3所示。对过渡窗的需要产生进一步的缺点,即由于切换窗不能瞬时完成这一事实而引起的增加的延迟,以及还有过渡窗的差的频率局部化特性,其导致编码增益的大大减小。

技术实现要素:
本发明克服了现有技术方案的这些和其他缺点。因此,通常需要改进的信号处理技术和设备,更特别地,特别需要用于处理前回声失真的新的音频编解码器策略。本发明的一般目的是提供一种对时域输入信号的重叠帧进行操作的改进的信号处理的方法和设备。特别地,期望提供一种改进的音频编码器。本发明的另一个目的是提供一种基于表示时域信号的频谱系数进行操作的改进的信号处理的方法和设备。特别地,期望提供一种改进的音频解码器。这些和其他目的由所附的专利权利要求所限定的本发明来满足。本发明的第一方面涉及一种用于对输入信号的重叠帧进行操作的信号处理的方法和设备。本发明是基于如下构思:将时域混叠帧用作时间分段和频谱分析的基础,基于时域混叠帧来在时间上执行分段,并且基于所得到的时间段来执行频谱分析。因此可以通过基于应用哪个频谱分析而简单地适配时间分段以获得合适数目的时间段,从而改变整体“分段的”时间到频率的变换的时间分辨率。更具体地,基本的思想是基于重叠帧来执行时域混叠(TDA)以生成相应的时域混叠帧,并且基于时域混叠帧来在时间上执行分段以生成至少两段,所述段也被称为子帧。基于这些段,然后执行频谱分析以便为每段获得表示该段的频率内容的系数。用于所有段的整体系数(也被称为频谱系数)集提供原始信号帧的能选择的时间-频率平铺(tiling)。瞬时分解成段例如可以被用来减轻前回声效应(例如在瞬态的情况下),或者通常用来提供高效信号表示,其允许所讨论的帧的比特率高效编码。本发明的第一方面特别涉及一种被配置成根据上述基本原理来操作的音频编码器。本发明的第二方面涉及一种基于表示时域信号的频谱系数进行操作的信号处理的方法和设备。本发明的该方面基本上涉及本发明的第一方面的信号处理的自然逆操作。简言之,基于频谱系数的不同子集来执行逆分段频谱分析,以便为每个子集的频谱系数生成逆变换子帧,所述逆变换子帧也被称为段。然后基于重叠的逆变换子帧来执行逆时间分段以将这些子帧组合成时域混叠帧。基于所述时域混叠帧来执行逆时域混叠以实现时域信号的重构。本发明的第二方面特别涉及一种被配置成根据上述基本原理来操作的音频解码器。当阅读下面对本发明的实施例的描述时将会认识到由本发明提供的进一步优点。附图说明通过参考与附图一起得到的下面的描述,将会最好地理解本发明连同其进一步的目的和优点,其中:图1是示出使用音频编码和解码的音频传输系统的一般实例的示意性框图。图2A示出原始打击声音,以及图2B示出变换编码的信号,其显示出导致前回声失真的编码噪声的时间扩展。图3示出用于基于变换的编码的常规窗切换技术。图4A示意性地示出一般MDCT(改进的离散余弦变换)正变换。图4B示意性地示出一般MDCT(改进的离散余弦变换)逆变换。图5是示出将MDCT(改进的离散余弦变换)变换分解成两个级联的级的示意图。图6是示出根据本发明一个优选示例性实施例的用于信号处理的方法的实例的示意性流程图。图7是根据本发明一个优选示例性实施例的一般信号处理设备的示意性框图。图8是根据本发明另一个优选示例性实施例的设备的示意性框图。图9是根据本发明又一个示例性实施例的设备的示意性框图。图10是根据本发明一个示例性实施例的时域混叠重新排序的实例的示意图。图11是根据本发明一个示例性实施例的分段成包括零填充的两个时间段的实例的示意图。图12示出与0.25的归一化频率有关的图11的分段的两个基本函数的图以及相应的频率响应图。图13示出与0.25的归一化频率有关的原始MDCT基本函数的图以及相应的频率响应图。图14是示出根据本发明一个示例性实施例的分段成包括零填充的四个时间段的实例的示意图。图15是示出根据本发明一个示例性实施例的分段成包括零填充的八个时间段的实例的示意图。图16示出根据本发明一个示例性实施例的针对四段的情况所得到的总变换的实现。图17示出借助于分级方法获得非均匀分段的示例性方式。图18示出一检测到瞬态就瞬时切换到更精细的时间分辨率的实例。图19是示出基于表示时域信号的频谱系数进行操作的信号处理设备的基本实例的框图。图20是适合于全带扩展的示例性编码器的框图。图21是适合于全带扩展的示例性解码器的框图。图22是根据本发明一个优选实施例的逆变换器以及相关联的用于逆时间分段和可选重新排序的实施方式的特定实例的示意性框图。具体实施方式在全部附图中,相同的附图标记将被用于相应的或类似的元素。为了更好地理解本发明,以对变换编码以及尤其是基于所谓的重叠变换的变换编码的简短介绍来开始可能是有用的。如先前所述,变换编解码器通常是基于时域到频域的变换,例如DCT(离散余弦变换)、重叠变换(例如改进的离散余弦变换(MDCT))或调制重叠变换(MLT)。例如,改进的离散余弦变换(MDCT)是基于IV类型离散余弦变换(DCT-IV)的傅里叶相关的变换,其附加特性是被重叠:其被设计成在较大数据集的连续块上执行,其中重叠后续块(所谓的重叠帧),以使一个块的后一半与下一个块的前一半重合,如图4A中示意性所示。除了DCT的能量集中品质之外,该重叠使得MDCT对于信号压缩应用尤其具有吸引力,因为它有助于避免源于块边界的赝象。因此,MDCT例如被用于MP3、AC-3、OggVorbis以及AAC中进行音频压缩。作为一种重叠变换,MDCT在与其他的傅里叶相关的变换相比时略有不同。事实上,MDCT的输出是输入的一半。形式上,MDCT是从R2N到RN的线性映射(其中R表示实数集)。在数学上,根据下面的公式将实数x0,x1,…,x2N变换成实数X0,X1,…,XN:根据惯例,上面的...
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1