用于混迭误差信号来处理音频信号的装置及方法

文档序号:9794130阅读:576来源:国知局
用于混迭误差信号来处理音频信号的装置及方法
【技术领域】
[0001] 本发明涉及音频处理,具体地,涉及在对音频信号进行混迭影响处理的情况下的 音频处理。
【背景技术】
[0002] 在正常操作中,改进的离散余弦变换(MDCT)具有多个特征,使其成为针对音频编 码应用的较适合工具。MDCT根据交叠的帧产生临界采样频谱信号表示,并提供完美重建构。 这样意味着可以根据在交叠区中应用逆变换及交叠相加运算,来根据前向变换的频谱系数 重建构输入信号。然而,如果对频谱系数应用附加处理,则相比于过采样取样表示(例如,基 于DFT的交叠处理),MDCT具有一些缺点。诸如用于动态范围控制或削波预防的更加相对简 单的依赖于时间及频率的增益控制可以产生不需要的副作用。因此,尽管基于MDCT的频谱 表示可用于解码器中,但将对音频解码的基于DFT的单独后处理应用于需要这种类型信号 修改的若干应用中。除计算复杂性以外的一个缺点是由这种后处理引入的附加延迟。
[0003] 用于减少MDCT时域混迭的常见方法是重新建立过采样调制型复数交迭变换 (modulated complex lapped transformICLThMCLT是通过组合MDCT与其复数对应物,改 进的离散正弦变换(MDST)而产生。MCLT提供诸如信号的DFT表示的类似特征,且因此MCLT对 抗由频谱操纵引起的时域混迭(TDA)的鲁棒性可比得上DFT表示。但不幸地,通过MDCT频谱 来计算MDST频谱在计算上极其复杂,且产生显著的信号延迟。因此,现有技术提供用于减少 延迟及复杂性两者之技术【2-3】。在这些方法中,实数到复数(R2C)变换被用于近似所需的 MDST值。然后,在MCLT域,应用对频谱系数的操控。因此,通过再次使用复数到实数(C2R)变 换,来将复数值转变为MDCT域。尽管这种方法在混迭鲁棒性方面示出较好的结果,然而它具 有一些缺点。首先,估计MDST系数,通过计算复杂性的数值来限定它们的准确性。其次,变换 链R2C-C2R依然产生延迟。
[0004] [1]H. S ? Malvar,"A modulated comp lex lapped transform and its applications to audio processing',,in Proc·IEEE Int.Conf.on Acoustics?Speech? and Signal Processing(ICASSP)?Phoenix?Marchl999.
[0005] 【2】Kuech,F.;Edler,B.,"Aliasing Reduction for Modified Discrete Cosine Transform Domain Filtering and its Application to Speech Enhancement",in IEEE Workshop on Applications of Signal Processing to Audio and Acoustics ? 21-240ct.2007.
[0006] 【3】Edler,B.,"Aliasing Reduction for Gain Control with Critically Sampled Filter Banks',,in First International Conference on Communications and Electronics,ICCE' 06,10-1lOct.2006.
[0007] [4]E .Larsen and R.M.Aarts.Audio Bandwidth Extension-Application to psychoacoustics,Signal Processing and Loudspeaker Design.John ffiley&Sons?Ltd? 2004.
[0008] 【5】M.Dietz,L.Lilj eryd, K . Kjdflingand O.Kunz,"Spectral Band Replication,a novel approach in audio coding,',in 112th AES Convention,Munich, May 2002.
[0009] [6]P ?Ekstrand,"Bandwidth Extension of Audio Signals by Spectral Band Replication",in Proceedings of 1st IEEE Benelux Workshop on MPCA,Leuven, November 2002

【发明内容】

[0010] 本发明的目的是提供一种用于处理音频信号的改善型构思。
[0011]通过权利要求1的用于处理音频信号的装置、权利要求15的处理音频信号的方法 或权利要求16的计算机程序来实现该目的。
[0012] 在本发明的一方面,一种用于处理包含一系列频谱值块的音频信号的装置,包含: 处理器,用于使用针对第一块的至少一个修改值来处理所述一系列频谱值块以在交叠范围 中获得混迭减少的或不含混迭的第一结果信号,并使用来自所述一系列频谱值块的第二块 的至少一个第二不同修改值来处理所述一系列频谱值块以在该交叠范围中获得混迭减少 的或不含混迭的第二结果信号。然后,组合在交叠范围内的两个信号以针对所述交叠范围 获得处理后的信号,其中这两个信号二者都构成同一信号部分之一的某一表示。
[0013] 优选地,这种组合依赖于自一个结果信号至另一结果信号的平滑转换(crossfade) ,即,第一结果信号的淡出 (fadeout) 且同时第二结果信号的淡入 (fade-in)。
[0014] 优选地,处理器包含:修改器,用于使用所述至少一个第一修改值来修改所述一系 列块中的第一块以获得第一经修改块,用于使用至少一个第二修改值来修改所述一系列块 中的第二块以获得第二经修改块,用于使用该至少一个第一修改值来修改第二块以获得第 三经修改块,以及用于使用该至少一个第二修改值来修改第一块以获得第四经修改块。频 谱-时间转换器配置为用于将所述第一至第四经修改块转换成其时间表示,并且设置有交 叠加法器,用于将第一和第三经修改块交叠相加以获得结果信号,且用于将第二和第四经 修改块的时间表示交叠相加以获得第二结果信号。因此,执行两个基本上平行的逆变换操 作,一个操作具有第一增益修改值,另一操作具有第二增益修改值。
[0015] 当增益修改值仅是时变性的(即,在整个频率范围内是恒定的)时,仅将单个增益 修改值用于对块进行修改。然而,如果增益修改值随频率改变,则根据多个增益修改值来修 改每个频谱值块。增益修改值可适用于每个单独的频谱值或适用于频谱值组(诸如,2、3、4 或5个频率相邻的频谱值)。然而,一般状况下,针对各频谱线及每频谱线可存在单个的增益 修改值,采用多个增益修改值来修改频谱值块,其中增益修改值的数目等于频谱值块中的 频谱值的数目。
[0016] 因此,根据这个方面,针对所述交叠区中产生两个混迭减少的或不含混迭的输出 信号,且优选在这两个输出或结果信号之间执行平滑转换。
[0017] 根据本发明的另一方面,一种用于处理音频信号的装置包含:处理器,用于使用针 对所述一系列块中的第一块的至少一个第一修改值及针对所述一系列频谱块中的第二块 的至少一个第二不同修改值,来计算受混迭影响的信号。然后,估计混迭误差信号,其中这 种混迭误差信号被包括在所述受混迭影响的或经受混迭的音频信号中。然后,组合所述受 混迭影响的信号与所述混迭误差信号,使得通过组合获得的信号是混迭减少的或不含混迭 的信号。
[0018] 换言之,另一方面依赖于对受混迭影响的信号及混迭误差信号的计算以及对这两 个信号的后续组合,以便获得所述混迭减少的或不含混迭的信号。优选地,通过进行如下操 作来消除混迭:通过针对两个块用相同增益进行附加频率时间变换来在交叠区域中重构输 入信号;与窗口函数或相关函数的乘法;时间反转;与两个增益或修改值之间的增益差的乘 法;以及与具有不同增益的处理的输出的减法。
[0019] 优选地,所使用的变换算法是改进的离散余弦变换MDCT,且逆变换操作是改进的 离散余弦逆变换。备选地,可使用其他这种引入混迭的变换,诸如MDST(改进的离散正弦变 换)或改进的离散正弦逆变换(MDST)或任何其他这种变换,其中在分析侧上,时间部分中 的样本数目大于频谱值的数目,或备选性地,其中两个后续时间部分之间存在交叠区,导致 两个后续的频谱值块(即,在时间上是后续的频谱值块)。文中,这两个频谱值块二者至少部 分地与同一个交叠区相关,即,在最后导致两个时间后续的频谱值块的两个时间部分之间 的交叠区。这样意味着:在该分析侧上,样本或帧中之时域样本的数目大于频域表示块中之 频域值的数目,且在合成侧上,合成时域样本之数目大于用于合成时域样本之交叠块的块 中之频谱值的数目。
[0020] 然而,作为合成侧上的最后级,执行交叠相加处理,使得最后,该交叠范围中的样 本数目小于合成帧中的时域样本数目,且优选地,等于频谱值块的频谱值的数目。在后者状 况下,获得临界采样变换,且这种变换对本发明而言是优选的,但本发明还可应用于非临界 采样变换,尽管相比于临界采样变换,这种变换具有某种附加的额外开销。
[0021] 本发明方面不仅可用于补偿由时间-频率变化的增益修改引起的混迭,还可用于 带宽扩展(BWE)。在这种使用情况下,由BWE算法的向上复制(c〇py-up)级产生的复制频谱必 须整形为具有尽可能接近地匹配原始频谱包络的频谱包络[4-6]。这种频谱包络通常是时 间和频率依赖性的。尽管在大部分现有的BWE技术中,向上复制方案是恒定的,但仍有可能 执行导致附加混迭的时变向上复制。新提出的混迭消除技术还能够处理这些Μ?假影 (artifact)〇
【附图说明】
[0022] 以下在附图的背景下讨论了本发明的优选实施例,附图中:
[0023] 图la是第一方面的优选实施例;
[0024] 图lb是第二方面的优选实施例;
[0025] 图lc是一系列频谱值块的示意性表示;
[0026] 图Id是导致图lc的一系列块的一系列交叠时间部分的示意性表示;
[0027] 图2a示出了引入混迭的前向变换的实现方案;
[0028]图2b示出了混迭减少的逆变换的实现方案;
[0029]图3a不出了第二方面的另一实施例;
[0030]图3b不出了第二方面的另一实施例;
[0031 ]图3c示出了针对第一和第二方面的带宽扩展应用的示意图;
[0032]图4示出了用于第二方面的混迭误差分量;
[0033]图5a不出了第一方面的实施例;
[0034]图5b示出了第二方面的实施例
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1