修改频谱/调制频谱域表示的信息信号处理的制作方法

文档序号:2829019阅读:240来源:国知局
专利名称:修改频谱/调制频谱域表示的信息信号处理的制作方法
技术领域
本发明主要涉及信息信号例如音频信号、视频信号或其它多媒体信号的处理,更具体地,涉及在频谱/调制频谱域上的信息信号的处理。
背景技术
在信号处理领域,例如数字音频信号处理,信号常由载波信号分量和调制分量组成。对于调制信号的情况,经常要求一种将信号分解为载波和调制分量的表示,例如用来能够对其进行滤波、编码或其它修改。
为了实现音频编码的目的,众所周知,例如,将音频信号进行所谓的调制变换。这里,音频信号通过变换被分解为多个频带。随后,执行分解成幅度和相位的操作。对相位不再进行处理,而对每个子频带的幅度在第二变换中通过许多变换块进行再变换。结果将相应子频带的时间包络频率分解成多个调制系数。例如,在M.Vinton & L.Atlas,“A Scalable and Progressive Audio Codec”,Proceedings of the 2001IEEE ICASSP,7-11May 2001,Salt Lake City和Atlas等人2002年11月28日的美国专利申请US 2002/0176353A1“Scalable AndPerceptually Ranked Signal Coding And Decoding”以及J.Thompson&L.Atlas,“A Non-uniform Modulation Transform for Audio Coding withIncreased Time Resolution”,Proceedings of the 2003 IEEE IC ASSP,6-10April,Hong Kong,2003中都描述了由该调制变换构成的音频编码。
关于包括异步和同步解调技术在内的各种跨越待解调信号全频带的更多解调制技术的总结,例如在文章L.Atlas,“Joint Acoustic AndModulation Frequency”,Journal on Applied Signal Processing 7EURASIP,pp.668-675,2003中给出。
上述采用调制变换的音频编码方案的一个缺点如下。只要没有对调制系数和相位执行进一步的处理步骤,调制系数形成的音频信号的频谱/调制频谱表示是可逆的且可完全重构,也就是说它可无变化的再转换回到初始的时域音频信号。但是,在这些方法中根据心理声学标准,对调制系数滤波将调制系数减少和/或量化到尽可能小的值,以便达到最大的压缩率。然而,这一般不能实现希望的目标来从得到的信号中移除相应的调制分量,或者说向该分量中故意引入了量化噪声。这是因为事实上,在变化后的调制系数进行返回变换后,子频带的相位不再和这些子频带的变化后的幅度相一致,并继续含有初始信号调制分量中较强的分量。如果现在将子频带的相位和变化后的幅度重新合并,这些调制分量被相位再引入到滤波后或量化后的信号中。换句话说,调制变换、随后以上述方式对调制系数的修改(即,通过对调制系数进行滤波来进行)以及后续的对相位和幅度分量的综合提供了这样的信号,该信号在其它分析和/或调制变换中,在频谱/调制频谱域表示中那些本该滤除调制分量的地方仍然含有显著的调制分量。因此,根据上述基于调制变换的信号处理方案,不可能进行有效的滤波。
所以,对能以更可受控的方式对根据调制分量和载波分量分解的带有调制分量和载波分量的信息信号进行处理的信息信号处理方案存在需求。

发明内容
因此本发明的目的是为信息信号提供一种处理方案,能以更可受控的方式对根据调制分量和载波分量分解的信息信号进行处理。
此目的由根据权利要求1所述的设备和权利17所述的方法来达到。
用于处理信息信号的发明设备包括用于通过逐块变换信息信号将信息信号转换成时间/频谱表示的装置,以及将信息信号从时间/频谱表示转换成频谱/调制频谱表示的装置,其中用于转换的装置的设计使得频谱/调制频谱表示依赖于信息信号的时间/频谱表示的幅度分量和相位分量。然后一装置对频谱/调制频谱表示的信息信号执行处理和/或修改来获得修改的频谱/调制频谱表示。另一装置基于修改的频谱/调制频谱表示,最后形成处理后的信息信号,表示信息信号的处理后版本。
本发明的核心思想是,如果对信息信号从时间/频谱表示和/或时间/频率表示到频谱/调制频谱表示和/或频率/调制频率表示的转换依靠信息信号的时间/频谱表示中幅度分量和相位分量来执行,那么可以实现对根据调制和载波分量更加严格分解的信息信号的处理。这消除了相位和幅度间的重新合并,因而消除了在合成一侧向处理后信息信号的时间表示中再引入不想要的调制分量。
对信息信号从时间/频谱表示到频谱/调制频谱表示的转换考虑到幅度和相位,包括的问题是,信息信号的时间/频谱表示实际上不仅依赖于信息信号,而且依赖于时间块相对于信息信号的载波频谱分量的相位偏移。换句话说,信息信号从时间表示到时间/频谱表示的逐块变换使得在信息信号的时间/频谱表示中获得的每个频谱分量的频谱值序列包括只依赖于块重复频率相对于信息信号的载波频率分量的异步特性的上调制复载波。根据本发明的实施例,于是对每个频谱分量执行对信息信号的时间/频谱表示中的频谱值序列的解调制,来获得每个频谱分量的解调制的频谱值序列。随后通过时间/频谱表示到频谱/调制频谱表示的逐块变换和/或它们的逐块频谱分解,来对如此获得的解调制的频谱值序列执行转换,从而获取调制值块。这些调制值块被处理和/或修改,例如被对应的带通滤波的加权函数进行加权来从初始的信息信号中移除调制分量。结果是修改的解调制频谱值序列和/或修改的解调制时间/频谱表示。将复载波再调制到如此获得的修改的解调制频谱值序列,从而获得修改的频谱值序列,表示处理后信息信号的时间/频谱表示的一部分。该表示到时间表示的返回转换在时间表示和/或时间域上产生处理后的信息信号,该信号相对于初始信息信号在调制和载波分量方面可以高度准确的方式变化。


本发明的优选实施例将参照附图在下面进行详细说明,附图中
图1示出了根据本发明实施例的处理信息信号的设备的电路方框图;以及图2示出了阐释图1中设备操作的示意图。
具体实施例方式
图1示出了根据本发明实施例的处理信息信号的设备。图1中的设备,一般地以10表示,包括输入12,它接收待处理的信息信号14。作为示例提出图1中的设备来处理信息信号14,使得调制分量从信息信号14中移除,因而来获得只有载波分量的处理后信息信号。此外,设备10还包括输出16来输出载波分量作为处理结果和/或处理后信息信号18。
在内部,设备10基本被分为部分20,用来将信息信号14从时间表示转换成时间/频率表示;装置22,用来将信息信号从时间/频率表示转换成频率/调制频率表示;部分24,在部分24中执行实际的处理也就是信息信号的修改;以及部分26,用于将在频率/调制频率表示中处理的信息信号由此表示转换回到时间表示。提及的四个部分在输入12和输出16间按照上述顺序串行相连,其中它们更详细的结构和更详细的操作将在下面描述。
设备10的部分20包括开窗口(windowing)装置28和变换装置30,它们按上述顺序跟随在输入12之后。具体地,开窗口装置28的输入与输入12相连来接收作为信息值序列的信息信号14。如果信息信号仍以模拟信号形式存在,例如可以通过A/D转换器和/或离散采样,将其转换成信息序列和/或采样值。开窗口装置28形成具有相同数目信息值的块,其中每个信息值来自于信息值序列,并且对每个信息值块通过加权函数进行加权,但是其中这些信息值块不能例如只对应正弦窗口或KBD窗口。这些块可能重叠,例如重叠50%,或者不重叠。仅作为一个例子,下面假设为50%的重叠。优选的窗口函数的特性是,它们在时间/频谱表示上有好的子频带分离,并且它们的加权值的平方在重叠区域加起来为1,其中加权值在它们应用到一个相同信息值时是相互对应的。
开窗口装置28的输出和变换装置30的输入相连。开窗口装置28输出的信息值块被变换装置30接收。然后变换装置30使它们逐块进行谱分解变换,例如DFT或者另一复杂变换。因而变换装置30以逐块方式实现将信息信号14分解成频谱分量,并且特别的,进而在从开窗口装置28接收以后,产生频谱值块,对每个时间块的每个频谱分量包括一个频谱值。几个频谱值可以合并成子频带。但是,在下文中术语子频带和频谱分量作为同义词使用。对每个频谱分量和/或子频带,结果为一个频谱值,或者如果有子频带合并,为几个频谱值,但是在下文中没有对每个时间块进行子频带合并的假设。因此,变换装置30对每个频谱分量和/或子频带输出频谱值序列,表示该频谱分量和/或该子频带的时间过程(course)。变换装置30输出的频谱值表示信息信号14的时间/频率表示。
部分22包括载波频率确定装置32、作为解调制装置的混频器34、开窗口装置36和第二变换装置38。
开窗口装置32包括与变换装置30输出相连的输入。那里它接收到每个子频带的频谱值序列,并将每个子频带的频谱值序列分割成一一类似于针对信息信号14的开窗口装置28——值块并通过合适的加权函数对每块的频谱值加权。加权函数可以是上面针对装置28作为示例提及的加权函数中的一个。子频带中连续块可能重叠或者不重叠,其中下文示例再次假设50%的相互重叠。下文假设不同子频带的块相互对准,下面将关于图1对其进行更详细的说明。但是,可以设想子频带间具有块序列偏移量的另一过程。开窗口装置在输出将每个子频带的开窗频谱值块序列输出。
载波频率确定装置32也包括连接到变换装置30输出的输入来获得子频带和/或频谱分量的频谱值作为每个子频带的频谱值序列。提供该装置以在每个子频带中找出由各时间块带来的载波分量,其中已经从这些时间块中得出子频带的各频谱值,并且时间块包括相对于信息信号14的载波频率分量随时间变化的相位偏移。载波频率确定装置32在输出将每个子频带确定的载波分量输出到混频器34的输入,混频器34有另一连接到开窗口装置36输出的输入。
混频器34的设计使每个子频带的开窗频谱值块在其被变换装置输出时,乘以相应的载波分量的复共轭,其中相应子频带的载波分量已被载波频率确定装置30所确定,于是对子频带和/或开窗频谱值块进行解调制。
于是在混频器34的输出,结果为解调制的子频带和/或结果为每个子频带开窗频谱值的解调制块的序列。混频器34的输出连接到变换装置38的输入,使得后者接收每个子频带的开窗和解调制频谱值块,频谱值块相互间重叠——这里作为示例重叠为50%,并逐块将它们变换和/或频谱分解为频谱/调制频谱表示,通过处理所有子频带和/或频谱分量,来产生信息信号14的频率/调制频率表示,至此仅针对子频带频谱值序列的解调制修改了信息信号14。对于每个子频带,变换装置38所根据的变换可以是,例如,DFT、MDCT、MDST或者类似的变换,并且特别的,也可以是和变换装置30相同的变换。图1中作为示例假设变换装置30和38的变换都是DFT。
因此,变换装置38在输出为每个子频带和/或每个频谱分量连续输出值块,在下文中被称作调制值并表示开窗和解调制频谱值块的频谱分解。每个子频带的频谱值块(由变换装置38对其执行变换)相互之间关于时间对准,于是每个时间周期的结果直接地总是由每个子频带的调制值块组成的调制值矩阵。变换装置38将调制值传递到部分24,部分24仅包括信号处理装置40。
信号处理装置40和变换装置38的输出相连,于是它接收调制值块。在现在的示例情况中,因为设备10用于调制分量抑制,信号处理装置40对进入的调制值块在频域执行有效的低通滤波,也就是说通过从调制频率0开始向较高和/或较低的调制频率下降的函数对调制值进行加权。如此修改的调制值块被信号处理装置40传送到返回转换部分26。信号处理装置40输出的修改调制值块表示信息信号14的修改频率/调制频率表示,或者换句话说,由于混频器34的解调制,所表示的频率/调制频率表示仍然和修改信息信号18的频率/调制频率表示不相同。
返回转换部分26又被划分为两部分,也就是用于将处理的信息信号18从信号处理装置40输出的频率/调制频率表示转换到时间/频率表示的部分,以及用于将处理的信息信号从时间/频率表示转换回到时间表示的部分。两个部分中的前者包括用于执行和根据变换装置38的变换相反的逐块变换的变换装置42、混频器46和合并装置44。返回转换部分26的后一部分包括用于执行和根据变换装置30的变换相反的逐块变换的变换装置48以及合并装置50。
反变换装置42用输入和信号处理装置40的输出相连,并将修改调制值块以逐个子频带的方式从频谱表示变换回到时间/频率表示,因而反转频谱分解来获得每个子频带的修改频谱值块序列。由反变换装置42输出的这些修改频谱值块,和开窗口装置36输出的频谱值块不相同,而不仅是由于信号处理装置40的处理,而且还由于混频器34所进行的解调制。所以混频器46接收由反变换装置42输出的每个子频带的修改频谱值块序列,并将它们与复载波混频,以再次利用由时间块的相位偏移造成的载波来调制频谱值块,其中复载波是关于应用在相应地点的和/或在混频器34中用于对信息信号解调制的相应块的载波的复共轭。混频器46的输出产生的结果是每个子频带的修改的、未经解调制的频谱值块的序列。
混频器46的输出连接到合并装置44的输入。当从混频器46接收到值块时,合并装置44通过为一子频带适当地链接相邻和/或连续频谱值块的互相对应的频谱值,对每个子频带将利用复载波再次上调制的修改频谱值块序列合并,来形成均一的流和/或均一的频谱值序列。对于使用加权函数的情形,如上文中提及的具有正特性的加权函数(在重叠的情况下相互对应的加权值的平方加起来为1),合并包括由互相关联的频谱值的简单叠加。合并装置44(OLA=重叠相加)输出的结果由每个子频带的修改频谱值序列组成。于是在OLA44的输出处所输出的结果为针对所有频谱分量的修改子频带和/或修改频谱值序列,并且表示信息信号14的修改时间/频率表示和/或修改信息信号18的时间/频率表示。
变换装置48接收频谱值序列,特别是总是逐一接收针对所有子频带和/或频谱分量的一个频谱值,和/或逐一接收修改信息信号18的一部分的一个频谱分解。通过反转频谱分解,它从频谱分解序列中产生修改时间块序列。这些修改时间块又被合并装置50接收。合并装置50类似于合并装置44操作。它通过将来自相邻的和/或连续的修改时间块的相互对应的信息值相加,来合并作为示例重叠为50%的修改时间块。于是合并装置50输出的结果为表示所处理信息信号18的信息值序列。
上文中已经描述了设备10的结构和各部件的操作,下文将关于图1和2更详细地论述它们的操作。
设备10进行的信息信号处理从在输入12接收音频信号14开始。信息信号14以采样的形式呈现。采样已经通过例如模拟/数字转换器的方式完成。采样以特定的采样频率ωs完成。信息信号14因此作为采样和/或信息值si=s(2π/ωs·i)的序列形式到达输入12,其中s为模拟信息信号,si为信息值,指数i为信息值的指数。在进入的采样值si中,开窗口装置28总是将2N个连续的采样值合并,形成时间块,在本例中具有50%的重叠。例如,它将从s0到s2N-1的采样值合并,形成指数n=0的时间块,将从sN到s3N-1的采样值合并,形成指数n=1的第二时间块,将从s2N到s4N-1的采样值合并,形成指数n=2的信息值的第三时间块,等等。如上文所述,开窗口装置28通过窗口和/或加权函数对每一块加权。例如,令从sn0到sn2N-1为时间块n的2N个信息值,那么装置28输出的块最后被生成为从sn0→sn0·g0到sn2N-1→sn2N-1·g2N-1,其中i=0到2N-1的gi是加权函数。
图2示出了应用到信息值si的开窗口函数,作为示例在图70中采用连续的四个时间块n=0,1,2,3,其中,时间t沿x轴以任意单位刻画,而开窗口函数的幅度沿y轴以任意单位刻画。这样,开窗口装置28总是在N个信息值之后,将每2N个信息值的新开窗口时间块传送给变换装置30。于是时间块的接收频率为ωs/N。
变换装置30将开窗口时间块变换成频谱表示。变换装置30对开窗口信息值的时间块执行频谱分解成多个预定的子频带和/或频谱分量。本示例假设变换为DFT和/或离散傅立叶变换。在本示例的情况中,如果信息信号是实数,对每个由2N个信息值组成的时间块,变换装置30针对N个频谱分量产生N个具有复数值的频谱值。变换装置30输出的复频谱值表示信息信号的时间/频率表示74。在图2中用方框76图示了复频谱值。由于变换装置30针对每一子频带和/或频谱分量的每个连续的信息值时间块都产生至少一个频谱值,因而变换装置30以频率ωs/N输出每个子频带和/或频谱分量的频谱值76的序列。在图2的74中以水平的方向沿着频率轴78图示了为一时间块输出的频谱值。为后续的时间块输出的频谱值以垂直的方向沿着轴80,直接跟在其后。因此,轴78和80表示信息信号14的时间/频率表示的频率和/或时间轴。作为示例,图3仅示出了四个子频带。作为示例,每个子频带的频谱值序列沿着图2的表示中列的方向行进,并用82a,82b,82c,82d图示。
再简要参照图1,其中作为示例,用表示式为sin(bt)·(1+μ·sin(at))的函数图示信息信号14,其中α为,例如,如虚线84所示的信息信号14包络的调制频率,而β表示信息信号14的载波频率,t为时间,μ为调制深度。通过足够高的采样频率ωs,通过变换72对示例信息信号每个时间块的变换结果为频谱值块76,也就是74中的一行,其中频谱分量和/或相关的频谱值大体上在载波频率β处具有显著的最大值。但是因为包络84的变化,对连续的时间块来说,频谱分量f=β的频谱值随时间变化。所以,频谱分量β的频谱值幅度随着调制频率α而变化。
直到这里,讨论没有考虑以下情况,即由于时间块重复频率ωs/N和信息信号14的载波频率之间的频率失配而导致不同的时间块关于载波频率β具有各自不同的相位偏移量。根据相位偏移量,在变换72中由时间块得到的频谱块的频谱值被载波ejΔf调制,其中j表示虚数单位,f表示频率,Δ表示相应时间块的相位偏移量。对实质上相等的载波频率,也即本示例中的情况,相位偏移量Δ线性增加。所以,由于时间块重复频率和载波频率的频率失配,子频带的频谱值受到了依赖于两个频率失配的载波分量的调制。
考虑上面的情况,现在载波频率确定装置32从频谱值a(ωb,n)中得到子频带中由时间块的相位偏移量导致的和/或受时间块相位偏移量影响的载波分量,其中ωb是所有N个子频带中0≤b<N的相应子频带的角频率ω和/或频率f(ω=2πf),并且n是时间块和/或频谱块的指数,指数根据n=ωs·t和时间t关联。于是用载波频率确定装置32为每个子频带ωb和/或每个频率f逐块确定调制载波频率ω(m,f),其中m表示块指数,这将会在下面更具体的说明。为达此目的,载波频率确定装置32总是将子频带ωb的M个连续的频谱值76合并,例如从频谱值a(ωb,0)到a(ωb,M-1)。在这M个频谱值中,它通过相位展开(unwrapping)来确定相位的行为和/或过程。因此,它确定最接近相位行为的线性方程,例如通过最小误差平方算法。从线性方程的斜率和轴部分和/或相位或初始偏移量,载波频率确定装置32针对时间块m为子频带b获得想得到的调制载波频率ωd,和/或针对时间块m为子频带b获得频谱值块相位偏移量。载波频率确定装置通过时间相同的频谱值为所有子频带,也即为所有的子频带0≤b<N的具有ωb的所有频谱值块a(ωb,0)到a(ωb,M-1),进行载波频率确定。这样,载波频率确定装置32一块接一块的为每个子频带ωb确定调制载波频率ωd和频谱值块相位偏移量。分割成块的方式,作为装置32确定所有子频带的复载波的基础,也被开窗口装置用来开窗口。载波频率确定装置32将复载波的确定值输出到解调制装置和/或混频器34。
混频器34现在将由开窗口装置36输出的各个子频带的开窗口频谱值块和相应的调制载波频率ωd的复共轭进行混频,其中考虑到频谱值块相位偏移量而要把子频带的频谱值块乘以e-j·(ω_d·n+),其中如上文所述,对每个子频带和子频带中的连续块,总是采用不同的ωd和对。这样,混频器34输出相互对准的解调制子频带频谱值块,也就是具有N个频谱值块而每块具有M个解调制频谱值的两维值块。
因为由时间块偏移量造成的子频带中的调制已在解调制中用混频器34移除,因此值块中子频带的频谱值相位行为平均起来更加平坦,且基本上活动在相位0附近。这种方法达到的目的是,在后续的变换装置38的变换中,解调制且开窗口的频谱值块造成一种频谱分解,在该分解中频率0和/或直流分量居于正中。
在由混频器34实现的解调制84之后,由变换装置38,对每个子频带和/或解调制的频谱值块的每个序列逐块执行变换86。变换86具体使N个子频带的解调制频谱值块逐块经受频谱分解。频谱值块的频谱分解结果也可以称为调制频率表示。对于N个已相互对准的开窗口且解调制的频谱值块,变换86于是生成具有M×N个调制值的矩阵,表示在长度为M个时间块的时间周期上信息信号14的频率/调制频率表示,其中正是这M个时间块为矩阵的生成做出贡献。作为示例,图2中88显示了N=M=4的调制矩阵。可以看到,频率/调制频率表示88有两个维度,即频率90和调制频率92。在88中用方框93图示各个调制值。
变换装置38将调制矩阵传送给处理装置40。根据本实施例,处理装置40用来从信息信号14中滤除调制分量。因此,在本示例情况中,处理装置40对频率/调制频率矩阵中的调制频率分量进行低通滤波。为了图示的目的,图1在94显示了一图表,其中调制频率沿着x轴刻画而调制值的幅度沿着y轴刻画。图表94为图1中信息信号14的示例表示调制矩阵88的一部分,也就是说正弦调制的正弦。具体地,图表94用频率β即载波频率沿子频带的调制频率图示了调制值幅度的过程。通过混频器34的解调制84,调制频率谱被非常好的居中——至少在FFT作为变换86的情况中——和/或正确地对准。特别是在载波频率β处的调制频率谱有两个位于调制频率α的边带96和98,调制频率α也就是信息信号14的包络84的调制频率。此外,调制矩阵88的调制值在频率β处有一个常数分量100。将信号处理装置40设计成一低通滤波器,该滤波器的滤波特性102可用虚线图示,来从频率/调制频率表示88中移除两个边带96和98。这样,信息信号14摆脱了它的调制分量,于是只留有了载波分量。如此改变的调制矩阵被处理装置40传递到反变换装置42。反变换装置42为每个子频带处理修改的调制矩阵使得相应子频带的调制值块,也就是调制矩阵88中的一列,经受和变换装置38相反的变换,因此这些调制值块从频率/调制频率表示转换回到时间/频率表示。这样,反变换装置42从每一子频带的每一个调制值块中产生该子频带的频谱值块。
从变换装置30输出的频谱值中,上面的描述主要涉及对每个子频带的第一组M个频谱值和/或M个连续频谱值的处理。而用装置32、34、36、38、40和42进行的处理也是为N个子频带中每个子频带的后面的由M个频谱值组成的块重复,其中在本示例情况中M个频谱值组成的块每个的重叠为50%,也就是每个子频带的重叠为M/2个频谱值。图2中,作为示例,块在时间/频率表示74中用m=0,m=1和m=2图示,例中在每个子频带使用拱形的窗口和/或扩展到M=4个频谱值的加权函数。对这些块m中的每个块,变换装置38最后生成具有M×N个调制值的调制矩阵,以上文描述的方式通过信号处理装置40对该矩阵进行滤波和/或加权。反变换装置42从修改调制矩阵88即具有修改的但仍被解调制的频谱值块组成的矩阵中,为每个子频带产生频谱值块。
但是,反变换装置42输出的每个子频带的频谱值块,和从信息信号14获得的在开窗口装置36输出的那些频谱值块不相同,不仅由于信号处理装置40的处理,而且还由于解调制带来的变化。因此,在调制装置46中用调制载波分量再次对频谱值块进行调制,其中之前应用该调制载波分量进行解调制。具体地,先前被乘以e-j·(ω_d·n+)的相应频谱值块现在被相应的乘以e+j·(ω_d·n+),其中n表示相应的子频带的频谱值序列的指数,而ωd和/或ωd表示由装置32为相应的频谱值块确定的复调制载波的角频率。
在调制级46后产生的每个子频带的频谱值块序列现在由合并装置44为每个子频带合并,通过互相对应地重叠频谱值块,在本例中重叠为50%,以及根据开窗口装置36中使用的加权函数合并相互对应的频谱值,也即前面示例给出的在正弦或KBD窗口条件下的相加操作,来为每个子频带形成均一的频谱值流82a-82d。
在合并装置44的输出处产生的每个子频带的频谱值流表示处理信息信号18的时间/频率表示。此流被反变换装置48接收。在每个时长n中,它使用针对所有子频带ωb的频谱值,也即所有频谱值a(ωb,n)其中0≤b<N,来对其执行从频率表示到时间表示的变换,来为每个n,也就是重复时间长度2πN/ωs,获得时间块。合并装置50通过在本例中50%的重叠,以及互相合并时间块中相应的信息值,来合并这些时间块,以形成均一的信息值流,最终在输出16表示时间域18上的处理后的信息信号。
在图1的图表中以18图示了处理后的信息信号,其中x轴为时间而y轴为信息信号18的幅度。可以看到,唯一剩余的就是输入侧信息信号14的载波分量。调制分量和/或包络分量84被移除了。
换句话说,图1和图2的实施例表示的是一处理设备,它使用信号自适应滤波器组将信号分解成载波和调制分量,并使用得到的调制信号的表示来对它们滤波。然而同样的,在信号处理装置中执行编码、加密或压缩来代替滤波处理是可能的,或者以其他方式修改调制矩阵。和说明书的介绍部分所描述的用于音频编码的调制变换方法相比,本实施例对每个子频带的载波分量执行解调制,而介绍部分所描述的用于音频编码的调制变换执行的是幅度形成。在对载波频率确定装置32中的子频带载波分量进行估计后,通过乘以该分量的复共轭来实现每个子频带的解调制。随后,通过开窗口装置36和变换装置38的进一步的频率分解,将如此解调制的子频带信号变换到调制域上。
在图1的实施例中,具有50%重叠和窗口的DFT作为示例,用作第一变换72,但是其中偏差和变化是可能的。第一变换72的若干块又被开窗口装置36合并——那里作为示例,重叠为50%——,并被混频器34用一复数调制器进行逐个子频带的解调制,随后被用DFT进行变换,其中复数调制器由载波频率确定装置32确定。在先前的实施例中,是在载波频率确定装置中从待解调的子频带相应的块的相位中得到调制器的频率,也即近似设置为通过相应块频谱值的展开的相位过程的直线。但是也可以用其他方法实现。载波频率确定装置32例如可以对每个频谱块部分n到n+M-1,对该部分中所有子频率带的相位分量近似设置成一个平面。此外,载波频率确定装置32不执行逐块的复数调制器的确定,而是连续在每个子频带的频谱值流上进行是可能的。为此目的,载波频率确定装置32可以例如首先展开相应子频带的频谱值序列的相位,对它们进行低通滤波然后使用滤波相位过程的局部增长来和复数调制器适配。因此,也将改变混频器46的调制部分。一般来说,载波频率确定装置通过增加或减少子频带的复数频谱值的相位以及增加或减少序列上的幅度,来试图影响相位行为,使得频谱值序列的相位的平均斜率减少,和/或展开的相位过程基本上在固定的相位值点附近变化,优选地是在相位0点。
再一次要明确关注的是,事实上除了DFT和/或IDFT,其它类型的变换对所使用的变换72,86以及和它们相反的变换装置42和48也是可能的。例如,复数解调制子频带信号也可以通过实数值的变换,变换和/或频谱分解成频率/调制频率表示,其中该表示按实部和虚部被各自分离。实部于是表示对于解调制级以后的用于解调制的载波,子频带信号的幅度调制。虚部于是表示该载波的频率调制。对DFT和/或IDFT用于装置38和/或42的情况,子频带信号的幅度调制分量由沿着调制频率轴的DFT频谱中对称的分量反映,而载波的频率调制分量则对应沿着调制频率轴的DFT频谱中的非对称分量。
上述的实施例作为示例,针对简单正弦调制的正弦信号已经做了说明。然而图1和图2中的实施例也适于对任意频率的幅度调制信号的混频信号的包络的过程进行滤波,例如幅度调制的音调信号。直接表示包络的各个频率分量,以便在调制矩阵88中进行一致的处理,这与根据说明书背景部分所述的音频编码用的调制变换分析方法的已知幅度-相位表示不同。对小调制深度,也就是频率摆动(swing)明显小于第一DFT变换之后子频带宽度的频率调制信号的滤波,在图1和图2的实施例中也是可能的。
因此,图1和图2的实施例涉及针对调制滤波(换句话说,基于信号自适应变换)、调制域中的滤波以及相应的返回变换的设置。在滤波的本实施例中,图1的设置在没有调制域的信号操作时可完全重构。通过引入合适的频谱域滤波器,例如滤波器102,也就是随到中心调制频率0的距离增加而削减调制值,要移除的调制分量可以按需被削减。然而频率/调制频率表示中其它类型的信息信号处理也是可能的。所以,可能还希望仅移除载波。在这种情况下,滤波将包括高通滤波,即用加权函数进行加权,该加权函数在特定的调制频率处有调制频率边缘,低于该调制频率处对调制值的削减比高于该调制频率处对调制值的削减大。在其他应用领域中,信号处理装置40中的信号处理可以包括带通滤波,即用加权函数进行加权,该加权函数从特定的中心调制频率处下降,将来自于不同源的信息信号的分量分离开,即实现信源分离。上述实施例可以使用的进一步应用可能涉及用来对音频信号编码的音频编码、对扰乱信号的重建以及错误的消除。但是,一般而言,设备10也可以用作音乐效果装置,在进入的音频信号中实现特殊的声学效果。在信号处理装置40中的处理从而可以采取最多样的形式,例如调制值的量化,将一些调制值设置为0,对调制值的各个部分或者全部进行加权等。进一步的应用领域可能是用图1中的设备10作为水印嵌入器。水印嵌入器将接收音频信号14,其中处理装置40根据水印,通过修改各个分段和/或调制值,将接收的水印引入到音频信号中。对分段和/或调制值的选择,可以不同的方式完成,和/或对于连续的调制矩阵是随时间变化的,并且该选择要使得在得到的带水印的音频信号18中,由引入水印造成的修改,通过心理声学的隐藏效果,无法被人耳听辨。
关于变换装置,需要注意的是,它们当然也可以被设计成滤波器组,通过许多不同的带通滤波,生成频谱表示。此外,还需要注意的是,处理后得到的信息信号18不必要以时间域的表示输出。例如以时间/频谱表示或者甚至于频谱/调制频谱表示输出信息信号是可能的。在后一种情况下,当然有必要确保,在接收机端,可能要使用适当的载波再次进行必要的调制46,例如提供的载波可以是随每个子频带和频谱值块而变化的复载波,它被用于解调制84。这样,上述实施例可用于实现压缩方法。
特别需要注意的是,根据环境,本发明方案也可以以软件来实现。实现方式可以是在数字存储介质上,特别是含有可被电方式读出的控制信号的软盘或者CD上,存储介质与可编程计算机系统协作,使得相应的方法得以执行。一般来说,本发明也可含在计算机程序产品中,计算机程序产品包括存储于机器可读载体上的程序代码,当计算机程序产品在计算机上运行时,可执行本发明的方法。换句话说,本发明也可以实现为计算机程序来实现,该程序含有在计算机上运行时来执行该方法的程序代码。
权利要求
1.一种用于处理信息信号(14)的设备,包括装置(20),用于通过信息信号的逐块变换,将信息信号(14)转换为时间/频谱表示(74);装置(22),用于将信息信号从时间/频谱表示(74)转换为频谱/调制频谱表示(88),其中用于转换的装置(22)的设计使得频谱/调制频谱表示(88)依赖于信息信号(14)的时间/频谱表示(74)的幅度分量和相位分量;装置(24,40),用于对频谱/调制频谱表示(88)的信息信号(14)执行处理,来获得修改的频谱/调制频谱表示;以及装置(26),用于形成处理后的信息信号(18),所述处理后的信息信号表示基于修改的频谱/调制频谱表示的信息信号(14)的处理后版本。
2.根据权利要求1所述的设备,其中设计用于将信息信号(14)转换为时间/频谱表示(74)的装置(20),来将时间/频谱表示分解为多个频谱分量,以获得每个频谱分量的复频谱值序列(82a,82b,82c,82d)。
3.根据权利要求2所述的设备,其中用于将信息信号(14)从时间/频谱表示(74)转换为频谱/调制频谱表示(88)的装置(22)包括装置(36,38),用于对预定频谱分量的频谱值序列(82a,82b,82c,82d)进行逐块频谱分解,以获得频谱/调制频谱表示(88)的一部分。
4.根据权利要求3所述的设备,其中设计用于对预定频谱分量的频谱值序列(82a,82b,82c,82d)进行逐块频谱分解的装置(22),以首先将频谱值序列(82a,82b,82c,82d)逐块乘以(84)复载波,使得频谱值序列(82a,82b,82c,82d)的相位过程的平均斜率大小逐块减少,以获得解调制的频谱值块,然后对解调制的频谱值块进行逐块频谱分解,以获得修改的频谱/调制频谱表示(88)的一部分。
5.根据权利要求4所述的设备,其中用于对预定频谱分量的复频谱值序列(82a,82b,82c,82d)进行逐块频谱分解的装置(22)包括装置(32),用于根据信息信号的时间/频谱表示(74),逐块改变复载波,其中所述复载波与复频谱值序列(82a,82b,82c,82d)逐块相乘。
6.根据权利要求5所述的设备,其中设计用于改变的装置(32),来逐块对频谱值序列中的频谱值的相位进行展开,用于逐块改变复载波,以获得相位过程,以及来确定相位过程的平均斜率并基于平均斜率确定复载波。
7.根据权利要求6所述的设备,其中进一步设计用于改变的装置(32),来根据相位过程确定相位过程的轴部分,并基于轴部分进一步确定复载波。
8.根据权利要求4至7之一所述的设备,其中用于形成的装置(26)包括装置(42),用于将信息信号从修改的频谱/调制频谱表示转换回到修改的时间/频谱表示,以获得预定频谱分量的修改的解调制频谱值块;装置(46),用于逐块将修改的解调制频谱值块乘以与所述复载波成复共轭的载波,以获得修改的频谱值块;以及装置(44),用于合并修改的频谱值块,以形成修改的频谱值序列,获得处理后的信息信号(18)的时间/频谱表示的一部分。
9.根据权利要求8所述的设备,其中用于形成的装置还包括用于将处理后的信息信号(18)从时间/频谱表示转换回到时间表示的装置。
10.根据前述权利要求之一所述的设备,其中设计用于修改的装置(40),以对频谱/调制频谱表示(88)的调制分量执行加权,以便进行调制滤波,音频编码,信源分离,信息信号重建,以及错误消除或在信息信号上叠加水印。
11.根据前述权利要求之一所述的设备,其中信息信号(14)为音频信号、视频信号、多媒体信号、测量信号或其他类似信号。
12.根据权利要求1所述的设备,其中用于将信息信号转换为时间/频谱表示(74)的装置(20)包括块形成装置(28),用于从信息信号(14)中形成信息值块序列;以及装置(30),用于对每个信息值块序列进行频谱分解来获得频谱值块序列,其中每个频谱值块包括针对多个预定频谱分量中每个频谱分量的频谱值(76),因此每个频谱分量的频谱值块序列形成频谱值序列(82a-82d)。
13.根据权利要求12所述的设备,其中用于将信息信号(14)转换为频谱/调制频谱表示(88)的装置(122)包括装置(32-38),用于对频谱值序列(82a-82d)中的预定序列进行频谱分解,以获得调制值块,其中设计用于修改的装置(24;40),来修改调制值块(88),以获得修改的调制值块,修改的调制值块是修改的频谱/调制频谱表示(88)的一部分。
14.根据权利要求13所述的设备,其中设计用于形成的装置(26),来对修改的调制值块从频谱分解进行返回转换(42,44,46),以获得修改的频谱值序列,并对基于修改的频谱值序列的修改频谱块序列进行返回转换(48),以获得修改的信息值块序列,以及对修改的信息值块进行合并(50),以获取处理后的信息信号(18)。
15.根据权利要求14所述的设备,其中设计用于对每个信息值块序列进行频谱分解的装置(20),以首先将信息值块序列的每一块乘以窗口函数,然后对其进行频谱分解,并且设计用于形成的装置(26),以在进行合并(50)的时候处理修改的信息值块,使得和窗口函数的相乘不影响处理后的信息信号(18)。
16.根据权利要求13所述的设备,其中设计用于对每个信息值块序列进行频谱分解的装置(20),使得它在每个频谱分量的频谱分解中提供复频谱值序列(82a-82d),并且设计用于对频谱值序列(82a-82d)中的预定序列进行频谱分解的装置(32,34,36,38),来首先修改(34)预定频谱值序列(82a-82d),使得预定频谱值序列的频谱值相位增加或减少随序列稳定增加或减少的数量,来获得相位修改的频谱值序列,然后对相位修改的频谱值序列进行频谱分解(38),来获得至少一个调制值块,并且设计用于形成的装置,来对修改的调制值块从频谱分解进行返回转换(42)以获得修改的频谱值序列,还通过与用于对频谱值序列中预定序列进行频谱分解的装置(34)相逆的方式来对修改的频谱值序列进行修改(46),使得至少一个频谱值序列的频谱值相位增加或减少随序列稳定增加或减少的数量,来获得修改的频谱值序列,并对基于修改的频谱值序列的修改频谱块序列进行返回转换(48),以获得修改的信息值块序列,以及对修改的信息值块进行合并(50),以获得处理后的信息信号(18)。
17.一种用于处理信息信号(14)的方法,包括通过信息信号的逐块变换,将信息信号(14)转换(20)为时间/频谱表示(74);将信息信号从时间/频谱表示(74)转换(22)为频谱/调制频谱表示(88),其中执行转换使得频谱/调制频谱表示(88)依赖于信息信号(14)的时间/频谱表示(74)的幅度分量和相位分量;对频谱/调制频谱表示(88)的信息信号(14)进行修改(24),来获得修改的频谱/调制频谱表示;以及基于修改的频谱/调制频谱表示,形成(26)处理后的信息信号(18),所述处理后的信息信号表示信息信号(14)的处理后版本。
18.计算机程序,该程序含有在计算机上运行时执行权利要求17中所述方法的程序代码。
全文摘要
以更可受控方式根据调制分量和载波分量分解的信息信号处理,通过一种用于处理信息信号(14)的设备而成为可能。该设备包括用于通过逐块变换信息信号将信息信号(14)转换成时间/频谱表示的装置(20)以及将信息信号(14)从时间/频谱表示转换成频谱/调制频谱表示的装置(22),其中用于转换的装置(22)的设计使得频谱/调制频谱表示依赖于信息信号(14)的时间/频谱表示的幅度分量和相位分量。然后装置(24,40)对频谱/调制频谱表示的信息信号(14)执行处理和/或修改来获得修改的频谱/调制频谱表示。另一装置(26)基于修改的频谱/调制频谱表示,最后形成处理后的信息信号(18),表示信息信号(14)的处理后版本。
文档编号G10L21/0208GK1950815SQ200580013764
公开日2007年4月18日 申请日期2005年3月22日 优先权日2004年4月30日
发明者萨沙·迪施, 卡斯滕·林茨迈尔, 于尔根·赫勒 申请人:弗劳恩霍夫应用研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1