高效编码和解码的方法及装置的制作方法

文档序号:7563949阅读:200来源:国知局
专利名称:高效编码和解码的方法及装置的制作方法
技术领域
本发明涉及高效编码方法和装置,高效解码方法和装置,通过高效编码、传输、记录、重放将输入数字数据编码,并对产生应答数据的数据进行解码。
存在着若干种对音频或视频信号进行高效编码的方法。其中典型的是分频带编码(SBC),这种编码是将时域信号划分的多频带信号而不是将时域音频信号划分为多个块的非块成形频带划分系统,和将时域信号划分为多个块、通过正交变换将所得块变换为频域信号并从一个频带到另一频带将所得频域信号编码的块成形频带划分系统。也称之为变换编码。还存在一种已知的高效编码是分频带编码与变换编码的结合,其中用分频带编码将时域信号划分的多个频带的信号,随后从一个频带到另一频带将相应频带的信号正交变换为编码的频域信号。
上述方法中所用的滤波器可拿1976年R.E.Crochiere的“分频带语音数编码”(BellSgst.Tach.J.Vol.55No.81976)中讨论的90°相移镜象滤波器(QMF)来举例。用多相90°相移滤波器的等频带滤波器划分方法在ICASSP83,Boston,JosephH.Rothweiler的“多相90°相移滤波器-一种新的分频带编码技术”中进行了讨论。
可用将输入音频信号变为预置单位时间周期(帧)间隔上的块,并用将时域信号变换为频域信号的快速富里叶变换(FFT)、正弦变换(DCT)或修正正弦变换(MDCT)处理所得块的正交变换来列举正交变换。对于MDCT,可参见ICASSP1987中J.P.Princen(A.B.BradleyVniv.ofSurreyRoyalMelbourneInst.ofTech)的“基于时域混合抵消的和用滤波器频带设计的分频带/变换编码”。在我们于1992年9月24日提交的共同未决的美国专利序列号07/950,945中详细讨论了MDCT的具体技术。
在量化频率分量时,考虑人的听觉特性选择频带。亦即,将音频信号划分为多个、例如25个已知为临界带的频带,其中在频率增大的方向频带变得越宽。在对相应频带的数据编码时,将预定数的位分配给每个频带或通过自适应位分配将可变数的位分配给每一频带。例如,当由位分配对用MDCT得到的系数数据编码时,用自适应的位数对由基于块的MDCT获得的相应频带的MDCT系数数据编码。已知以下两种位分配方法。
在1977年8月IEEE声学、语音和信号处理会议文集ASSP-25第4号卷中,是根据频带的信号量进行位分配的。对于该系统来说,量化噪声频谱变得平缓且噪声能量最小。但是,人耳实际感觉到的噪声并非最佳,因为未到用听觉掩蔽效应。
在ICASSP1980“临界频带编码器-听觉系统的感性要求的数字编码”(M.A.KransnerMIT)中,讨论了一种产生每频带实现固定位分配所需的信噪比的方法。然而,用该方法产生令人满意的特征值是不可能的,因为即使测量具有正弦波输入的特性时该位分配保持一定。
上述方法未考虑诸如输入信息信号的时间变化一类的瞬时特性。由此,不能解决高度振动的前回波的问题,这种高度振动的前回波是在输入信息信号在幅度上突然改变时,尤其是小信息信号变为较大信息信号时产生的。前回波期间意味着如下现象,即恰好在小信息信号突然变为较大信息信号之前产生的量化噪声被听到,而未被反向掩蔽所覆盖,从而导致音质的降低。
对于将前回波降低到人耳听不到的水平的方法,本申请人在1990年7月18日提交的美国序列号07/553608中已提出了一种自适应地改变块长度的方法。具体说来,该方法是细分确实存在变化信号因此存在出现前回波的很大危险性的块。尽管用该方法可有效抑制前回波,但前回波仍存在于细分的块部分中,即使达有限程度。
如果仅考虑频率特性作出位分配,则难于避免在信息信号的突然传递期间前回波所引起的音质降低。这样带来了对有效防止前回波出现的方法的需要。
因此本发明的主要目的是提供一种就人的听觉而论无前回波的位分配方法。
按照本发明的高效编码装置,通过优先将至少一部分可用作位分配的位分配给根据频道之间信息信号的瞬时变化具有较大信息信号瞬时变化的频道而防止前回波。根据作为信息信号频率分量的归一化信息的标度因子检测并判定瞬时变化的信息信号瞬时变化大小对避免新的算术和逻辑运算是有效的,因为该参量形成从编码器传输到解码器的部分子数据。
作为又一方法,对运行而言还希望根据在进一步划分具有标度因子的块的时间宽度获得的时间标度上的分块信息幅度瞬时变化作出检测和判定。不仅改变频道之间的位分配而且根据频道中相邻块之间的信号信息瞬时变化改变频道中的位分配在进一步减小前回波上是有效的。
按照本发明,为将时域信息信号转化为频域信号,可利用其中通过块或形频率分析如正交变换将诸如滤波器一类非块成形频率分析的输出、诸如正交变化一类块成形频率分析的输出或非块成形频率分析的输出映射在频标上的结构。
在位分配时,有可能依据各频道信息信号频谱分配适于作位分配的部分位作为第一位分配,并利用剩余的位作为第一位分配附加部分。在附加位中,对与信息信号的瞬时特性一致的频道和频道之一作出位分配。通过使与各频道信息信号一致的位分配与附加位分配之间的比率依赖于信息信号的瞬时变化,有可能获得音质进一步要求的位分配。
如果正交变换的块尺寸自适应地随信息信号的时间特性变化,同时在频道之间进行位分配,则在信息信号为次稳态信号时有可能增加块长度从而提高频率分辨率,同时还可能在信息信号为非稳态信号时提高时间分辨率,以减少回波发生的时间,防止音质降低。
本发明提供一种能够减少在高效编码时有可能产生的前回波所导致的音质降低并便于影片或需要高音质的音频系统的音频记录和重放的系统。


图1是表示按照本发明的高效编码装置的说明性布局的电路方框图;
图2示出了图9装置沿时间标度和沿频率标度划分信号的方式;
图3是表示用图1所示装置找出多频道位分配参数的配备的方框图;
图4是表示找出音调的方式的图形;
图5是表示第一次位分配的方式的图示;
图6是表示在第一次位分配中均匀分配的情况下噪声频谱的图示;
图7是表示用于产生表现出对信号电平的依赖性和对信息信号频谱的依赖性的听觉效果的位分配的噪声频谱实例的图示;
图8是在第二次位分配中均匀分配的情况下噪声谱的图示;
图9是用于产生表现对信号电平的依赖性和对信息信号频谱的依赖性的听觉效果的位分配实例的图示;
图10示出找出考虑频道之间信息信号的时间特性的位分配参数的方式;
图11是表示按照本发明的高效解码装置的说明性布局的电路方框图;
图12是第一次位分配的量与平均频道音调之间的关系的图示;
图13是第一次位分配的量与平均频道时间变化率之间的关系的图示。
参见图1,详细说明了由分频带编码(SBC)、自适应变换编码(ATC)以及自适应位分配(APC-AB)对诸如音频PCM信号一类的输入数字信号进行高效编码的技术。
在如图1所示的高效编码装置中,用滤波器或类似物将输入数字信号划分为多个频带并从一个频带到另一频带进行正交变换,以产生由自适应位分配根据考虑做说明的人的听觉特性的临界带编码的频域频谱数据。这时,当频率上升时,临界带被细分为块。在借助滤波器等实现的非块成形系统的情况下,这些频带自然可具有相等宽度。
此外,在本实施例中,在正交变换之前,块尺寸或块长度依据输出信号自适应地变化,并根据临界频带或从更高频率的临界带细分的块实现浮点操作。该临界带表示考虑人的听觉特性而作出的频率划分所产生的频带。亦即,临界带是适合窄带噪声频带,它屏蔽具有与噪声相同强度和噪声频率附近的频带的纯音。从0到22kHz的整个频率范围划分为例如25个临界带,选择频带使越靠近较高频率带宽变得越宽。
参见图1,具有例如从0到22kHz频率范围的音频PCM信号施加于输入端10。用诸如QMF滤波器一类的频带划分滤波器将输入信号划分为从0到11kHz的频带和从11到22kHz的频带。由频带划分滤波器12将0到11kHz的频带划分为0到5.5kHz的频带和5.5到11kHz的频带。来自滤波器11的11khz到22kHz的信号提供给作为正交变换电路实施的修正离散余弦变换(MDCT)电路13,而来自滤波器12的5.5kHz到11kHz的信号提供给修正离散余弦变换(MDCT)电路14,以及来自滤波器12的0kHz到5.5kHz信号提供给修改离散余弦变换(MDCT)电路15以用MDCT加以处理。
图2示出了MDCT电路13至15的块尺寸的具体实例。在图2的具体实例中,三个滤波器输出中每个均具有两种正交变换的块尺寸。亦即,对应频带0到5.5kHz上的低频信号和频带5.5到11kHz上的中频信号,每块分别由对应长块尺寸(图2A)的128个样本和对应短块尺寸(图2B)的32个样本构成。另一方面,对于频带11到22kHz上的高频信号来说,每块分别由长块尺寸(图2A)的256个样本和短块尺寸(图2B)的32个样本构成。如果以该方式选择短块尺寸,趋于较高频时间分辨率增加,所用的窗口种类数下降,而每频带正交变换的抽样数保持相同。
返回图1,由MDCT电路13至MDCT电路15通过MDCT(修正离散系统变换)获得的频域频谱数据或MDCT系数按照临界带或在较高频率范围内按照临界频带进一步划分的小尺寸的块加以分组,并传输到自适应位分配编码电路16,17和18。依据自适应位分配编码电路16,17和18为每个临界带或在较高频率范围内为每个由临界带进一步划分的小尺寸的块分配的位数对频谱数据或MDCT系数数据进行再量化。在输出端22,24和26输出这样编码的数据。表明对信号幅度使用哪种归一化的标度因子和表明已使用哪种位长度的位长度信息是同时传输的。
对于图1所示的MDCT电路13到15的输出,通过例如计算频带中各幅度值的均方根值得出临界频带或由临界带细分的小尺寸块的信号能量。标度因子本身自然可用于后续位分配。在这种情况下,不必进行新的能量计算,这就减小硬件尺寸。当然可利用幅度值的峰值或平均值代替各频带的能量。
参照图3说明自适应位分配电路的操作。尽管在本实施例中有8个频道,但图3中仅示出频道1和8,其它频道被省略。利用频道1对这些频道的公共部分加以解释。频道1的输入信息信号加到输入端31。通过映射功能电路32将输入信息信号从时域信号映射到频率轴上。如果利用滤波器,分频带信号变为时域抽样。在正交变换输出的情况下,则产生频域抽样。由块成形功能电路33将这些样本分组为各由多个样本组成的集。若利用滤波器,多个时域样本被分组在一起,然而,在正交变换输出的情况下,多个频域抽样样本被分组在一起。在图1实施例中,通过瞬时变化计算功能电路44计算映射期同MDCT输入时域信号的瞬时变化。
归一化功能电路37将由块成形功能电路33分组为各由多个样本组成的块的样本归一化。标度因子计算功能电路35计算标度因子即归一化系数。由所计算的标度因子,音调计算功能电路36计算音调的大小。以这种方式得出的参数用于在位分配功能电路38中进行位分配。如果假定代表MDCT系数并准备用作传输或记录的位数对所有频道而言为800kbps,则确定了本实施例中用于第一次位分配的位数。
由此,在与信号频谱有关的信息中,利用(a)与音调相关的信息以及(b)与信息信号的瞬时变化相关的信息。
首先参见与音调相关的信息,被信号频谱分量数所除的信号频谱分量的相邻值之间的差的绝对值之和用来作为指数。更精确地说,作块浮动的基于块的标度因子的相邻标度因子指数之间的差的平均值用来作为指数。标度因子指数实际上对应于标度因子的对数。在本实施例中,用于进行第一项位分配的位的数量与表示音调的值相关,并设定600kbps的最小值。
以下述方式计算音调。
Tm=1/WLmax(∑ABS(SFn-Sfn-1)
Tav=(1/CH)∑Tm其中Tm=每频道的音调m=频道号WLmax=字长的最大值=16Ch=频道数量SFn=实际对应于峰值对数的标度因子指数n块浮动的频带数Tav平均频道音调以该方式得出的Tav值与图12所示的第一位分配量相关。
在本实施例中,第一位分配模式的分配与附加的至少一种其它位分配之间的分布比例依赖于信息信号的瞬时变化特性。在本实施例中,通过比较为正交变换从时间块尺寸划分的每时域的相邻块的信息信号峰值来检测信息信号幅度突然变大的时间区域以确定分布比例。
以下述方式计算时间变化率。
Vt=VmVav=(1/Vmax)*(1/Ch)Vt其中Vt是每频道的时间分块的峰值以db表示的从较小值到较大值变化的每频道之和Vm每频道的时间分块的峰值以db表示的从较小值到较大值变化的最大值的大小,该最大值限制为30db并以Vmax表示
m频道号Ch频道的数量Vav以db表示的每频道的时间分块的峰值从较小值到较大值的均频道变化以该方式得出的Vav值与图13所示第一次位分配的量相关联。
归根结底,由下列方程得出第一位分配量B=1/2(Bf+Bt)其中B第一位分配的最终值Bf由Tav得了的位分配量Bt由Vav得出的位分配量在以这种方式确定了第一次位分配所用的位数量之后,频道进行第一次位分配的位分配。
依据信号性质可作出多种选择。当然可根据频标上的标度因子分布作出自适应位分配。在这种情况下,可依据频道总体的频率标度上的标度因子分布借助于频道之间的位分配作出有效位分配。在该情况下,如果在相同音域中混合多个频道的信息信号以便如同在说话者的情况下到达左耳和右耳,则可假定频道总体的混合信号进行了有效掩蔽。因此,进行位分配是有效的,使得各频道达到相同的噪声电平。由此,与标度因子指数成正比地进行位分配就够了。
Bm=B×∑SFn/SS=∑(∑SFn)其中Bm每频道的第一次位分配量
B频道总体的第一次位分配量SFn=实现上对应于峰值对数的标度因子指数n=块浮动的频带号m=频道号S=频道总体的标度因子指数之和然后,进行第一次位分配中未运用的位分配。
(1)抽样值总体的均匀分配图6示出了该情况下位分配量化噪声谱。对整体频带可作出均匀噪声电平衰减。
(2)实现表现依赖于信号电平和信息信号频谱的听觉效果的位分配图8中示出了该情况下位分配的典型量化噪声频谱。在这些情况下,依据信息信号频谱实现位分配。特别是,实现位分配以着重于信息信号频谱的低频端从而补偿低频端比高频带更显示出现的掩蔽效果下降。这是基于着重于信号频谱低频的掩蔽曲线的非对称性,以考虑相邻临界带之间的掩蔽。
图8和9示出了位分配的方式。在整个频率范围上信号频谱平滑的低音调输入信号的情况下,如图8中所示更多的位分配给第一次位分配。反之,在高音调输入信号的情况下,第一位分配的位数量减少,如图9所示,而第二位分配的位数量增加,如图9所示,因此更多的位分配给具有较大电平的信号频谱。
在图7和9中,设立第二位分配以便将着重点放在低频端。在本实施例中,存在多种位分配模式,其中较短时间间隔的块的位数量分布于各频率。此外,在本实施例中,提供位分配率在中到低频范围和高频范围不同的多种位分配模式。选择这样一种模式,其中信号大小越小,高频端的位分配量越少。以这种方式,利用对较小信号大小削弱高频敏感度的高声效果成为可能。尽管对信号大小而言此时可利用整个频率范围的信号值,但所用的是利用滤波器或MDCT输出的非块成形频率划分电路的输出。最终,由图3所示的位分配功能电路38得到第一位分配和附加于第一位分配的位分配之和。
除了以上所述,本发明还包含检测各频道信号的瞬变特性以改变各频道的位分配量的过程。以如下方式得到表示瞬时变化的指标。
如果如图10所示存在8个频道,作为各频道输入信息信号位分配的时间单元的位分配时间块被瞬时化分为得出各自峰值的四个分块。依据从较小值变为较大值的分块峰值差的大小这些位分布于频道之间。若C个位的总和适于这八个频道的位分配,且从较小值到较大值变化的分块的峰值之差表示为a,b,c,d,e,f,g以及hdb,则要用C*a/T,……C*h/T位作出位分配,其中T=a+b+c+d+e+f+g+h。信号信息的增加率越大,分配给频道的位数越多。最终的位分配为上述位分配的位之和。
此外,若可用作第一位分配的位数等于C,则有可能提供t位作为前回波的防范围措施。即,若C-t位是可用在八频道中的位数,且每频道相应分块的峰值差的大小表示为a,b,c,d,e,f,g和hdb,则可由(C-t)*a/T,(C-t)*b/T,……(C-t)*h/T位进行位分配。
对于前回波为最大值即存在a,b,c,d,e,f,g和h中的最大值的频道之一来说,优选分配t位。因此,更多的t位分配给该频道致使前回波显著减少。尤其,当本技术用于其中主要前向信号FRFL是临界的电影胶片的声迹时,可将t位分配给它们中之一。另外,可将该t个位分配给低音喇叭频道。
图11示出用于将高效编码的信号解码的解码电路。各频带的量化MDCT系统加到解码电路122,124和126的输入端,而所用的块尺寸信息加到输入端123,125及127。解码电路116,117及118释放利用自适应位分配信息的位分配。在MDCT电路113,114及115中,频域信号被转换的时域信号。由IQMF电路将部分范围的时域信号解码为整个范围的信号。
由以上叙述可见本发明提供了一种在从听觉上讲希望的多频道系统中压缩瞬时振动信息信号的位分配方法。
权利要求
1.对多个频道的数字信息信号进行预定位分配并根据分配的位获得编码的信息信号的高效编码方法,其特征在于在频道之中进行位分配的量是基于各频道信息信号的瞬时变化。
2.如权利要求1所述的高效编码方法,其特征在于根据各频道数字信息信号的幅度信息的瞬时变化控制频道中位分配量。
3.如权利要求1所述的高效编码方法,其特征在于幅度信息是各频道数字信息信号的能量值,峰值或平均值。
4.如权利要求4所述的高效编码方法,其特征在于根据各频道比例因子的瞬时变化控制频道中的位分配量。
5.如权利要求4所述的高效编码方法,其特征在于依据各频道标度因子瞬时变化和频道中位分配导致的字长瞬变控制频道中的位分配量。
6.如权利要求1所述的高效编码方法,其特征在于依据各频道瞬时相邻多个块的幅度信息瞬变控制频道中的位分配量。
7.如权利要求1到6所述的高效编码方法,其特征在于用作位分配的位总体划分为依赖于以相对于时间和频率的细分获得的小块表示信号量的指数模式的第一位分配和至少一种附加于所述第一位分配的听觉效果的其它位分配。
8.如权利要求7所述的高效编码方法,其特征在于所述第一位分配与至少一种其它位分配之间的分布率是依据信息信号自适应地加以控制的。
9.如权利要求8所述的高效编码方法,其特征在于控制所述分布率使得所述信息信号的瞬时变化越大,所述第一位分配的分布率变得越小。
10.发权利要求1至9所述的高效编码方法,其特征在于在非块成形频率分析之后通过诸如正交变换一类的块成形频率分析来分析非块成形频率分析的输出,以由相对于时间和频率的细分获得的小块产生抽样。
11.如权利要求10所述的高效编码方法,其特征在于非块成形频率分析的频带宽度至少在最低范围内是相同的。
12.如权利要求10所述的高效编码方法,其特征在于接近较高频率范围至少在最高频率范围非块成形频率分析的频带宽度较宽。
13.如权利要求10或11所述的高效编码方法,其特征在于用滤波器实现所述非块成形频率分析。
14.如权利要求13所述的高效编码方法,其特征在于所述滤波器是多相90°相移滤波器。
15.如权利要求所述的高效编码方法,其特征在于所述滤波器是90°相移镜象滤波器。
16.如权利要求10所述的高效编码方法,其特征在于接近较高频率范围至少在最高频率范围非块成形频率分析的频带宽度较宽。
17.如权利要求10所述的高效编码方法,其特征在于所述块成形频率分析由MDCT进行。
18.如权利要求10到17所述的高效编码方法,其特征在于根据输入信号瞬时特性自适应地改变所述块成形频率分析的块尺寸。
19.如权利要求18所述的高效编码方法,其特征在于对于至少两个非块成形频率分析输出频带中每个相互独立地改变所述块尺寸。
20.如权利要求1至19所述的高效编码方法,其特征在于已编码的信息记录在记录介质上。
21.如权利要求20所述的高效编码方法,其特征在于所述记录介质是电影胶片,光盘,磁带或磁光盘。
22.用如权利要求21所述的高效编码记录方法进行记录的记录介质。
23.如权利要求20所述的记录介质,其特征在于所述记录介质是电影胶片、光盘、磁带或磁光盘。
24.如权利要求1到18所述的高效编码方法,其特征在于在数字信息传输通道上传输已编码的信息。
25.如权利要求24所述的高效编码方法,其特征在于所述传输通道是数字信息传输通道。
26.一种高解码方法,其特征在于对记录的信息或由如权利要求21所述的高效编码方法记录或传输的传输信号进行解码。
全文摘要
根据各频道信息信号瞬时变化控制频道间位分配量。此外,根据各频道数字信息信号幅度信息瞬变控制频道间位分配量。至少可用作位分配的部分位对随多频道之一信息信号瞬变大小具有较大信息信号瞬变的频道作优先分配。结果,在多音频信号频道的系统中可防止归因于高效编码期间前回波的音质下降。
文档编号H04N7/26GK1093843SQ94101748
公开日1994年10月19日 申请日期1994年2月2日 优先权日1993年2月2日
发明者赤桐健三 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1