数字音频信号的编码方法

文档序号:7535185阅读:1158来源:国知局
专利名称:数字音频信号的编码方法
技术领域
本发明涉及适用于进行输入数字信号的编码的数字音频信号的有效编码方法或装置。
在音频信号或声音信号等的有效编码中,已知一种基于位分配的编码技术将音频或声音、等,划分为时基或频基上多个信道的信号分量,并自适应地分配每一相应频道的位数。作为基于上述例如音频信号等的位分配的编码技术,存在以下编码技术,比如将时基上的音频信号等划分为多个频带中的信号分量以实现其编码的频带划分编码(子频带编码SBC),将时基上的信号变换(正交变换)为频基上的信号以将它划分为多个频带中的信号分量从而自适应地实现每一相应频带的编码的自适应变换编码(ATC),将SBC和所谓的自适应预测编码(APC)相结合、把时基上的信号划分为频带中的信号分量以将各频带上的信号分量转换为基带(低频带)上的信号分量然后执行多阶的线性预测分析实现预测编码的所谓自适应位分配(APC-AB)编码,等等。
在上述有效编码中,利用一种方法将时基上的音频信号等通过每预定单位时间的正交变换,例如快速付里叶变换(FFT)或DCT等变换为垂直于时基的基带(频带)上的信号,然后将频基上的信号划分为多个频带上的信号分量,以通过自适应位配对各已划分频带上的系数数据编码。传送该编码后的数据。
同时,在由上述自适应位分配对各相应频带的系数数据编码时,通常利用一种方法将例如频基上的系数数据划分为每块的数据,以实现各块的所谓块浮点处理进而实行位压缩。为此,作为随后用于译码的构造,利用一种系统结构以便传输经过带划分和每一块的块浮点处理的系数数据和包含各相应块的浮点系数与对应于浮点系数的字长信息的子信息以及各相应块的已分配位的数量。
然而,在上述有效编码中,有必要进一步增加压缩功效。
对于上述考虑中的实际环境,本发明提出了且其目的也正是提供一种能够较高程度进行位压缩的数字信号的编码方法。
为了达到上述目的已提出了按照本发明的数字信号编码方法,该方法涉及适应于正交变换输入数字信号以将正交变换的信号划分为临界频带上的信号分量,以便用表示根据各临界频带的能量和各相应临界频带能量设定的各临界频带的允许噪声电平之间的差值的对应电平的倍数对相应临界频带中的信号分量编码,并将正交变换的信号分量划分为各块从而实现各块的块浮点处理以传输各块的浮点系数。
因此,在进行带宽比临界频带带宽窄的每一小块的块浮点处理的情况下,代替传输每临界频带的浮点系数而传输与允许噪声电平相关的信息,并传输对应于各小块分配的位数的字长信息。而且,在其带宽宽于临界频带带宽的每一大块进行块浮点处理的情况下,转输与各大块的浮点系数有关的信息,并传输对应于每临界频带分配的位数的字长信息。
此外,在其带宽窄于临界频带带宽的每小块进行块浮点处理的情况下,传输对应于相对于在相应临界频带中的小块之一小块分配的位数的字长信息。另一方面,在其带宽比临界频带的带宽要宽的每一大块进行块浮点处理的情况下,在该大块的临界频带中一个临界频带上的字长信息和与相应临界频带中允许噪声电平有关的信息可得到传输。
而且,不再传输与各临界频带的浮点系数相关的信息,而是传输与允许噪声电平有关的信息,其中每一个允许噪声电平的指定范围从临界频带中信号电平范围以较低电平的方向偏移预定电平。
此处,在确定已分配的位数时,有必要考虑人的听觉特征利用一种方法确定各相应临界频带的所谓能的掩蔽量,以根据掩蔽量用允许电平确定各相应临界频带分配的位数。
按照本发明,在进行其带宽窄于临界频带带宽的各小块的浮点处理的情况下,使用一种方法代替传输各相应临界频带的浮点系数而传输与各临界频带允许噪声电平相关的信息以及相应小块的字长信息,从而能够缩减浮点系数的位数。另外,在进行其带宽宽于临界频带带宽的各大块的块浮点处理时,利用一种方法输送与各大块的浮点系数相关的信息,从而能够缩减传输的位数。
而且,在执行其带宽窄于临界频带带宽的各小块的浮点处理的情况下,利用一种方法传输相应临界频带中的小块中的一个小块的字长信息,由此能够缩减字长信息数。因此,可较高程度实现位压缩。
此外在进行其带宽窄于临界频带带宽的各小块的浮点处理的情况下,利用一种方法输送对应于各小块分配的位数的字长信息,并不再传输各临界频带的浮点系数,而是传输与其中每一允许噪声电平指定范围以较低电平方向与临界频带中的信号电平范围偏离预定电平的允许噪声电平指定范围以相关的信息,从而有可能缩减用于传输与允许噪声电平有关的信息的位数。因此,可较高程度实现位压缩。


图1A是用于说明其带宽窄于临界频带带宽的各块实现本发明的浮点处理的情况的示图。
图1B是用于说明其带宽宽于临界频带带宽的各块实现本发明的浮点处理的情况的示图。
图2是本发明实施例的流程图。
图3是以方框图形式示出的用于设置容许噪声的实际构造的电路图。
图4是表示声音频谱的示图。
图5是表示掩蔽频谱的示图。
图6是最小声频曲线与掩蔽频谱合成的示意图。
图7是用于说明该实施例的各块传输的允许噪声电平示图。
现参照附图描述应用本发明的最佳实施例。
按照本发明的数字信号的编码方法涉及如图1A和1B所示的数字信号编码方法,适应于利用例如快速付里叶变换(FFT)或DCT、来正交变换输入数字信号,考虑到人的听觉将该正交变换后的信号划分为临界频带B(B1至B4)上的信号分量,这样随着频率移动到较高频率侧,带宽变宽,以便用表示根据各临界频带的能量和各相应临界频带能量设定的各临界频带的允许噪声电平NL之间的差值的对应电平的位数对相应临界频带中的信号分量编码,并将正交变换的信号分量划分为各块从而实现各块b的块浮点处理以传输各块b的浮点系数Fc。
换言之,在该实施例中,进行如图2流程图所示的处理。首先,在步骤S1,将正交变换的信号分量划分为块中的那些,以进行各块的块浮点处理,由此确定各块的浮点系数(浮点电平)。在步骤S2,确定如后所述在各临界频带能量基础上设定的各相应临界频带的允许噪声电平。在步骤S3,确定对应于根据表示各临界频带允许噪声电平与各相应界频带能量之间差值的电平设定的已分配位数的字长信息。
这里,在该实施例中,例如,如图1A所示,在进行具有窄于临界频带B的带宽的各小块(小块b1到b4)的块浮点处理的情况下,利用一种方法来传输与允许噪声电平NL相关的信息和对应于各小块b1到b4分配的位数的字长W1到W4的信息而不传输各临界频带B的浮点系数。
而且,例如,如图1B所示,在进行具有宽于临界频带B1到B4的带宽的各大块(大块b)的块浮点处理的情况下,利用一种方法来传输与各大块b的浮点系数相关的信息和传输对应于各临界频带B1到B4分配的位数的字长W1到W4的信息。
应注意到,在图1A的实例中,抽取并示出在临界频带的宽带宽的较高频带侧上的一个临界频带B。图1B的实例示出在窄带宽的较低频率侧上的相应频带。此外,在图1A,1B中,由于用于确定分配的位数的电平差和字长W1到W4彼此对应,为方便起见仅示出字长W1到W4。
此外,在该实施例中,如前面描述的,进行借助于自适应位分配的FFT系数数据的编码处理。亦即,在该实施例中通过自适应位分配进行的编码处理如稍后所描述的根据各相应临界频带的能量考虑到人的听觉特征确定所谓掩蔽量,以确定对应于表示根据掩蔽量设定的允许噪声电平(即各相应临界频带上基本固定的允许噪声电平)与相应临界频带中的能量之间的差值的电平的已分配位数,由此依据各相应临界频带的分配的位数进行编码。
而且,相应临界频带中的多个系数数据构成每一固定个数的系数数据的块,以实现各相应块的所谓块浮点处理从而进行位压缩。因此,如图1A的实例,在较高频率侧即,临界频带的宽带宽的临界频带B上,存在多个块(例如,四个小块b1到b4)。另外,如同在带宽狭窄(临界频带的低频带)的情况下,在大块b中存在多个临界频带(例如,四个临界频带B1到B4)。
同时,如果以这种方式正常实施块浮点处理,在后面进行的译码处理过程中需要用于浮点处理的浮点系数和对应于分配位数的数目的字长信息。亦即,作为后续译码的构造,要求利用一种系统结构来传输各块的浮点系数信息和基于浮点系数的电平与临界频带的允许噪声电平之间的电平差的分配位数的字长信息。换言之在接下来的译码过程中,由浮点系数的信息确定块浮点处理中的最高有效位(MSB)。同样,由字长信息确定最低效位(LSB)。困此,允许噪声电平被确定。此外,由相应块的系数数据(主数据)确定信号的大小。
这里,通常分别用6位表示浮点系数的信息,用4位表示字长信息。应注意到,在正交变换是DFT(离散付里叶变换)的情况下,上述字信息由此为大小(幅度)和相位,或用4位表示实部和虚部。因此,例如,在由多个浮点块划分一个临界频带的情况下,对应于块浮点处理的块数(即划分的带数)的整个临界频带的传输的位数如表1所示。
表1再划分的临界频带数 1 2 3 4浮点系数信息 6 6×2 6×3 6×4字长信息 4 4×2 4×3 4×4总和 10 20 30 40在该表1中,在由单个块(一个划分划分的数目为1)代表临界频带的情况下,浮动点系数的6位及字长的4位总起来为10位被传输。另外,在由两块(两个划分)代表临界频带的情况下,传输浮点系数6×2(=12)位和字长4×2(=8)位,总共20位。类似地,在三个划分的情况下;传输浮点系数6×3(=18)位和字长4×3(=12)位,总共30位。另外,在四个划分(图1A实例)的情况下,传输浮点系数6×4(=24)位和字长4×4(=14)位,总共40位。如上所述,随着单个临界频带中的块数的增加,传输的位数也增加。
反之,在本发明实施例的图1A实例中,利用一种方法来传输仅由相对于临界频带B的一个设定的允许噪声电平NL的信息以及对应于分配位数的字长W1到W4的信息,而不传输临界频带B中相应小块的浮点系数Fc1到Fc4的信息。亦即,在随后的译码处理中,如果传输临界频带B的允许噪声电平NL的信息,可根据相应小块b1到b4的允许噪声电平NL的信息和字长W1到W4的信息来确定各相应小块b1到b4的浮点系数Fc1到Fc4的信息。为此,在这种情况下利用一种方案使得无需传输浮点系数Fc1到Fc4的信息。因此,用于传输相对于临界频带B的四个必需的浮点系数Fc1到Fc1的位数能够被压缩。
这里,考虑到人的听觉特征每临界频带确定允许的噪声电平NL。在临界频带中,可以认为允许噪声电平NL在一个临界频带内是基本上恒定的。因此,同样认为允许噪声电平NL还在图1A的临界频带B内的相应块b1到b4中为相同电平。
应注意到当整个动态范围是例如120dB并且以6位代表点系数,浮点系数具有约2dB的精确度,而当以4位代表字长信息时,字长信息具有约6dB的精确度。为此,在图1A的相应小块b1到b4中,在后续译码过程中,由浮点系数Fc1到Fc4的信息和字长W1到W4的信息确定的允许噪声电平具有如图7所示约2dB的偏差或位移。但是,允许噪声电平NL通常落在大体上为+3B的范围内。鉴于此,在该实施例中,利用一种方案以在临界频带中共有的粗略量化的二阶量化和临界频带中浮点处理的相应小块具有的精确量化来表示允许噪声电平NL,由此以高精确度将允许噪声电平NL设定为公共值。亦即,在该实施例中,由于允许噪声电平NL为4比特对数电平,不能用4比特对数表示的允许噪声电平NL可以用2比特对数精确表示。因此,在该实施例中,约6dB被4除,从而使允许噪声电平具有1.5dB的精度。如上所述,将注意力集中到以下事实上,即在多个小块上各允许噪声电平NL基本上是相等的,以从浮点系数和允许电平选择高精度参数,从而能够减少位数。图1A的实施例中位数压缩的方式在表2中对照表1示出。
表2再划分的临界频带数 1 2 3 4允许的噪声电平 4+2 4+2×2 4+2×3 4+2×4字长信息 4 4×2 4×3 4×4总和 10 16 22 28假定传输的位数为100% 100 80 73 70在表2中,在用单外块(一个划分)表示临界频带B的情况下,传输允许噪声电平NL的4位和字长W的4位。应注意到,在允许噪声电平NL,如上所述,加上用于补偿2dB的偏移的2位(4+2位)。为此,在一个划分的情况下,总共传输10位。同样,在用两个小块(二个划分)表示临界频带的情况下,传输允许噪声电平的4+2×2=8位和字长W的4×2=8位,总共16位。类似地,在三个划分的情况下,传输允许噪声电平NL的4+2×3=10位和字长W的4×3=12位,总共22位。此外,在四个划分(图1A实例)的情况下,传输允许噪声电平NL的4+2×4=12位和字长的4×4=16位,总共28位。为此,当假定表1实例传输的位数为100%并与表2实例进行比较时,在表2实例的情况下,该位数等于100%,与一个划分的情况相同,而随着划分数(块数)的增加,提高位压缩率达如下程度,即在两个划分的情况下传输的位数为80%,在三个划分的情况下为73%,以及在四个划分的情况下为70%。因此,可以看出该实施例的方法是非常有效的。
应注意到字长W1到W4的信息的量化具有不自适应但均匀的性质。
而且,与其带宽窄于临界频带带宽的各小块、如图1A所示执行浮点处理的情况比较,在进行例如其带宽宽于临界频带带宽的各大块的块浮点处理的情况下,并且在接下来的译码过程中,通常需要各相应临界频带的块浮点系数信息以及各相应临界频带确定的字长信息。反之,在该实施例中,在进行如图1B所示其带宽宽于临界频带带宽的各大块b的块浮点处理的情况下,各临界频带B1到B4确定的一个大块的浮点系数Fc的信息和字长W1到W4的信息作为与浮动点系数相关的信息进行传输。应注意到未传输相应临界频带B1到B4的允许噪声电平NL1到NL4的信息。亦即,由于在相应临界频带B1到B4中浮点系数Fc彼此相等,有可能由一个浮点系数Fc的信息和各临界频带字长W1到W4的信息确定允许噪声电平NL1到NL4。因此,通过作为子信息仅传输浮点系数Fc的信息和相应字长W1到W4的信息,与通常情况比较有可能进一步压缩子信息的位数。
并且,在图1A的实例中,可利用一种方法仅传输一个临界频带B中相应字长W1到W4的字长W1的信息,而不传输其它字长W2到W4的信息。亦即,仅传输临界频带B中的相应浮点系数Fc1到Fc4的信息和字长W1的信息。换言之,在下面的译码处理过程中,如果传输一个字长的信息,有可能根据相应浮点系数Fc1到Fc4的信息确定剩余字长W2到W4的信息。实际上,如果可由浮点系数Fc1和字长W1来确定允许噪声电平NL,有可能由允许噪声电平NL和浮点系数Fc2到Fc4得知余下的字长W2到W4。由于这个原因,可利用一种有效简化的方案以致不传输剩下的字长W2到W4的信息。因此,有可能压缩用于传输对应于临界频带B的三个字长W2到W4的信息的位数。
对照表3在图3示出图1B实例的位数的压缩方法。
表3临界频带的单位数 1个频带 2个频带 3个频带 4个频带浮点系数信息 6 6 6 6字长信息 4 4×2 4×3 4×4总和 10 14 18 22假定表1实例为100% 100 70 50 55在该表3中,用一个块b中结合或连接的临界频带的数目(单位数)给出说明。在一个块b中结合的频带数为1(1个频带)的情况下,传输相应于浮点系数Fc的信息的6位和字长W信息的4位,总共10位。同样,在临界频带数为2(两个频带)的情况下,传输浮点系数Fc的6位和字长W的4×2=8位,总共14位。类似地,在三个频带的情况下,传输浮点系数Fc的6位和字长W的4×3=12位总共18位。此外,在四个频带(图1B实例)的情况下,传输浮点系数的6位和字长的4×4=16位总共22位。为此,当假定表2实例的传输的位数为100%并与表3进行比较时,在表3实例的情况下,一个频带传输的位数为100%,这与表1实例的情况相同,而随着频带数增加到如下程度使位压缩率得到改进,即两个频带位数为70%,三个频带为60%,以及四个频带为55%。因此,可以看出该实施例的方法是非常有效的。
这里,在本发明实施例中,在其带宽窄于临界频带带宽的各小块进行浮点处理时,在步骤S4,确定并传输对应于各小块分配的位数的字长信息。而在步骤S5和S6,确定并传输其指定范围以较低电平方向从临界频带中的信号电平范围偏移预定电平(基于后面将描述的掩蔽量的电平),而非各临界频带的浮点系数。更实际说来,用在其中存储以较低电平方向使指定范围由临界带中信号电平范围偏移上述预定电平的这些值的量化表来输出和传输对应于步骤S2确定的允许噪声电平的数值。
如上所述,允许噪声电平的指定范围偏移的原因如下。首先,在传输与实际上在步骤S2确定的允许噪声电平相关的信息的情况下,对允许噪声电平使用与实际信号可采用的动态范围相同的指数是无效或无用的。亦即,由于允许噪声电平是根据如后所述其中考虑到人的听觉特征的掩蔽量确定的,它将变得等于低于上述实际信号电平的最大值的预定电平值。例如,选取允许噪声电平使它低于信号电平约26dB。如上所述,使用信号电平实际可获得的动态范围对于采取的允许噪声电平是极其无效或无用的,因此它需低于信号电平某一固定电平。此外,鉴于位数的减少这不是最佳的。由于这个原因,在该实施例中,利用一量化表以使指定范围以更低电平的方向由临界频带信号电平范围偏移预定电平。这样,即使用更少位数,仍能够表示允许噪声电平。换言之,即使用较少位数,可用与在无偏移发生的情况下相同的分辩率(精度)来表示允许噪声电平。因此,有可能压缩传输允许噪声电平的位数。
同时,对于随后的译码处理,维定字长W1的小块b1的传输噪声电平与最靠近允许噪声电平NL的电平之间的差值被一起传输。亦即,作为表示允许噪声电平NL与最靠近它的电平之间差值的信息,可用例如2位的判断位信息传输表示落在实际+3dB范围内各个小块的传输噪声电平的信息。例如,已指出当2位的判断位信息为“00”时,传输噪声电平移到+(正)侧(+1);当该信息为“01”时,该噪声电平不偏移;而当该信息为“10”时,该噪声电平移到-(负)侧(-1)。应注意到未使用“11”,或表示传输噪声电平未改变。
因此,由浮点系数Fc1和字长W1的信息确定小块b1的传输噪声电平。而且,将允许噪声电平NL与最靠近它的电平之间的差值(判断位表示的电平差)加到允许噪声电平NL,从而能够提供最靠近允许噪声电平的电平。此时,由于相应小块b1至b4的传输噪声电平未移动超过邻近最靠近允许噪声电平NL的电平的电平,所以有可能根据相应浮点系数Fc2至Fc4确定相应字长W2到W4。
比较表1在表4中示出图1实例中位数的压缩方式。
表4再划分的临界频带数 1 2 3 4浮点系数信息 6 6×2 6×3 6×4字长信息 4 4 4 4判定位 (2) 2 2 2总和 10 18 24 30假定传输的位数为100% 100 90 80 75
在该表4中,在由单个小块(划分)表示临界频带B的情况下,传输浮点系数的6位和字长W的4位。应注意到在该情况下未使用前述判定位(2位)。为此,在一个划分的情况下,总共传输10位。同样,在以两个小块b(两个划分)表示临界频带B的情况下,传输浮点系数的6×2=12位,字长W的4位和判定位信息的2位,总共18位。类似地,在三个划分的情况下,传输浮点系数的6×3=18位,字长W的4位和判定位信息的2位,总共24位。此外,在四个划分(图1实例)的情况下,传输浮点系数的6×4=24位,字长W的4位,判定位信息的2位,总共30位。为此,当表1实例的传输位数为100%并与表4实例进行比较时,在表4实例的情况下,当划分数为1,传输的位数为100%,这与表1情况相同,而随着划分数(小块的数目)增加,位压缩率改进到如下程度,即为划分数为2时传输的位数为90%,当划分数量3时为80%,是4时为75%。因此,可以看出该实施例的方法极为有效。
应注意到,在上述各实施例中,可用来作为允许噪声电平的电平比动态范围小。亦即,由于S/N的最小值约为30dB,因此不存在允许噪声电平进入离开动态范围峰值(0dB)约30dB的区域的可能性。因此,可在编码器中作出这种设定。
在图3中示出应用该实施例的编码方法的结构实例,该方法适于确定上述允许的噪声电平以进一步根据允许的噪声电平由分配的位数对信号进行编码。
亦即,在图3中,将传输到输入端1的时基上数字音频数据传输给正交变换电路11。在该正交变换电路11上,将时基上的音频数据变换为每单位时间(单位块)频基上的数据。因此,形成含有实部值Re和虚部值Im的系数数据。这些系数数据被传送到幅度相位/信息发生器12。在幅度相位信息发生器12中,由实部值Re和虚部值Im形成幅度信息Am和相位信息Ph。从那里仅输出幅度信息。亦即,由于人的听觉通常对频域的幅度(功率)敏感,而对相位相当迟顿,故在该实施例中仅用幅度信息Am来提供分配位数的信息。
首先将幅度信息Am传输给频带划分器13。该划分器13将幅度信息Am表示的输入数字信息分为所谓的临界频带。通过考虑人的听觉特征(频率分析能力)而确定该临界频带。例如,将0至22KHz频带的信号划分为25个频段,以形成一种设定使得随着频率移向更高频率侧频带宽度变得更宽。亦即,人的听觉具有象一种带通滤波器一样的特征,而由各滤波器划分的频带称之为临界频带。
由频带划分器13划分为临界频带的各相应频带的幅度信息Am分别传输到总和检测器14。在该总和检测器14上,通过求取相应频带中各幅度信息Am的总和(幅度信息Am的峰值、均值或能量的总和)来确定各相应频带的能量(相应频带中的频谱强度)。总和检测器14的输出、即相应频带的总和的频谱一般称之为声音频谱。例如,图4中示出相应频带中的声音频谱SB。应注意到,为了简化图4的表示,用12个频带(B1至B2)来表示临界频带的频带数。
这里,为了能够对声音频谱SB的所谓掩蔽施加影响,将一预定的加权函数褶入声音频谱SB(卷积)。为实现这一点,总和检测器14的输出,即声音频谱SB的相应值被传送到滤波电路15。该滤波电路15含有,例如,用于顺序延迟输入数据的多个延迟元件,用于将这些延迟元件的输出乘以滤波器系数(加权函数)的多个乘法器(例如,对应于相应频带的25个乘法器),以及用于求出各乘法器输出的总和的总和加法器。在滤波器电路15的各乘法器中,乘法操作执行如下。例如,在对应于任意频带的乘法器M,以各延迟元件的输出乘以滤波系数,在乘法器M-1,以这些输出乘以滤波系数0.15;在乘法器M-2,以这些输出乘以滤波系数0.0019;在乘法器M-3,将这些输出乘以滤波系数0.000086;在乘法器M+1,这些输出乘以滤波系数0.4;在乘法器M+2,这些输出乘以滤波系数0.06;以及在乘法器M+3,这些输出乘以滤波系数0.007。这样即实现声音频谱SB的卷积过程。应注意到M是1到25的任意整数。通过该卷积过程。应注意到M是1至25的任意整数。通过该卷积过程。求出虚线表示部分的总和。应注意到,上述掩蔽涉及一个信号被另一信号掩蔽而未被听到的现象。作为掩蔽效果,存在时基上音频信号的掩蔽效应和频基上音频信号的掩蔽效应。亦即,通过这种掩蔽效应,即使在受到掩蔽的部分存在任何噪声,这种噪声不会被听见。为此,在实际音频信号中,认为受掩蔽部分中的噪声是允许的噪声。
然后,将滤波电路的输出传送到减法器16。该减法器16用于确定对应后面将在卷积区域中描述的允许噪声电平的电平a。应注意到,对应于容许噪声电平(允许的噪声电平)的电平a为这样一种电平,通过如后所述进行反卷积处理变为对应于临界频带的各频段的允许噪声电平。这里,用于确定电平a的允许函数(表示掩蔽电平的函数)传输给减法器16。通过增加或减小该允许函数进行电平a的控制。该允许函数来自后面将要描述的函数发生器29。
亦即,当从一个频带的低频段按序给出的数目临界带宽假定为i时,对应于允许噪声电平的电平a由下列方程确定a=S-(n-ai)其中n和a分别为常数,S是卷积处理的声音频谱的强度。在以上方程中,(n-ai)表示允许的函数。在该实施例中,n设定为38,a设定为1。此时未导致声音质量的下降。从而进行令人满意的编码。
以该方法确定出电平a。该数据被传输给除法器17。该除法器17用来在卷积区域中对电平a施行反卷积。因此,通过执行这种反卷积,由电平a形成掩蔽频谱。亦即,该掩蔽频谱变为允许的噪声频谱。应注意到,虽然上述反卷积过程需要复杂的运算,在该实施例中用简化的除法器实现反卷积。
然后,上述掩蔽频谱通过合成电路18传输到减法器19。此处,总和检测器14的输出,即,前述来自总和检测器14的声音频谱SB通过延迟电路21传递给减法器19。在该减法器19上,进行掩蔽频谱与声音频谱SB之间的减法运算。因此,如图5所示,其电平低于由掩蔽频谱MS所表示的电平的声音频谱受到掩蔽。
减法器19的输出通过允许噪声电平校正器20传送到ROM30。在ROM30中,存储用于量化幅度信息Am的多个分配的位数信息。该ROM30用作输出对应于减法器19的输出的已分配位数信息(相应频带中能量与噪声电平设定装置的输出之间的电平差)。因此,量化器24根据分配的位数信息进行幅度信息Am的量化处理。量化器24的输出从输出端2输出。应注意到,提供延迟电路21以便通过考虑合成电路18之前的各电路的延迟量延迟来自总和检测器14的声音频谱SB。而且,提供延迟电路23,以便通过考虑ROM30之前各电路的延迟量延迟幅度信息Am。
此外,在上述合成电路18的合成中,有可能合成表示所谓最小声频曲线RC的数据和掩蔽频谱MS,其中所述最小声频曲线RC是由最小音频曲线发生器提供的如图6所示人的听觉特性。在该最小声频曲线中,如果噪音绝对电平低于该最小声频曲线则听不见该噪声。而且,即使编码相同,最小声频曲线会依据重放时的重放音量的变化量而变。应注意到,由于在音乐进入、例如实际数字系统的16位动态范围的方式上还存在如此大的变化,如果假定例如该频率的量化噪声在4KHz附近最易于被人耳所听到,则认为低于最小声频曲线电平的量化噪声在其它频带将所不到。因此,当假定利用一种其中例如在该系统具有的字长的4KHz附近的噪声听不到的传用方式时,并通过合成最小声频曲线RC和掩蔽频谱MS形成允许的噪声电平,在该情况下的允许噪声电平允许为达到该图中斜线表示部分的电平。应注意到,在该实施例中,引起最小声频曲线的4KHz电平和对应于例如20位的最小电平相一致。在图6中,共同示出信号频谱SS。
在允许噪声电平校正器20,根据校正值判定电路28输送的所谓等响曲线的信息来校正减法器19的允许噪声电平。亦即,从校正值判定电路28输出用于根据所谓等响曲线数据校正来自减法器19的允许噪声电平的校正值信息。该校正值数据被传输给允许噪声电平校正电路20。因此,考虑来自减法器19的允许噪声电平的等响曲线进行校正。应注意到等响曲线与人的听觉有关。该曲线通过确定各频率声音的声压获得,这些频率的声音可在与例如1KHz的纯声音相同的强度上听到,并连接这些声压。该曲线也称为响度的等敏感度曲线。此外,该等响曲线基本上与图6所示最小声频曲线RC相同。在该等响曲线上,例如在4KHz附近,即使声压比在1KHz降低8至10dB,在与1KHz声音相同强度上听到在该时间的声音。反之,在50KHz附近,如果声压比1KHz附近声压高约15dB,在相同声压下听不到声音。为此,看出有必要允许最小声频曲线的电平(允许的噪声电平)以上的噪声具有由对应于等响曲线的曲线给出的频率特性。由于这一原因,看出通过考虑等响曲线来校正允许噪声电平适合于人的听觉特性。
应注意到在该实施例中,可使用一种结构以致于不进行最小声频曲线的上述合成处理过程。亦即,在该情况下,最小声频曲线发生器22和合成电路18变为是不需要的。来自减法器16的输出在除法器进行反卷积,然后直接传输到减法器19。
在数字信号编码方法中,利用一种方法正交变换输入数字信号,将正交变换的信号划分为临界频带的信号分量,以用基于各相应临界频带的允许噪声电平的自适应分配的位数对相应临界频带中的信号分量编码,并传输通过将块浮点处理应用于正交换的信号分量而获得的浮点系数。因此,在进行其带宽窄于临界频带带宽的各小块的浮点处理的情况下,利用一种方法代替传输各相应临界频带的浮点系数而传输与各临界频带的允许噪声电平有关的信息和相应小块的字长信息,因此能够缩减浮点系数的位数。而且,在进行其带宽宽于临界频带带宽的各大块的块浮点处理的情况下,利用一种方法传输与各大块的浮点系数相关的信息,从而能够缩减传输的位数。
而且,在进行其带宽窄于临界频带带宽的各小块的浮点处理的情况下,利用一种方法传输相应临界频带的小块中的一个小块的字长信息,从而能够缩减字长信息数。因此,可更高程度进行位压缩。
此外,在其带宽窄于临界频带带宽的各小块进行浮点处理的情况下,利用一种方法传输对应于各小块分配的位数的字长信息,并代替传输各临界频带的浮点系数而传输与其指定范围以较低电平方向从临界频带的信号电平范围偏移预定电平的各允许噪声电平相关的信息,从而能够缩减用于传输与允许噪声电平相关的信息的位数。因此能更高程度实现位压缩。
权利要求
1.一种数字信号编号方法,该方法适用于正交变换输入数字信号,将正交变换的信号划分为临界频带上的信号分量,以便用对应于根据各所述临界频带的所述信号分量的大小和所述相应临界频带的大小设定的各所述临界频带的允许噪声电平之间的差值的电平的位数对所述相应临界频带中的所述信号分量编号,并将正交变换的信号划分为各块从而实现各块的块浮点处理,由此传输各所述块的浮点系数,其特征在于,在进行其带宽比所述临界频带带宽窄的每一小块的块浮点处理的情况下,利用一种方法代替传输各所述临界频带的浮点系数而传输与允许噪声电平相关的信息,并传输对应于各所述小块分配的位数的字长信息。
2.一种数字信号编码方法,该方法适用于正交变换输入数字信号,将正交变换的信号划分为临界频带上的信号分量,以便用对应于根据各所述临界频带的所述信号分量的大小和所述相应临界频带的大小设定的各所述临界频带的允许噪声电平之间的差值的电平的位数对所述相应临界频带中的所述信号分量编码,并将正交变换的信号划分为各块从而实现各块的块浮点处理,由此传输各所述块的浮点系数。其特征在于,在进行其带宽比所述临界频带带宽要宽的每一大块的块浮点处理的情况下,利用一种方法传输与各所述大块的浮点系数相关的信息,并传输对应于各所述临界频带分配的位数的字长信息。
3.一种数字信号编码方法,该方法适用于正交变换输入数字信号,将正交变换的信号划分为临界频带上的信号分量,以便用对应于根据各所述临界频带的所述信号分量的大小和所述相应临界频带的大小设定的各所述临界频带的允许噪声电平之间的差值的电平的位数对所述相应临界频带中的所述信号分量编码,并将正交变换的信号划分为各块从而实现各块的块浮点处理,由此传输各所述块的浮点系数,其特征在于,在进行其带宽比所述临界频带带宽窄的每一小块的块浮点处理的情况下,利用一种方法传输对应于相对所述相应临界频带中所述小块中的一个小块分配的位数的字长信息。
4.一种数字信号编码方法,该方法适用于正交变换输入数字信号,将正交变换的信号划分为临界频带上的信号分量,以便用对应于根据各所述临界频带的所述信号分量的大小和所述相应临界频带的大小设定的各所述临界频带的允许噪声电平之间的差值的电平的位数对所述相应临界频带中的所述信号分量编码,并将正交变换的信号划分为各块从而实现各块的块浮点处理,由此传输各所述块的浮点系数,其特征在于,在进行其带宽比所述临界频带带宽窄的每一小块的块浮点处理的情况下,利用一种方法传输对应于各所述小块分配的位数的字长信息,并代替传输各所述临界频带的浮点系数而传输与其指定范围以较低电平方向从所述相应临界频带的信号电平范围偏移预定电平的各允许噪声电平相关的信息。
5.如权利要求1到4所述的数字信号编码方法,其特征在于所述正交变换为DCT。
6.如权利要求1到4所述的数字信号编码方法,其特征在于所述临界频带在0到22KHz的频带上被划分为25个频段,并作出设定使得随着频率移动到较高频带一侧,带宽变得更宽。
7.如权利要求1到4所述的数字信号编码方法,其特征在于各所述临界频带的信号分量的大小为各所述频带频谱强度的幅度信息的总和。
8.如权利要求7所述的数字信号编码方法,其特征在于所述幅度信息的总和是对预定加权函数进行进一步卷积,从而将听觉的掩蔽效应包括在所述幅度信息中。
全文摘要
在一种适用于将输入数字信号变换为频基上的信号以将频基上的信号划分为各块的信号分量,从而以自适应分配的位数对各块的信号分量编码的有效数字信号编码装置中,利用一种方法正交变换输入数字信号,将正交变换的信号划分为各临界频带的信号分量,以用基于各临界频带的允许电平的自适应分配的位数对这些信号分量编码,从而实现其浮点处理。
文档编号H03M7/30GK1065565SQ9210229
公开日1992年10月21日 申请日期1992年3月28日 优先权日1991年3月29日
发明者赤桐健三 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1