数字音频编码方法以及装置的制作方法

文档序号:7593987阅读:105来源:国知局
专利名称:数字音频编码方法以及装置的制作方法
技术领域
本项发明中涉及到的是可进行高速演算的数字音频编码方法以及装置。
背景技术
随着数字音频在通讯、计算机、家电等众多领域中的广泛应用,出现了如何保存以及传送大量数据的问题。为了解决这样的问题,91年确定了国际标准化机构所属的MPEG-1标准案;到了94年,在原MPEG-1标准案的基础上扩充确定了MPEG-2标准案。
该MPEG标准案中,作为音频编码方式标准案选定了在128Kbps中能够实现CD(Compact Disc)水准音质的MUSICAM(Masking-patternadapted Universal Subband Integrated Coding And Multiplexing)方式。
对上述MUSICAM方式的介绍如下利用听觉特性将音频分割为多个频率带域(子带),并且在每个子带中,根据其特征,利用可执行量化/编码处理的子带编码方式对音频进行编码处理,以此将各子带中的可感知杂音控制在最小化范围内,并且在96-128Kbps中实现与原音相同的恢复音;它被选定为MPEG的第1层以及第2层。
一方面,MPEG音频压缩方式,根据编码的应用目的,一般被分为MPEG-1以及MPEG-2;根据比特率,被分为第1层、第2层、第3层。
在这里,MPEG-1音频编码方式和MPEG-2音频编码方式的基本运算法则是相同的,但MPEG-1音频编码方式最多只能对两个声道(左、右)进行编码处理,因此声象定位(Sound Image Localization)不是很稳定,而且缺乏现场感。
MPEG-2音频编码方式中为了体现这种现场感,在左(L)、右(R)两个声道立体声信号的基础上还增加了中央声道(C)、环绕声道(LC,RS)以及低频特效(Low Frequency Effect),并且以SMPTE(Societyof Motion Picture and Television Engineers电影以及电视技术者协会)、ITU(International Telecommunication Union,国际电气通讯联合)劝告文中由3/2+1构成的5.1声道编码运算法则进行了标准化。
图1是符合普通MPEG标准的层次第1、2层编码装置基本构成图。
参照图1,一般的编码装置包括以下几个部件子带滤波器组100,用48kHz/16比特进行数字化的768Kbps/ch数字音频信号被分割为32个子带;比例系数检测装置101,从上述子带滤波器组100输出并分割为32个子带的数字音频信号中,检测出各子带的比例系数;FFT(FastFourier Transform)装置102,对768kbps/ch数字音频信号进行傅里叶变换处理,并输出其频谱;信掩比计算装置103,通过上述FFT装置102输出的频谱和上述比例系数检测装置101检测出来的比例系数之间的比较选择各子带的最大频谱,然后利用与上述最大频谱相对应的信号电源(signal power)和遮蔽阀值(masking threshold)计算信掩比(SMRSignal-to-Masking Ratio,以下简称SMR);比特分配装置104,利用上述心理音响学模型中计算出来的信掩比和信噪比(SNRSignal-to-Noise Ratio,以下简称为SNR)计算噪音遮盖比(NMRNoise-to-Masking Ratio,以下简称为NMR),然后根据计算出来的噪音遮盖比进行比特分配;量化装置105,根据上述比特分配装置分配的比特值对上述子带滤波器组100输出的数字音频信号进行量化处理;比特列生成装置106,在上述量化装置105中已量化的数字音频信号中,生成包括附加信息的帧。在这里,上述FFT装置和信掩比计算装置适用于心理音响学模型。而且,这里的附加信息中包括最后恢复已量化/压缩数字音频信号时所需的比例系数索引信息和比特分配信息等。
更详细地讲,为了除去统计学重复性,利用32个WOLA(WeightedOverlap Add(加权叠加))方式的等间距滤波器组100将输入的数字音频信号转换成子带样品,并在使用高速傅里叶变换的心理音响学(Psychoacoustic)模型中除去知觉冗余,然后求得遮蔽阀值,并提供适用于量化处理过程的比特分配信息。
另外,MPEG的第1、2层中使用32个相同大小的WOLA方式单一子带滤波器组100,用于子带分析的滤波器以512-tap低通滤波器为标准;由于行列演算,发生频率迁移,而且被分割为32个相同大小的子带。
由MPEG提供的心理音响学模型将FFT频谱划分为纯音(Tonal)成分和杂音(Non-tonal)成分,并在考虑到绝对遮蔽限度(AbsoluteMasking Threshold)因素的前提下,计算每个成分的遮蔽阀值。MPEG第2层中,正如前面所讲述的,利用心理音响学模型计算遮蔽阀值,并在需要较低压缩率时使用。
一般地,心理音响学模型中计算出来的SMR是作为心理音响学模型结果的遮蔽阀值(Masking Threshold)和从FFT频谱以及比例系数中计算出来的信号电源之间的比值;如果用分贝(dB)表示时,就可以表示为以下数学式1。
SMR(dB)=信号电源(dB)-遮蔽阀值(dB)在这里,按每个子带、每个帧求得32个SMR。SMR的物理意义是,按每一个子带,信号电源值比遮蔽阀值相对大的程度。
这里的遮蔽阀值,正如前面所讲述的,将FFT频谱划分为纯音(Tonal)成分和杂音(Non-tonal)成分,并在考虑到绝对遮蔽限度(Absolute Masking Threshold)因素的前提下,计算出来的每个成分遮蔽阀值。这时,绝对遮蔽限度,是与输入的数字音频信号频谱无关的、通过正常听觉就能听到的频率带域最低限度大小的显示曲线;是在求得心理音响学模型最终遮蔽阀值的过程中反映到的值。
图2是根据图1中的特定帧显0各子带SMR曲线的示意图。
正如图2所示,SMR不但在子带1和子带17之间带有0dB以上的正值,而且还在子带18和子带32之间带有0dB以下的负值。这时,带有0dB以下负值的子带区间(例如,子带18和子带32之间),所有信号都处于遮蔽状态,这表明无须再进行比特分配。因此只对带有0dB以上正值的子带区间(例如,子带1和子带17之间)进行比特分配。
一方面,为了检测出将每个子带样品值正规化(normalization)处理的比例系数,首先在12个样品的正规化绝对值中找出最大值。然后将该最大值和MPEG中的64个比例系数进行比较;根据比较结果,将只小于正规化最大值的比例系数定义为该帧的比例系数。
上述比特分配装置,在32个被分割的子带中,先给NMR计算值最大的子带分配1比特;接着重新计算各子带的NMR,并又给NMR值最大的子带分配1比特;上述过程的反复进行次数与一个帧中分配到的总比特数相同。
在上述比特分配过程中使用的NMR,利用SNR和SMR可显示为以下数学式2。
NMR(dB)=SMR(dB)-SNR(dB)在这里,SNR是量化过程中发生的量化杂音和源信号电源值之间的比值。
上述NMR的物理意义是,相关子带的量化杂音比遮蔽最小值相对大。这就是说,NMR越大要除去的杂音就越多。
因此,比特分配时,NMR越大的子带需要分配的比特就越多。通常每分配1比特,SNR就会提高6dB。这么看来,所谓比特分配就是,按子带分配适当的比特,将NMR值都转化为负数,以使量化杂音小于遮蔽阀值的处理过程。
如果是这样,正常人的听觉是无法听到编码过程中产生的杂音,因此可以在没有音质损失的前提下进行压缩。
数学式2中,SMR是根据信号电源值和遮蔽阀值计算出来的固定值,总的来说SNR在该数学式中起到关键作用。
图3为根据图1中的比特分配显示NMR曲线变化的示意图。
一般来说,比特分配前处于所有子带上分配0比特的状态,因此所有信号都有杂音;这时的SNR是0dB。就是说,初期的NMR与SMR相同(a)。
(a)曲线显示的是,比特分配前所有信号都有杂音,而且SNR=0dB、NMR=SMR。正如(a)曲线显示,子带以0dB为标准划分为具有正值的子带区间(子带1和子带17之间)和具有负值的子带区间(子带18和子带32之间)。在这种状况下,正如前面所讲述的,0dB以下带有负值的子带区间是已遮蔽的、无须在比特分配的区间,只对0dB以上带有正值的子带区间进行比特分配,将NMR调整为0dB以下。
如图3所示,以(a)曲线为基础,通过适当的比特分配,所有子带区间中都会调整为0dB以下(b)(c)。这时使用的比特分配过程正如前面讲述内容。
比特率刚好是适合于现在信号编码的比特数时(b),紧接着0dB形成NMR值;但,比特率充分高时(c),直到剩余比特全部被分配为止,NMR值持续性降低,因此NMR值就会分布在低于0dB较多的位置。
在这里,如(c)曲线一样比特率较高时,作为心理音响学模型结果的SMR其准确性没有多大意义。就是说,比特率充分高时,即使SMR上存在一定程度的误差,人的正常听觉是无法听到比特分配时的量化杂音。
但是,现有的数字音频编码装置根本没有考虑到这种状况,只是无条件地通过心理音响学模型求得遮蔽阀值,并根据求得的遮蔽阀值计算SMR。而且,以上述SMR为基础计算NMR,再通过反复循环过程对NMR进行比特分配。因此,现有数字音频编码装置在心理音响学模型的SMR计算过程中,需要很多类似指数或者对数等的超越函数演算;而且比特分配过程一直反复持续到完成噪音整形(noise shaping)为止,因此还是需要相当大的演算量。特别是,比特率高时,消耗更多的执行时间。
为了有助于理解,下面举例说明。如果解码装置的演算量在体现立体声时,大约需要10-20MIPS(Million Instructions Per Second(每秒百万条指令)),而现有编码装置在体现广泛型DSP(DigitalSignal Processing数字信号处理)时,需要80MIPS的演算量。而且,上述现有编码装置的演算量中70%来自心理音响学模型和比特分配演算中。

发明内容
本发明的目的就是要解决上述种种问题;通过本发明提供的数字音频编码方法以及装置,在省略心理音响学模型的同时利用全新方式进行比特分配,从而可以进行高速演算。
为了达到上述目的,本发明提供的的数字音频编码方法包括以下几个阶段阶段一,将数字音频信号分割为多数个子带;阶段二,从上述已分割数字音频信号检测出各子带的比例系数;阶段三,利用上述被检测出的比例系数和绝对遮蔽阀值计算各子带的信掩比;阶段四,利用上述计算出来的信掩比,按子带进行比特分配;阶段五,根据上述已分配比特值,按上述子带将已分割的数字音频信号进行量化处理;阶段六,上述已量化数字音频信号中生成包含附加信息的帧比特列。
上述数字音频编码方法还包括以下两个阶段1阶段,按子带分配的比特总合与上述多数个子带形成的帧容许的总比特值减去所定比特值的差值做比较;2阶段,按子带分配的比特总合与上述帧容许的总比特值减去所定比特值的差值不一致时,将上述已经按子带分配过的比特重新进行分配。
另外,上述数字音频编码方法还包括以下阶段在按子带计算出来的信掩比中选定存在于所定子带区间内的信掩比,并进行一定程度的增幅处理。
根据本发明的数字音频编码装置由以下几个部件组成将数字音频信号分割为多个子带的装置;从上述已分割数字音频信号检测出各子带比例系数的装置;利用上述被检测出的比例系数和绝对遮蔽阀值计算各子带信掩比的装置;利用上述计算出来的信掩比,按子带进行比特分配的装置;根据上述已分配比特值,按上述子带将已分割的数字音频信号进行量化处理的装置;上述已量化数字音频信号中生成包含附加信息的帧比特列的装置。
正如前面所讲述的,本项发明中的数字音频编码方法以及数字音频解码器并没有使用现有的心理音响学模型,而且直接利用比例系数和绝对遮蔽阀值计算SMR值;然后利用计算出来的SMR值,并根据简单的数学式进行比特分配;从而避免了如现有技术中由心理音响学模型和反复运算造成的演算量增加现象,而且大大减少了与之相关的硬件费用,并且还可以高速压缩数字音频信号。
举例说明,根据本项发明中的编码方法,广泛应用型DSP中大约10-20MIPS(立体声标准)(左、右)可以进行编码,这种演算量相当于普通的解码器水准的演算量,比起需要80MIPS左右的现有编码器相比有非常大的优越性。
因此,本项发明适合于PVR(Personal Video Recorder)等用高比特率进行保存的应用领域中,使得该领域中的施行时间大幅减少,而且大大节减了硬件费用。另外,本项发明还可以应用于要求低电力设计的携带式音频设备(例如,MP3等)或者需要大量演算量的多声道(3声道以上)音频设备中,只需要现有技术的30%左右的演算量就可以达到相应的要求。


图1为符合普通MPEG标准的层次第1、2层编码装置基本构成图。
图2为根据图1中的特定帧显示各子带SMR曲线的示意图。
图3为根据图1中的比特分配显示NMR曲线变化的示意图。
图4为通过本项发明实例显示数字音频编码装置构成的概略图。
图5为根据本项发明实例中的特定帧显示各子带SMR曲线的示意图。
图6为根据本项发明实例中的SMR,显示比特分配的示意图。
附图主要部分符号说明11子带滤波器组12比例系数检测装置13SMR计算装置 14比特分配装置15量化装置16比特列生成装置
具体实施例方式
下面参照附图,对本项发明中的数字音频编码方法和装置进行详细的说明。
图4是通过本项发明实例显示数字音频编码装置构成的概略图。
参照图4,本项发明中的数字音频编码装置包括以下几个部件子带滤波器组11,将数字音频信号分割为多数个子带;比例系数检测装置12,从上述子带滤波器组11分割的数字音频信号中,检测出各子带的比例系数;SMR计算装置13,利用上述比例系数检测装置12检测出来的比例系数和绝对遮蔽阀值计算出信掩比;比特分配装置14,利用上述SMR计算装置13计算出来的信掩比,按子带进行比特分配;量化装置15,根据上述比特分配装置14分配的比特值,对上述按子带分割的数字音频信号进行量化处理;比特列生成装置16,在上述量化装置15中已量化的数字音频信号中,生成包括附加信息的帧。在这里,上述附加信息中包括比例系数的索引信息和比特分配信息。
上述子带滤波器组11为了除去统计学重复性,利用32个WOLA(Weighted Overlap-Add)方式的等间隔滤波器组,将输入的数字音频信号分割为32个子带。
上述比例系数检测装置12为了检测出将每个子带样品值正规化(normalization)处理的比例系数,首先在12个样品的正规化绝对值中找出最大值。然后将该最大值和MPEG中的64个比例系数进行比较;根据比较结果,将只小于正规化最大值的比例系数定义为该帧的比例系数。这时检测出来的比例系数就定义为相应子带的信号电源值。
现有技术的应用中,比例系数和FFT频谱电源中选取大的定义为相应子带的信号电源值;不过,本项发明中无条件地将比例系数定义为相应子带的信号电源值。这是因为,正如前面所讲述的,作为心理音响学模型结果的FFT频谱电源值和比例系数做比较,然后根据比较结果取大值定义信号电源值,而通过该信号电源值计算出来的SMR与通过比例系数定义的信号电源值计算出来的SMR没有什么差异。
因此,本项发明中省略掉了需要复杂演算量的心理音响学模型,并且将上述比例系数检测装置检测出来的比例系数直接利用为信号电源值,以此计算SMR。
上述SMR计算装置13将比例系数检测装置检测出来的比例系数利用为信号电源值计算SMR。这时,SMR可以表示为以下数学式3。
SMR(dB)=比例系数(dB)-绝对遮蔽阀值(dB)在这里,正如前面所讲述的一样,比例系数是从上述比例系数检测装置求得的信号电源值。另外,绝对遮蔽阀值是实现通过实验计算出来的固定常数值,而且每个子带都有其固定常数。上述绝对遮蔽阀值表示的是与数字音频信号频谱无关、人的正常听觉能听到的频率区域最低限度大小,是通过实验计算出来的值。
因此,本项发明中不使用需要复杂演算量的心理音响学模型,只是利用计算简单的比例系数和作为常数的绝对遮蔽阀值计算SMR。
通过上述SMR计算装置13,按子带计算出来的SMR曲线如图5所示。
图5为根据本项发明实例中的特定帧显示各子带SMR曲线的示意图。在这里,(a)是利用现有心理音响学模型计算出来的SMR曲线,(b)是利用本项发明中的比例系数和绝对遮蔽阀值计算出来的SMR曲线。
正如图5所示,本项发明中的SMR曲线(b)比现有SMR曲线(a)低一定程度。虽然本项发明中的SMR曲线(b)比接近于真实值的现有SMR曲线(a)多少存在一些误差,但从整体上看还是比较相似。但是上述误差,比起复杂心理音响学模型的利用中浪费的时间,可以说是微不足道的。
一方面,比特分配装置14利用SMR计算装置计算出来的SMR,进行比特分配。
现有技术的应用中,比特分配次数与每一个帧中分配到的总比特数相当,因此出现演算量增加的问题;为了解决上述问题,本项发明中采用了新的比特分配方法。
首先按子带进行比特分配,可以表示为以下数学式4。
bitalloc(sb)=[(SMR(sb)-目标NMR)/6]但,(SMR(sb)-目标NMR)/6表现为6时,[a]是不小于a的最小正数。
在这里,用6除SMR值和目标NMR值之间差值的理由就是,每分配1比特,SNR就会向上6dB。因此,利用上述数学式6进行比特分配时,SNR的向上值与分配比特值乘上6的值相同,而且由此计算出来的NMR值会降低到负值。
这时,目标NMR是根据编码比特率固定的常数值,比特率越高NMR值会越小;最好是要比0dB小。
例如,子带1的SMR是20dB、子带2的SMR是27dB、目标NMR是-30dB时,根据数学式,子带1中分配[(20-(-30))/6]=[50/6]=[8.33]=9比特。另外,子带2中分配[(27-(-30))/6]=[57/6]=[9.33]=10比特。利用上述过程,按子带进行比特分配。
但是,正如前面所讲述的,并不是所有子带都要分配比特。就是说,具有0dB以下SMR的子带就无须进行比特分配。
值得注意的是,根据数学式4分配与各子带中的比特值总合可能会比包括所有子带的一个帧所容许的总比特值大或者小。这时,最好是比一个帧容许的总比特值略小的总合分配与每个子带中。另外,分配于各子带的比特值总合也可以与一个帧容许的总比特值一致。
上述这些内容可以表示为以下数学式5。
total-bits=按子带分配的比特值总合≤每个帧容许的总比特值-所定比特值上述比特分配装置14根据上述数学式4向每个子带分配子带,并将分配到各子带的比特总合与每帧容许的总比特值减去所定比特值的差值进行比较。
比较结果,按子带分配的比特总合与每帧容许的总比特值减去所定比特值的差值不一致时,重新分配每个子带中分配到的比特值。
就是说,按子带分配的比特值总合大于每帧容许的总比特值时,从每个子带的被分配比特值中减去超出的比特值。
相反,按子带分配的比特值总合小于每帧容许的总比特值时,向每个子带的被分配比特值中加上不足的比特值。
正如这样,按子带重新分配比特值的过程中,如果是比特值减法计算,就从最高的子带开始;如果是比特值加法计算,就从最低的子带开始。
图6为根据本项发明实例中的SMR,显示比特分配的示意图。
图6中(a)是本项发明中的SMR曲线、(b)是现有技术应用中的SMR曲线、(c)是以(a)为标准进行分配的比特值曲线、(d)是将(c)的比特分配适用到(a)SMR曲线时得到的最终NMR曲线、(e)是将(c)的比特分配适用到(b)SMR时显示的最终NMR曲线。
正如图6所示,将本项发明中的SMR曲线(a)按子带进行比特分配后(c),用上述被分配比特值求得NMR曲线(b);而且现有技术应用中的SMR曲线(b)中适用本项发明中的比特值(c),求得NMR曲线(e)。如图6所示,将本项发明中的比特分配适用到现有技术SMR曲线中时(e),(e)也显示所有值都在0dB以下的NMR曲线,因此本发明中的NMR曲线(d)是非常有效的。另外,(d)曲线和(e)曲线虽然相互有所不同,只要比特率高,而且差额比较充分,两者之间就不会存在任何问题。
在图6中我们能获悉,即使不利用心理音响学模型,也可以充分遮盖量化杂音,可以确保没有音质损伤的编码过程。
当每个子带分配到比特值后,上述量化装置15根据每个子带中被分配的比特值,对每个子带的被分配数字音频信号进行量化处理。
上述已量化数字音频信号在上述比特列生成装置16的作用下,被生成为包含有附加信息的帧比特列。
事实上,对多种音源的充分实验结果表明,本发明中的SMR值和现有SMR值之间的差异如图5所示,在子带10至子带20之间发生最大20dB左右的误差。
但是,只要对存在于发生误差的子带10至子带20之间并通过本项发明求得的SMR值,进行相应于误差值的增幅处理,上述误差问题就会简单解决。
因此,上述比特分配装置14中进行比特分配之前,可以增幅子带10至子带20之间的SMR值。
这种特定子带区间SMR值的增幅并不是必须要执行的,只是在有必要时执行即可。
权利要求
1.一种用于高速压缩已输入数字音频信号的数字音频编码方法,其特征在于包括以下几个阶段内容阶段一,将数字音频信号分割为多数个子带;阶段二,从上述已分割数字音频信号检测出各子带的比例系数;阶段三,利用上述被检测出的比例系数和绝对遮蔽阀值计算各子带的信掩比;阶段四,利用上述计算出来的信掩比,按子带进行比特分配;阶段五,根据上述已分配比特值,按上述子带将已分割的数字音频信号进行量化处理;阶段六,上述已量化数字音频信号中生成包含附加信息的帧比特列。
2.按照权利要求1所述的数字音频编码方法,其特征在于所述被分配的比特是按照以下数学式进行计算的,bitalloc(sb)=[(SMR(sb)-目标NMR)/6]但,(SMR(sb)-目标NMR)/6表现为6时,[a]是不小于a的最小正数;bitalloc是被分配的比特值;SMR是信掩比;目标NMR是根据编码比特率进行固定的常数值。
3.按照权利要求1所述的数字音频编码方法,其特征在于还包括1阶段,按子带分配的比特总合与上述多数个子带形成的帧容许的总比特值减去所定比特值的差值做比较;2阶段,按子带分配的比特总合与上述帧容许的总比特值减去所定比特值的差值不一致时,将上述已经按子带分配过的比特重新进行分配。
4.按照权利要求3所述的数字音频编码方法,其特征在于上述按子带分配的比特值总合超过上述每帧容许的总比特值时,从上述个子带中分配到的比特值中减去上述超出比特值部分。
5.按照权利要求3所述的数字音频编码方法,其特征在于上述按子带分配的比特值总合小于上述每帧容许的总比特值时,向上述个子带中分配到的比特值中加上上述不足比特值部分。
6.按照权利要求3所述的数字音频编码方法,其特征在于按子带重新分配比特值的过程中,如果是比特值减法计算,就从最高的子带开始;如果是比特值加法计算,就从最低的子带开始。
7.按照权利要求1所述的数字音频编码方法,其特征在于还包括以下阶段在按子带计算出来的信掩比中选定存在于所定子带区间内的信掩比,并进行一定程度的增幅处理。
8.按照权利要求7所述的数字音频编码方法,其特征在于上述子带区间是子带(10)至子带(20)之间。
9.一种数字音频编码器,其特征在于包括将数字音频信号分割为多数个子带的装置;从上述已分割数字音频信号检测出各子带比例系数的装置;利用上述被检测出的比例系数和绝对遮蔽阀值计算各子带信掩比的装置;利用上述计算出来的信掩比,按子带进行比特分配的装置;根据上述已分配比特值,按上述子带将已分割的数字音频信号进行量化处理的装置;及上述已量化数字音频信号中生成包含附加信息的帧比特列的装置。
10.按照权利要求9所述的数字音频编码器,其特征在于上述比特分配装置根据信掩比和目标噪音遮盖比之间的差值除去所定常数值的计算结果值进行比特分配。
11.按照权利要求9所述的数字音频编码器,其特征在于还包括以下两个装置装置1,按子带分配的比特总合与上述多数个子带形成的帧容许的总比特值减去所定比特值的差值做比较;装置2,按子带分配的比特总合与上述帧容许的总比特值减去所定比特值的差值不一致时,将上述已经按子带分配过的比特重新进行分配。
12.按照权利要求11所述的数字音频编码装置,其特征在于上述按子带分配的比特值总合超过上述每帧容许的总比特值时,从上述个子带中分配到的比特值中减去上述超出比特值部分。
13.按照权利要求11所述的数字音频编码装置,其特征在于上述按子带分配的比特值总合小于上述每帧容许的总比特值时,向上述个子带中分配到的比特值中加上上述不足比特值部分。
14.按照权利要求11所述的数字音频编码器,其特征在于按子带重新分配比特值的过程中,如果是比特值减法计算,就从最高的子带开始;如果是比特值加法计算,就从最低的子带开始。
15.按照权利要求9所述的数字音频编码器,其特征在于还包括在按子带计算出来的信掩比中选定存在于子带(10)至子带(20)区间的信掩比,并进行一定程度的增幅处理的装置。
全文摘要
本发明涉及可进行高速演算的数字音频编码方法及装置。本发明中的数字音频编码方法的工作原理如下利用从数字音频信号检测出来的比例系和作为常数的绝对遮蔽阀值计算信掩比SMR;根据SMR和目标NMR(Noise-to-Masking Ratio噪声遮蔽比率)的差值与所定常数值之间的除法计算值分配比特值;根据被分配的比特值,对数字音频信号进行量化处理,最终生成帧。通过本发明的应用,演算量得以大幅减少,不仅减少了硬件费用,而且还可以高速压缩数字音频信号。
文档编号H04S3/00GK1731694SQ200410053479
公开日2006年2月8日 申请日期2004年8月4日 优先权日2004年8月4日
发明者吴铉梧 申请人:上海乐金广电电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1