数字音频编码器及解码方法

文档序号:7519559阅读:930来源:国知局
专利名称:数字音频编码器及解码方法
技术领域
本发明涉及一种数字音频的再生技术,是可将数字音频的高音有效的进行再生的数字音频编码器及解码方法。
(2)背景技术一般的,通称为数字MPEG(Moving picture Experts Group)的数字音频是高品质高性能立体声编码的国际标准化机构(ISO/IEC)的标准方式。
上述MPEG,经与闭路组合,可实现高效率的多媒体信息压缩,最近不断出现了数字TV(DTV),DVD,数字音乐广播(DABDigital AudioBroadcasting)及MP-3播放机等多样的应用产品。
MP3音频最近以广泛使用的MP3扩展的方式,意味着编成MPEG-1音频分层3的方式编的码。
MPEG音频的压缩原理是利用人的感觉特性,省略感度低的细小的信息,采用的是节减编码量的“感知编码”(Perceptual Coding)方法。
这里指的感知编码是利用声音的最小可听极限和特殊声音现象(因特殊声音的影响,而听不到别的音的隐蔽现象)的编码方法。
这时,上述所听极限是以频率(音的高低)而不同,隐蔽现象是随隐蔽的音(Masker)和被隐蔽而听不到的音(Maskee)的频率而各异。
尤其,将引起隐蔽效应的频率带宽称作(Critical Band)临界带,在这临界带内的可感知信号带杂音比(S/N)是很低的。
在MPEG上则利用上述性质,随着数字化所产生的量化杂音混合于临界带内,使得其听不见量化杂音。
下面参照补充的数字音频的播放技术的附图作说明。
图1为标准的一般性数字音频编码器构造的框图,正像图上所示,由将音频信号细分为32个子频带的滤波器组1;和将上述滤波器组分区成更细致的频带的缓和不连续余弦变换器MDCT(Modified Discrete Cosine Transform2和将上述音频信号变换成频率领域的频谱的快速傅立叶变换器FFT(Fastfourier Transform)3;和利用从上述FFT器3输出的频谱产生隐蔽曲线的心理音响器(psycho Acoustic)4;和输入上述MDCT器2上输出的DCT系数和心理音响器4上输出的隐蔽曲线,通过内部环路5b及外部环路5a进行量化运算的量化部5c的量化器5;和在上述量化运算时使用过的输出附加信息的附加信息输出器6;和将上述各个子频带上量化的信号进行编码输出的霍夫曼编码器7;和在上述附加信息和已进行霍夫曼编码的信号上附加副数据的误流检验位输出MPEG音频演播的编码音频输出器8构成。下面就针对这种结构装置的操作进行说明。
滤波器组1,按数字音频信号的输入,将其细分成32个子频带输出,FFT其3,则将上述音频信号变换成频率领域的频谱进行输出。
这时,心理音响器4则在原音和最小听觉极限的曲线上收集实际的原音,求出可感觉限度内的隐蔽曲线,上述MDCT器2便将上述滤波器组1中输出的子频带细分成更细致的频带。
此后,量化器5则调整各个子频带,即调节每个频带标度因数和量化级尺寸,将量化杂音编码为隐蔽曲线以下。
即,标度因数是由各个子频带的量化杂音程度来决定的,要调整各子频带的量化级的大小,使每个子频带经量化发生的量化杂音比隐蔽曲线的能级要小。
在此,上述量化级尺寸虽越调大压缩率越高,但量化杂音级变大,使能级尺寸变小的话,虽量化杂音级变小了但同时压缩率也变小。
在响度高,隐蔽起不了多大作用的部分,使量化级变小一点降低量化杂音,对隐蔽影响大的部分则让量化级大些。
尤其,在上述量化器5,为了在固定的比特流中使量化杂音变得最小,使用由外部环路5a和内部环路5b形成的两个循环路。
在此,上述外部环路5a,对在频率领域生成的杂音能级比隐蔽曲线大的频带,将让标度因数变大,使杂音能级调整低,内部环路5b,是因为霍夫曼编码数据的比特(bit rate)不稳定,所以,若比可用比特位数大时则起到加大量化步长并起到调整的作用。
这时若把量化级步长加大的话,因杂音也一起增多,所以再次重复外部环路5a循环的过程,直至满足它的值为止。
将经过上述重复过程得到的结果,在霍夫曼编码器7进行霍夫曼编码之后,将其在编码音频输出器8上与附加信息输出器6的附加信息叠加,得到MP3比特流。
但是,在上述MP3算法上使用的心理音量模型是以每个人的听觉的平均值为基准的,不能提供能满足所有人的还原音,尤其,15khZ以上的高音在心理音响模型里使用的绝对听觉极限大约是60dB以上,所以在大部分的音频信号难以还原,即使是在10~15Knz的频带也存在难以充分再现的问题。
(3)发明内容本发明是考虑上述问题而发明的,提供将数字音频的高音,经再现为小比特编码,提高解码音频的音质的音频编码器及解码方法。
为了达到上述目的,本发明包括将音频信号变换成频率领域频谱的快速傅立叶变换的FFT器;将利用由所述的FFT器输出的频谱,求出隐蔽临界值的心理音响器;根据所述的心理音响器的隐蔽临界值,选择具有长变换或短变换的频带样品的缓和不连续余弦变换的MDCT器;根据所述的心理音响器的隐蔽临界值,将所述的频带样品通过内部环路及外部环路完成量化运算的量化器;将接入所述的FFT器输出的频谱,在其频谱上输出线性预测系数的线性预测系数输出器;将输出所述的量化运算时使用过的附加信息的附加信息输出器;将所述的各子频带上量化的信号进行霍夫曼编码输出的霍夫曼编码器;和在所述的附加信息器及霍夫曼编码器的信号上附加利用线性预测系数屏蔽输出MPEG音频的编码音频输出器。
本发明的一种如上所述的数字音频编码器的解码方法,包括输入MP3比特流,将源头信息及附加信息解码的步骤;
如果在所述的MP3比特流上存在线性预测系数的话,将其线性预测系数还原成高频带音频信号的步骤;将标度因数及霍夫曼编码数据进行解码之后,将其解码数据进行逆量化的步骤;将分区频率带综合到子频带之后,将这一综合的子频带通过滤波器组求出MP3还原音的步骤;和将所述的MP3还原音与所述的高频带的音频信号叠加求出高音已再现的还原信号的步骤。
本发明的功效本发明是在MP3比特流的附加位信息上利用线性预测系数传送频谱屏蔽信号,在解码器上经再现高音部,就会提高MP3音频压缩还原音质的效果。
为进一步说明本发明的上述目的、结构特点和效果,以下将结合附图对本发明进行详细的描述。
(4)


图1为表示现有数字音频编码器构造的框图;图2为根据本发明的数字音频编码器构造的框图;图3为对本发明数字音频解码方法的操作流程图;图4为本发明中霍夫曼编码频率领域分区图。
(5)具体实施方式
下面就参照本发明的数字音频编码器及解码方法的作用和效果,并根据附图作详细说明图2为表示本发明数字音频编码器构造的框图,正如图中所示,由将音频信号细分为32个子频带的滤波器组1;和将音频信号变换频带频谱的FFT器3;和利用上述FFT器3输出的频谱求出隐蔽临界值的心理音响器4;和根据上述心理音响器4的隐蔽临界值,具有长变换(Long Transform)或短变换(Short Transform)的选择频带样品的MDCT器2;和根据上述心理音响器4的隐蔽临界值,将上述频带样品的通过内部环路5b及外部环路5a完成量化运算量化部5c的量化器5;和接入上述FFT器3输出的频谱,在其频谱里输出线性预测系数的线性预测系数输出器100;和输出在上述量化运算时使用过的附加信息的附加信息输出器6;和将在各个子频带上量化的信号进行霍夫曼编码输出的霍夫曼编码器7;和附加在上述附加信息及霍夫曼编码的信号上利用线性预测系数的屏蔽,输出MPEG音频的编码音频输出器8构成。
图为本发明数字音频解码方法的操作流程图,图上所示S1、S2一旦输出MP3比特流,解码源头信息和附加信息的步骤;S9~S11如果在MP3比特流里存在线性预测系数,将其线性预测系数还原成高频带音频信号的步骤;S3~S5将标度因数和霍夫曼数据解码之后,将解码的数据进行逆量化的步骤,霍夫曼数据是以包括取样频率,比特流,层次;S6、S7将分区频带综合到子频带之后,将其综合的子频带通过滤波器组求出MP3还原音的步骤;S8将上述MP3还原音与上述高频带的音频信号叠加起来求出再生为高音的还原信号的步骤。
下面将说明本发明的操作(同时结合图2)。
首先,滤波器组1,把音频信号细分32个子频带,而FFT器3,将音频信号变换为频带的频谱进行输出。
这时,心理音响器4是利用上述FFT器3输出的频谱求出隐蔽临界值,即,将从上述FFT器3输出的频谱,按各个临界带与隐蔽特性模型化了的扩展函数摺积Convolution之后,将其摺积值上加补偿值offset求出隐蔽临界值。
还有,MDCT器2是根据上述心理音响器4的隐蔽临界值,为了提高频率分辨度就用长变换或用短变换选择频带样品,将其附加在量化器5上。
由此,上述量化器5,输入从上述MDCT器2输出的576个频率领域样品,将其量化之后,将各子频带上量化的信号,在霍夫曼编码器7进行霍夫曼编码之后输出,而附加信息输出器6则输出在上述量化运算时使用过的附加信息。
这时,上述量化器5则根据两种限制条件,完成内部环路5b或外部环路5a。
上述内部环路5b则在帧内(为不使可用比特流超过)调整标度因数来调整比特流,但霍夫曼解码之后,如果超过设定比特流,调整标度因数来满足比特流。
上述外部环路5a则在各临界频带,将量化杂音变换成隐蔽临界值以下,使能够消除杂音。
这时,上述隐蔽临界值是高频带时,大约是60dB以上的值,所以不能在大部分音频信号中编码,即使是在10~15KHz带信号也难以充分的再现还原。
由此,本发明是为了只用少比特数进行高频带编码,使用的是线性预测系数,下面对此点说明一下。
首先上述FFT器3上输出的频谱,输入到线性预测系数输出器100在其频谱里输出线性预测系数,但是,除此之外,也可以在通过高频带滤波器的时间领域的音频信号中生成其线性预测系数少于4次也可取得充分的效果。
接着,编码音频输出器8,附加在上述附加信息及霍夫曼编码的信号上利用线性预测系数的屏蔽,输出MPEG音频。
在此,图4是表示霍夫曼编码频率领域的分区图,将频率领域分成3个部分,当高频领域时为置换成“0”值,在解码器上是只知道“0”值的个数,所以无法还原高频带的音频信号。
为了解码高频带的音频信号,利用上述线性预测系数,将频谱屏蔽模型化之后,将其值与杂音进行摺积的话,就可以还原已除去的频带音频信号。
更详细的,参照图3说明数字音频解码方法。
首先,一旦输入MP3比特流,就会对具有取样频率,比特流,层次等信息的霍夫曼信息及加附加信息进行解码S1、S2。
其次,如果在上述MP3比特流里存在线性预测系数的话,就将其线性预测系数还原成高频带的音频信号S9~S11。
即,将选性预测系数进行解码S9,将频谱屏蔽信号模型化之后,将上述频谱屏蔽信号与杂音进行摺积,还原高频带的音频信号S10、S11。
在此,上述高频带的音频信号,就为了防止帧之间的急剧的能级变化,要通过中介滤波器。
上述附加信息在已解码的音频信号中后,将包含在内部的标度因数及霍夫曼数据进行解码S3、S4,将其已解好码的数据进行逆量化S5,将分区频带综合成子频带S6之后,将其综合的子频带在滤波器组上通过之后求出MP3还原音S7。
此后,将上述MP3还原音与上述高频带音频信号叠加起来才能求出再生高音的还原信号S8。
当然,本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明权利要求书的范围内。
权利要求
1.一种数字音频编码器,其特征在于所述的编码器包括将音频信号变换成频率领域频谱的快速傅立叶变换的FFT器;将利用由所述的FFT器输出的频谱,求出隐蔽临界值的心理音响器;根据所述的心理音响器的隐蔽临界值,选择具有长变换或短变换的频带样品的缓和不连续余弦变换的MDCT器;根据所述的心理音响器的隐蔽临界值,将所述的频带样品通过内部环路及外部环路完成量化运算的量化器;将接入所述的FFT器输出的频谱,在其频谱上输出线性预测系数的线性预测系数输出器;将输出所述的量化运算时使用过的附加信息的附加信息输出器;将所述的各子频带上量化的信号进行霍夫曼编码输出的霍夫曼编码器;和在所述的附加信息器及霍夫曼编码器的信号上附加利用线性预测系数屏蔽输出MPEG音频的编码音频输出器。
2.如权利要求1所述的数字音频编码器,其特征在于所述的心理音响器则将在FFT器输出的频谱,将与按各临界带隐蔽特性模型化了的扩展函数摺积之后,将在其摺积值上加补偿值求出隐蔽临界值。
3.如权利要求1所述的数字音频编码器,其特征在于所述的内部环路则调整标度因数,使在演播器内部不超过可用比特流来调整比特流。
4.如权利要求1所述的数字音频编码器,其特征在于所述的外部环路在各临界带上,将量化杂音变形为隐蔽临界值以下。
5.如权利要求1所述的数字音频编码器,其特征在于所述的线性预测系数输出器则利用通过高频带滤波器的时间领域音频信号,输出线性预测系数。
6.一种数字音频编码器的解码方法,其特征在于所述的解码方法包括输入MP3比特流,将源头信息及附加信息解码的步骤;如果在所述的MP3比特流上存在线性预测系数的话,将其线性预测系数还原成高频带音频信号的步骤;将标度因数及霍夫曼编码数据进行解码之后,将其解码数据进行逆量化的步骤;将分区频率带综合到子频带之后,将这一综合的子频带通过滤波器组求出MP3还原音的步骤;和将所述的MP3还原音与所述的高频带的音频信号叠加求出高音已再现的还原信号的步骤。
7.如权利要求6所述的数字音频编码器,其特征在于所述的如果在所述的MP3比特流上存在线性预测系数的话,将其线性预测系数还原成高频带音频信号的步骤中完成将线性预测系数解码,将频谱屏蔽信号模型化的步骤;和将所述的频谱屏蔽信号与杂音进行摺积,还原成高频带音频信号的步骤。
8.如权利要求6、7所述的数字音频编码器,其特征在于所述的高频带音频信号,为防止帧之间急剧的能级的变化,要通过中介高频滤波器。
9.如权利要求6所述的数字音频编码器,其特征在于所述的霍夫曼编码数据是以包括取样频率,比特流,层次。
全文摘要
本发明涉及一种数字音频编码器及解码方法,包括将音频变换成频率区域频带频谱的FFT器;由频谱求出的隐蔽临界值的心理音响器;按隐蔽临界值具有选择长变换或短变换频带样品的MDCT器;将频带样品通过内部及外部环路完成量化运算的量化器;在频谱里输出线性预测系数的线性预测系数输出器;在量化运算时用的输出附加信息的附加信息输出器;在各子频带上将已量化的信号进行霍夫曼编码的霍夫曼编码器;在附加信息和霍夫曼编码的信号上附加线性预测系数的屏蔽输出MPEG音频的编码音频输出器。本发明在MP3比特流的附加信息上利用线性预测系数传送频谱屏蔽信号,在解码器上经再现高音部,提高MP3音频压缩还原音质的效果。
文档编号H03M7/30GK1485849SQ02137098
公开日2004年3月31日 申请日期2002年9月23日 优先权日2002年9月23日
发明者金基秀, 林洙日 申请人:上海乐金广电电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1