一种用于音频信号的矢量量化编解码方法及装置的制造方法_3

文档序号:8431781阅读:来源:国知局
化的加权谱进行幅度调整,得到重构的频谱。
[0058]下面回到图5。
[0059]IMDCT变换模块503用于将MDCT域的频谱进行MDCT变换。MDCT变换根据信号类型边信息采用不同长度阶数的頂DCT变换,并进行时域混叠消除处理,获取该帧的重建时域信号。
[0060]重采样模块504用于将MDCT模块503输出的该帧时域信号的采样频率变换到适合声音回放的采样频率,应注意,如果MDCT模块503输出的信号的采样频率适于声音回放,则本发明的声音解码装置中可以不包括该模块。
[0061]图6为根据本发明实施例的单声道频带扩展音频矢量量化编码装置的结构框图。
[0062]如图6所示,本发明优选实施例的单声道频带扩展音频矢量量化编码装置包括:重采样模块601,信号类型判断模块602、MDCT变换模块603、低频矢量量化编码模块604、MDCT至MDFT转换模块605、高频参数编码模块606,以及比特流复用模块607。应当指出,虽然本实施例以MDCT为例进行说明,但该装置和方法也适用于其他类型数据的编码,比如MDFT 域、FFT 域、QMF 域等。
[0063]重采样模块601用于将输入的数字声音信号从原始采样率变换到目标采样率,并将重采样后的信号以帧为单位输出到信号类型判断模块、MDCT变换模块。应注意,如果所输入的数字声音信号本身就具有目标采样率,则根据本发明原理的编码装置可以不包括该模块。
[0064]信号类型判断模块602用于对重采样后的声音信号逐帧进行信号类型分析,并输出信号类型分析的结果。由于信号本身的复杂性,信号类型可以采用多种表示形式。例如,若该帧信号是缓变信号,则直接输出表示该帧信号是缓变信号的标识;若是快变信号,则需继续计算快变点发生的位置,并输出表示该帧信号是快变信号的标识和快变点发生的位置。
[0065]MDCT变换模块603用于根据从信号类型判断模块602输出的信号类型分析结果,采用不同长度阶数的MDCT变换,将重采样后的声音信号映射到MDCT变换域,并将声音信号的MDCT域系数输出到低频矢量量化编码模块604,MDCT至MDFT转换模块605。具体地,若该帧信号是缓变信号,则以帧为单位做MDCT变换,选择较长阶数的MDCT变换;若是快变信号,则将该帧信号划分为子帧,以子帧为单位做MDCT变换,选择较短阶数的MDCT变换。
[0066]低频矢量量化编码模块604用于从MDCT变换模块603接收声音信号的MDCT谱系数的低频部分,对其进行冗余消除处理,并将冗余处理后的低频谱进行矢量量化编码得到低频编码数据,输出到比特流复用模块。
[0067]MDCT至MDFT转换模块605用于从MDCT变换模块603接收声音信号的MDCT域系数,将MDCT域系数转换为包含有相位信息的MDFT域系数,并将该MDFT域系数输出到高频参数编码模块606。
[0068]高频参数编码模块606用于从MDCT至MDFT转换模块605接收MDFT域系数,从中提取所需要的诸如增益参数、调性参数之类的高频参数,并对高频参数进行量化编码并输出到比特流复用模块607。
[0069]比特流复用模块607用于将从信号类型判断模块、低频矢量量化编码模块和高频参数编码模块输出的编码数据以及边信息进行复用,形成声音编码码流。
[0070]低频矢量量化编码模块604包括幅度调整模块、矢量组织模块和量化编码模块,如图1所示。
[0071]幅度调整模块根据心理声学模型对信号进行音频感知分析,并据此对MDCT低频谱进行幅度调整,得到幅度调整后的待量化的低频加权谱。利用心理声学模型对低频谱进行调整,可以有效控制量化误差的分布,提升重建音频的感知质量。
[0072]幅度调整模块根据频谱包络曲线对MDCT谱进行幅度调整,包络曲线可以用多种方法得到,比如以线谱对LSP参数表示的频谱包络曲线,用分段直线表示的频谱包络曲线,用样条曲线拟合的频谱包络曲线,用泰勒展式表示的频谱包络曲线。
[0073]下面以分段直线表示频谱包络曲线为例进行说明。比如以MDCT谱长度为512的块进行描述,将频率轴划分为数组{O, 7,16,23,33,39,46,55,65,79,93,110,130,156,186,232,278,360,512},首先计算两端O和512点幅值来表示整个频谱的情况,从46点将此线段分割为两个线段,分别计算3个点的幅值,并以两个线段近似表示频谱包络;以此类推,分别以下列顺序分割线段 46,186,16,33,65,93,130,278,7,23,39,55,79,110,156,232,360,最后得到18段折线表示整个频谱包络。为进一步压缩这些表示数据,可仅把两端的值以绝对值表示,中间值通过预测以差分方式表示。通过对这18段折线进行线性内插得到整个频谱的包络曲线,用于MDCT谱的幅度调整。
[0074]矢量组织模块对经过幅度调整后的待量化的低频加权谱进行排列和划分,将其组织为若干个待量化矢量。
[0075]首先构造MDCT谱的时频平面,可以是帧内各块的MDCT谱或者是帧间的MDCT谱。根据信号类型判断的结果以及信号的音调性等信息对时频平面进行划分,并根据此划分将MDCT谱组织成多个待量化矢量。时频平面划分和待量化矢量组织可以分为下面几种方式:按时间方向的方式进行划分和组织,具体为对音调性较强的平稳信号可按时间方向进行均匀划分和组织矢量;按频率方向的方式进行划分和组织,具体为对时域具有快变特性的信号可按频率方向进行划分和组织矢量;基于频率抽取的方式进行划分和组织,具体为对于具有谐波结构的平稳信号,则可通过频率抽取的方式进行矢量组织;按时频区域的方式进行划分和组织,具体为对比较复杂的音频信号,则可按时频区域组织矢量。优选地,可以按照使得编码增益最大的原则来从上述几种划分和矢量组织方法中选择一种或几种方式的组合来进行划分和矢量组织。
[0076]假设信号的频率系数长度为N,在时频平面上时间方向的分辨率为L,频率方向的分辨率为K,且K*L=N。当按照时间方向进行矢量划分时,保持频率方向的分辨率K不变,对时间进行划分;当按照频率方向进行矢量划分时,保持时间方向的分辨率L不变,对频率进行划分;当按照频率抽取方式进行矢量划分时,以谐波为单位对MDCT谱进行抽取;当按照时频区域进行矢量划分时,其时间和频率方向划分的个数可任意,划分出的各个时频区域的大小和形状可以是相同的、规则的,也可以是不同的、不规则的。图2图示了按照时间、频率、时频区域和频率抽取方式划分矢量的实施例。假设时频平面被划分为K*L=64*16形式,K=64,为频率方向的分辨率,L=16为时间方向的分辨率。假设矢量的维数为D=8,可以对该时频平面按照不同的方式组合和提取矢量,如图2-a、图2-b、图2-c和图2-d所示。在图2-a中,矢量按照频率方向被划分为8*16个8维矢量。在图2_b中,矢量按照时间方向划分的结果,共有为64*2个8维矢量。在图2-c中,矢量按照时频区域组织矢量的结果,共有16*8个8维矢量。在图2-d中,假设一次谐波频率为8,对频率方向按照8为间隔进行频率抽取,得到8*16组数据,每组8条谱线,每组作为一个矢量,共有8*16个8维矢量;假设一次谐波频率为4,对频率方向按照4为间隔进行频率抽取,得到4*16组数据,每组16条谱线,每组再分为2个8维矢量,共有8*16个8维矢量;也可以按照二次谐波或N次谐波为间隔进行频率抽取,比如一次谐波频率为4时,对频率方向按照4*2为间隔进行频率抽取,得到8*16组数据,每组8条谱线,每组作为一个矢量,共有8*16个8维矢量。需要指出的是,按照上述方法或上述几种方法的组合进行划分和矢量组织时,矢量的维度是可以灵活变化的,对时频平面的不同区域可以组织成不同纬度的矢量,以提高编码效率。
[0077]为了提高编码效率,可以按照使得编码增益最大的原则来从上述几种划分和矢量组织方法中选择一种或几种方式的组合来进行划分和矢量组织。例如,当信号具有谐波结构时,假设一次谐波频率为8,可选择按频率方向划分、频率抽取两种方式的组合来进行矢量组织,将每个谐波位置的数据抽取出来,得到1*16组数据,每组8条谱线,每组分为2个4维矢量,共2*16个4维矢量;对其余位置的数据按照频率方向进行划分和组织,得到7*16组数据,每组8条谱线,每组作为I个8维矢量,共7*16个8维矢量。
[0078]量化编码模块103对得到的每一个待量化矢量进行量化编码,得到矢量量化编码数据,并输出到比特流复用模块。可以采样矢量量化方式对待量化矢量进行编码,也可以采用标量量化加熵编码的方式对对待量化矢量进行编码。比如,采用矢量量化方法,量化所用码书可以通过传统的LBG算法等来获得;也可以是构造出的某种结构化码书,比如格型矢量量化(lattice vectorquantizat1n)技术。首先将全部待量化矢量划分为不同的分区,每个分区都有一个分类号,用来指明使用哪个矢量量化码书来进行量化,然后使用该量化码书对分区中的每一个矢量进行矢量量化,得到该矢量的码字序号,并对序号进行编码。分类号也需要进行量化编码,可以采用标量量化或矢量量化。频谱矢量量化编码数据包含码字序号、分类号的编码数据。采用标量量化加熵编码的方法时,可先对待量化数据进行标量量化,然后采用霍夫曼编码进行熵编码。
[0079]图7为根据本发明实施例的单声道频带扩展音频矢量量化解码装置的结构框图。
[0080]如图7所示,根据本发明的优选实施例的单声道频带扩展声音解码装置包括:t匕特流解复用模块701、低
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1