一种用于音频信号的矢量量化编解码方法及装置的制造方法_2

文档序号:8431781阅读:来源:国知局
[0030]矢量量化编码模块404用于从MDCT变换模块403接收声音信号的MDCT谱系数,对其进行冗余消除处理,并将冗余处理后的频谱进行矢量量化编码得到MDCT谱编码数据,输出到比特流复用模块。
[0031]下面转到图1。
[0032]图1为根据本发明实施例的矢量量化编码装置框图。
[0033]根据本发明实施例的矢量量化编码装置包括幅度调整模块101、矢量组织模块102和量化编码模块103。
[0034]幅度调整模块101根据心理声学模型对信号进行音频感知分析,并据此对MDCT谱进行幅度调整,得到幅度调整后的待量化的加权谱。利用心理声学模型对MDCT谱进行调整,可以有效控制量化误差的分布,提升重建音频的感知质量。
[0035]例如,幅度调整模块101可以根据频谱包络曲线对MDCT谱进行幅度调整,幅度调整模块101可以用多种方法得到包络曲线,比如以线谱对LSP参数表示的频谱包络曲线,用分段直线表示的频谱包络曲线,用样条曲线拟合的频谱包络曲线,用泰勒展式表示的频谱包络曲线。
[0036]下面以分段直线表示频谱包络曲线为例进行说明。比如以MDCT谱长度为512的块进行描述,将频率轴划分为数组{O, 7,16,23,33,39,46,55,65,79,93,110,130,156,186,232,278,360,512},首先计算两端O和512点幅值来表示整个频谱的情况,从46点将此线段分割为两个线段,分别计算3个点的幅值,并以两个线段近似表示频谱包络;以此类推,分别以下列顺序分割线段 46,186,16,33,65,93,130,278,7,23,39,55,79,110,156,232,360,最后得到18段折线表示整个频谱包络。为进一步压缩这些表示数据,可仅把两端的值以绝对值表示,中间值通过预测以差分方式表示。通过对这18段折线进行线性内插得到整个频谱的包络曲线,用于MDCT谱的幅度调整。
[0037]矢量组织模块102对经过幅度调整后的待量化的加权谱进行排列和划分,将其组织为若干个待量化矢量。
[0038]首先构造MDCT谱的时频平面,可以是帧内各块的MDCT谱或者是帧间的MDCT谱。根据信号类型判断的结果以及信号的音调性等信息对时频平面进行划分,并根据此划分将MDCT谱组织成多个待量化矢量。时频平面划分和待量化矢量组织可以分为下面几种方式:按时间方向的方式进行划分和组织,具体为对音调性较强的平稳信号可按时间方向进行划分和组织矢量;按频率方向的方式进行划分和组织,具体为对时域具有快变特性的信号可按频率方向进行划分和组织矢量;基于频率抽取的方式进行划分和组织,具体为对于具有谐波结构的平稳信号,则可通过频率抽取的方式进行矢量组织;按时频区域的方式进行划分和组织,具体为对比较复杂的音频信号,则可按时频区域组织矢量。优选地,可以按照使得编码增益最大的原则来从上述几种划分和矢量组织方法中选择一种或几种方式的组合来进行划分和矢量组织。
[0039]假设信号的频率系数长度为N,在时频平面上时间方向的分辨率为L,频率方向的分辨率为K,且K*L=N。当按照时间方向进行矢量划分时,保持频率方向的分辨率K不变,对时间进行划分;当按照频率方向进行矢量划分时,保持时间方向的分辨率L不变,对频率进行划分;当按照时频区域进行矢量划分时,其时间和频率方向划分的个数可任意,划分出的各个时频区域的大小和形状可以是相同的、规则的,也可以是不同的、不规则的;当按照频率抽取方式进行矢量划分时,以谐波为单位对MDCT谱进行抽取。
[0040]下面转到图2。
[0041]图2为根据本发明实施例的4种矢量划分的示意图。
[0042]图2图示了按照时间、频率、时频区域和频率抽取方式划分矢量的实施例。假设时频平面被划分为K*L=64*16形式,K=64,为频率方向的分辨率,L=16为时间方向的分辨率。假设矢量的维数为D=8,可以对该时频平面按照不同的方式组合和提取矢量,如图2-a、图2~h、图2_c和图2_d所不。
[0043]在图2-a中,矢量按照频率方向被划分为8*16个8维矢量。在图2_b中,矢量按照时间方向划分的结果,共有为64*2个8维矢量。在图2-c中,矢量按照时频区域组织矢量的结果,共有16*8个8维矢量。在图2-d中,假设一次谐波频率为8,对频率方向按照8为间隔进行频率抽取,得到8*16组数据,每组8条谱线,每组作为一个矢量,共有8*16个8维矢量;假设一次谐波频率为4,对频率方向按照4为间隔进行频率抽取,得到4*16组数据,每组16条谱线,每组再分为2个8维矢量,共有8*16个8维矢量;也可以按照二次谐波或N次谐波为间隔进行频率抽取,比如一次谐波频率为4时,对频率方向按照4*2为间隔进行频率抽取,得到8*16组数据,每组8条谱线,每组作为一个矢量,共有8*16个8维矢量。需要指出的是,按照上述方法或上述几种方法的组合进行划分和矢量组织时,矢量的维度是可以灵活变化的,对时频平面的不同区域可以组织成不同纬度的矢量,以提高编码效率。
[0044]为了提高编码效率,可以按照使得编码增益最大的原则来从上述几种划分和矢量组织方法中选择一种或几种方式的组合来进行划分和矢量组织。例如,当信号具有谐波结构时,假设一次谐波频率为8,可选择按频率方向划分、频率抽取两种方式的组合来进行矢量组织,将每个谐波位置的数据抽取出来,得到1*16组数据,每组8条谱线,每组分为2个4维矢量,共2*16个4维矢量;对其余位置的数据按照频率方向进行划分和组织,得到7*16组数据,每组8条谱线,每组作为I个8维矢量,共7*16个8维矢量。
[0045]下面回到图1。
[0046]量化编码模块103对得到的每一个待量化矢量进行量化编码,得到矢量量化编码数据,并输出到比特流复用模块。可以采样矢量量化方式对待量化矢量进行编码,也可以采用标量量化加熵编码的方式对对待量化矢量进行编码。比如,采用矢量量化方法,量化所用码书可以通过传统的LBG算法等来获得(Linde Y, Buzo A, and Gray R M.〃An algorithmfor vector quantizerdesign〃[J].IEEE Trans, on Communicat1n, 1980, 28(1):84-95.);也可以是构造出的某种结构化码书,比如格型矢量量化(lattice vectorquantizat1n)技术(F.Chen, Z.Gao, and J.Villasenor, ^Lattice vectorquantizat1n of generalizedGaussian sources", IEEE Trans.1nform.Theory, vol.43, n0.1, pp.92-1031997.A.D.Subramaniam and B.D.Rao, 〃PDF optimized parametric vector quantizat1n ofspeech linespectral frequencies", IEEE Trans.Speech Aud1 Process., vol.11, n0.2,PP.130-1422003)。首先将全部待量化矢量划分为不同的分区,每个分区都有一个分类号,用来指明使用哪个矢量量化码书来进行量化,然后使用该量化码书对分区中的每一个矢量进行矢量量化,得到该矢量的码字序号,并对序号进行编码。分类号也需要进行量化编码,可以采用标量量化或矢量量化。频谱矢量量化编码数据包含码字序号、分类号的编码数据。采用标量量化加熵编码的方法时,可先对待量化数据进行标量量化,然后采用霍夫曼编码进行熵编码(IS0/IEC14496-3 (Aud1),Advanced Aud1 Coding (AAC))。
[0047]下面回到图4。
[0048]在进行矢量量化编码后,得到MDCT谱编码数据被输出到比特流复用模块405。
[0049]比特流复用模块405用于将从信号类型判断模块、矢量量化编码模块输出的编码数据以及边信息进行复用,形成声音编码码流。
[0050]图5为根据本发明实施例的单声道音频矢量量化解码装置的结构框图。
[0051]如图5所示,根据本发明的优选实施例的单声道声音解码装置包括:比特流解复用模块501、矢量量化解码模块502、IMDCT变换模块503和重采样模块504。
[0052]下面,概括介绍图5所示各模块之间的连接关系和及其各自的功能。
[0053]比特流解复用模块501,用于对接收的声音编码码流进行解复用,得到相应数据帧的编码数据和边信息,向矢量量化解码模块502输出相应的编码数据和边信息,向MDCT变换模块503输出相应的边信息。
[0054]矢量量化解码模块502用于对该帧矢量量化编码数据解码,并根据冗余处理边信息对解码数据进行冗余逆处理,获取MDCT域的频谱解码数据并输出到MDCT变换模块。
[0055]下面转到图3,图3为根据本发明实施例的矢量量化解码装置的框图。
[0056]如图3所示,矢量量化解码模块包括量化解码模块301、矢量重构模块302、频谱重构模块303。
[0057]量化解码模块301从比特流解复用模块接收信号类型分析信息、频谱矢量量化编码数据。根据解码得分类号确定解码所用的矢量量化码书,根据该码书和解码得到的码字序号得到反量化的矢量。矢量重构模块302依据解码的矢量划分信息,对反量化的矢量进行矢量重构得到反量化的加权谱。频谱重构模块303依据解码后的包络曲线对反量
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1