带宽扩展编码和解码方法以及装置的制造方法

文档序号:9525216阅读:451来源:国知局
带宽扩展编码和解码方法以及装置的制造方法
【技术领域】
[0001] 本发明设及数字音频编解码技术,更具体地说,设及一种带宽扩展编码和解码方 法W及装置。
【背景技术】
[0002] 传统的感觉音频编码技术值RA、AAC和MP3等)的立体声典型工作码率是96~ 128化PS,且在64化ps/立体声W下时编码质量存在明显的主观感觉失真。调频广播应用的 典型编码码率为48化PS~64化ps/立体声,运时传统感觉音频编码技术的主观声音质量已 不能满足调频广播要求。
[0003] 为此,提出了数字音频信号的带宽扩展度an抓i化hExtension,简称BWE)编码技 术。目前的带宽扩展编码技术有很多,性能也参差不齐。已经公开且用于国际标准中的带 宽扩展编码技术主要有如下两种编码算法:
[0004] 第一种带宽扩展编码技术是IS0/IEC14496-3MPEG-4中描述的频谱带复制 (SpectralBandwi化hReplication,简称SBR)编码。图1不出了SBR编码的具体原理 框图。SBR是频域处理的算法,其编码原理为:每帖信号通过64子带的正交镜像滤波器组 (Qua化atureMirrorFilter,简称QMF)获得64个均匀的子频带,每个子频带包含32个样 点,根据当前信号的瞬态特性划分一个合理的时频栅格,每个栅格计算一个能量信息并进 行huffman编码。该算法同时包括音调性检查并传输个别的单个正弦信号参数信息。图2 示出了SBR解码的具体原理框图。SBR解码原理为:经过核屯、解码器(AAC)输出的解码pcm 通过32子带的QMF获得32个均匀的子频带,每个子频带包含32个样点,根据SBR解复用 输出的控制参数进行高频生成,然后根据控制参数W及包络数据对高频进行调整,然后将 低频32子带QMF的输出W及经调整后高频子带QMF的输出一起进入到64带QMF合成,最 后输出全频带pcm音频信号。 阳00引 MPEGSBR编码技术的主要缺点是:(1)时频分割相对固定。对于48曲Z采样率,由 于使用64带QMF,则最大频率分辨率为37甜Z(24化z/64);每帖2048样点,则最大时间分 辨率约为1. 3ms(64/48000)。由于音频信号极其复杂,运种算法有时不能很好地满足信号 分析的精度要求。(2)SBR的高频细节产生是直接从低频部分拷贝获得或者通过对低频子 带简单滤波获得,在(极)低码率时,运种方法能够大大降低高频部分的编码码率,但是由 于每个声道的音频信号低频和高频只有很小概率下相似,因此SBR高频的细节恢复比较粗 糖,尽管应用了其他技术减少带来的失真,在整个高频部分的还原上仍然难W获得较高的 质量。因此当数字音频编码要求相对较高质量时,SBR的高频细节处理存在明显缺陷。
[0006] 第二种带宽扩展编码技术是在3GPPAMR-WB+编码方法中包含的一种简单的带宽 扩展技术。它是一种时域处理的算法,主要编码原理是:将输入信号分为同样带宽的低频和 高频两部分时域信号,低频(L巧部分通过LPC分析滤波处理得到低频信号的残差信号,然 后经过高频LPC合成滤波来模拟高频细节信号;然后通过与实际Sw(η)的实际高频信号比 较,得到高频包络(能量)的增益矢量(每子帖一个增益值),最后通过低频高频和低频连 接点的增益的一致性进一步修正增益矢量,然后编码此增益矢量。因此传输给解码端的包 括校正的增益矢量和高频LPC系数。AMR-WB+的高频解码过程基本是编码的反过程。
[0007] 3GPPAMR-WB+的带宽扩展编码技术存在W下问题:(1)在时域实现高频编码,无 法获得更高的频率分辨率,因为运种方法可W认为只有一个高频区域划分;(2)高频编码 的起始频带固定,只能是Fs/4,对于48化Z采样频率,高频编码的起始频点为12化Z ;(3)对 高频中的谐波信号无法准确恢复;(4)高频信号的包络还原不够准确。
[0008] 此外还有一些带宽扩展编码技术,时频变换单元采用传统的FFT,然后在频域上将 高频划分为几个区域,对每个区域的谱能量编码,因此每帖只能提供一个时间分辨率多个 频率分辨率。运种基于FFT的高频重建技术,频域分辨率高而时域分辨率太低,当输入快变 的音频信号时,高频重建的信号不能很好地跟踪原始音频信号的变化。
[0009] 数字音频编码中的强度立体声编码也可W认为是一种特殊的带宽扩展编码技术, 其原理是利用人耳听觉对高频部分的细节不敏感,因此对立体声或5. 1环绕声的各个声道 的高频部分进行下混为一个声道,并归一化后作为所有声道的高频细节信号,但是各个声 道的高频信号的包络(高频临界频带内的能量)都需要编码传输。

【发明内容】

[0010] 本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种带宽扩展编 码和解码方法W及装置,W改善数字音频信号高频部分的编码效率和高频部分信号的声音 质量。
[0011] 本发明解决其技术问题所采用的技术方案是:提出一种带宽扩展编码方法,包括 如下步骤:
[0012] S1、对输入的单声道音频信号进行自适应多分辨率滤波和自适应时频栅格构造, 获得最佳的时频栅格信息,具体包括:
[0013] S11、基于对输入单声道音频信号的瞬态性分析进行频率分辨率选择,对输入单声 道音频信号进行自适应多分辨滤波,获得最佳的时频滤波信号;
[0014] S12、对滤波输出的每个子带信号进行瞬态检测和定位,依据每个子带信号的瞬态 性分析并考虑设定的高频带编码码率W及人耳临界频带特性,进行频率方向和时间方向的 自适应栅格构造,获得当前码率下的最佳时频栅格;
[0015] S2、W所述最佳的时频栅格为单位,进行高频细节编码,具体包括:
[0016] S21、对步骤S11中滤波输出的每个子带信号进行复数线性预测分析滤波,得到各 子带的残差信号,求得预测系数,并依次完成所有高频子带残差信号与低频子带残差信号 的对应关系,输出子带残差拷贝参数;
[0017] S22、量化编码预测系数;
[0018] S3、W所述最佳的时频栅格为单位,对步骤S11中滤波输出的每个子带信号进行 高频包络赌编码;
[0019] S4、复用编码参数,输出带宽扩展编码码流,所述编码参数包括多分辨率滤波选择 参数、时频栅格参数、子带残差拷贝参数、预测系数和高频子带包络参数。
[0020] 根据本发明的一个实施例中,所述步骤S11进一步包括:
[0021] 对瞬态信号,选择粗的频率分辨率和高的时间分辨率来进行滤波;
[0022] 对稳态型号,选择细的频率分辨率和低的时间分辨率来进行滤波;
[0023] 对其它音频信号,自适应选择中间的频率分辨率和中间的时间分辨率来进行滤 波。
[0024] 根据本发明的一个实施例中,所述步骤S12中频率方向的自适应栅格构造进一步 包括:依据输入单声道音频信号中高频带部分的频率特性选择不同的栅格构造,具体为:
[0025] 对一般音频信号,频率栅格随高频带部分的频率升高逐步降低频率分辨率,使得 频率栅格与人耳临界频带一致;
[00%] 对高频带部分中包含音频信号,在考虑临界频带的前提下,与所述一般音频信号 的情况相比适当增加栅格的频率分辨率;
[0027] 所述步骤S12中时间方向的自适应栅格构造进一步包括:依据输入单声道音频信 号中一个或多个瞬态信号发生的位置W及每个子带信号的瞬态特性,在时间方向构造成多 个时域区间,每个区间代表一个栅格。
[0028] 根据本发明的一个实施例中,所述步骤S21中依次完成所有高频子带残差信号与 低频子带残差信号的对应关系,输出子带残差拷贝参数,进一步包括:
[0029] 分析每个高频子带的残差信号,从低频子带残差信号中选择最佳的一个低频子 带,并将W此得到的所有低频子带的子带号编码输出。
[0030] 根据本发明的一个实施例中,所述步骤S21中依次完成所有高频子带残差信号与 低频子带残差信号的对应关系,输出子带残差拷贝参数,进一步包括:
[0031] 对连续一组高频子带残差信号,从低频子带残差信号中选择最佳的一组连续的低 频子带,并将W此得到的多组低频子带的起始和终止子带号编码输出。
[0032] 根据本发明的一个实施例中,所述步骤S21进一步包括:
[0033] S211、对高频子带信号使用哈明窗进行重叠加窗处理;
[0034] S212、对重叠加窗处理后的高频子带信号进行线性预测滤波,得到高频子带残差 信号;
[0035]S213、在使得残差信号的均方误差最小的准则下,通过莱文森-杜宾算法求解预 测系数。
[0036] 本发明为解决其技术问题还提出一种带宽扩展解码方法,包括如下步骤:
[0037] S1、对输入的带宽扩展编码码流解复用,获得编码参数,所述编码参数包括多分辨 率滤波选择参数、时频
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1