带宽扩展中激励信号的生成及信号重建方法和装置的制作方法

文档序号:2837540阅读:553来源:国知局
专利名称:带宽扩展中激励信号的生成及信号重建方法和装置的制作方法
技术领域
本发明涉及带宽扩展技术领域,具体涉及带宽扩展中激励信号的生成方法 和高频信号的重建方法以及相应的装置,本发明特别适用于超宽频带宽扩展。
背景技术
带宽扩展(BWE: BandWidth Extension)技术是一种通过选择适当的参数 模型,将频带范围较窄的信号扩展到频带范围更宽的技术,从而提高感知音频 信号的质量。-
通常在编码码率受限的条件下,例如移动和网络环境中,基于人耳对于低 频信号更敏锐这一听觉特性,为了取得较好的编码效果, 一般会将绝大多数可 用比特分配给低频信号,但由于高频成分对声音质量的主观印象仍然起到重要 作用,因此仍希望在解码端尽可能好的重建高频信号。下面对目前所使用的一 种从窄带语音(0 ~ 3.4kHz )扩展到宽带语音(0 ~ 7kHz )的方法(ITU-T, G.729.1 ) 进行介绍,其采用时域带宽扩展(TDBWE: Time Domain BandWidth Extension) 的方式,具体方案包括
一、编》马端
① 预处理
对输入的以16kHz采样率进行采样获得的高频信号进行频谱折叠,即, 将输入信号的高频部分的4 ~ 8kHz频—险折叠至0 ~ 4kHz部分,此过程等^T于 将高频部分的160个时域样点均乘以(-l)n。再将折叠后的信号通过3/4低通 滤波器,滤除其3~4kHz的频段,即对应于原频段中7~8kHz的部分,经过 预处理后的信号为S,(n), n = 0, ...,159。
② 时域i普包络参数的抽取
20ms的S,(n)帧被细分为16个长度为1.25ms的片断,每个片段包含10 采样点。对每IO个样点进行一次时域谱包络参数的计算,计算公式如下
Tenv(i)=4log2^;[S'(n + iX10)]4, i = 0, ...,15,
7共得到16个时域谱包络参数Tenv(i)。 ③频域谱包络参数的抽取
在G.729.1中,编码端只对20ms帧的后10ms子帧(80个样点)进行频 域参数的提取,由解码端通过插值得到前10ms子帧的频域参数。在计算频域 参数时,对S,(n)帧后10ms子帧的序列加128点的汉宁窗wF,该窗由144点 的上升汉宁窗的前72点和112点的下降汉宁窗的后56点构成,结合处在第 72个样点;该窗前看32个样点,后看16个样点,加上当前子帧的80个样点 共为128点。加窗后的信号为
Sw(n) = S,(n) . wF(n + 31), n = -31,…,96。
对Sw(n)采用快速傅立叶变换(FFT: Fast Fourier Transform)由时域变换 至频域,FFT变换的长度为64,得到S,n), n = 0,…,64。由于在预处理过程 中进行了3/4低通滤波,因此在变换至频域后,只有前面3/4的频镨数据是有 效的;并且由于FFT变换具有对称性,因此前面32个频域数据中只需要选取 前24个数据便足以表达0 ~ 3kHz的频段,根据前20个频域数据计算频域谱 包络参数为
其中WF(n)为加权函数,WF(0) = WF(2) = 0.5, WF(1)=1。 ④参数的量化
对16个T,(i)和12个Fenv(j)进行去均值分裂矢量量化。首先计算Tenv(i) 的平均植Mt,在对数域用5bit标量量化MT;分别计算Tenv(i)和Fenv(j)与量化
标量的残差;然后将16个时域残差分裂为2个8维矢量,使用同一码本分别 用7bit量化,将12个频域残差分裂为3个4维矢量,使用不同码本,前两个 4維矢量分别用5bit量化,最后一个4维矢量用4 bit量化。
二、解码端
①激励生成
带宽扩展的激励信号(Excitation Signal)由核心层解码参数重建得到。下 列核心层解码参数被用于生成带宽扩展的激励信号整数基音延迟T0、分数
Fenv(j)、log2 Z WF(n-2j)[Sffi(n)]2 , j = 0,…,11,基音延时frac;固定码本贡献的能量Ec、自适应码本贡献的能量Ep;核心层 中的基本层固定码本激励c(n)、 c(n)的增益gc,自适应码本激励v(n)、.v(n)的增 益gp;核心层中的增强层增强激励c,(n)、 c,(n)的增益genh。
通过估算清、浊音增益贡献计算每一帧自适应码本和固定码本(包括增强 层码本)激励的比率,然后由清浊音各自的激励乘以增益组成初步激励信号, 再对初步激励信号根据基音延迟等参数进行基音延时的后处理,获得最终的激 励信号exc(n)。exc(n)还需要通过3/4低通滤波器,将频率范围限制为0 3kHz。
② 参数的解码
从码流中解码出16个时域语包络参数T,(i)和12个频域镨包络参数 Fenv(j),解码过程是编码端的量化编码过程的逆过程。
③ 时域谱包络整形
时域整形主要是对激励信号的能量进行调整。按照编码端T,(i)的计算方 法计算激励信号exc(n)的时域谱包络参数,得到16个T,env(i),再由T,(i)分别 减去T,env(i)得出两者的能量差值,从而获得应调整的能量幅度gain:
gain = 2A [T,(i) - T,,(i)]; 然后由160个样点的激励信号exc(n)分别乘以对应的gain来恢复出时域调整后 的4言号ST(n)。
④ 频域谱包络整形
解码出的频域参数Fenv(j)表征了 20ms帧的后10ms,其前10ms帧的频域 参数可通过当前帧与前一个20ms帧的频域参凄史插值得到,将当前帧前后10ms
的频域参数分别记为Few(j)、 Fenv,2(j)。
然后与时域的处理方法类似,将ST(n)按照编码端的计算方法执行频域参
数抽取,每10ms抽取一次,计算得出两组频域参数,记为F,enw(j)、 F,env,2(j)。 由Fenv,!(j)、 Fenv,2(j)分别与F, — G)、 Fenv,2(X^差值得到两个子帧的调整幅度
G^(j)、 GF,2(j)。由于频域计算是分频段进行的,因此采用一个滤波器组对分别 与每个频域参数对应的信号频段的频谱包络分别进行调整,显然共有12个滤
波器,采用GF,i(i)、 GF,2(j)分别对滤波器组的系数进行加权,然后分别对前后
10ms子帧进行滤波,获得频域整形后的信号输出SHB(n)。SHB (n)二
BWE的后处理
由于时域和频域两重调整后,.可能会产生部分毛刺,因此采用自适应幅度
压缩函数来进行后处理以减小包络的偏离。后处理方法为每80个样点处理一 次,将其分为三段,前段6个样点,中段70个样点,最后4个样点,经过后
处理的包络调整后的输出为(每行依次为前段、中断和后段)
SHB(n) 若|SHB(n)|<Tenv(i) SHB(n)/2 若T,(i)《|SHB(n)| S 4Tenv(i), LSHB(n)/16若|Sra(n)|>4Tenv(i)
其中,T,(i)是与当前调整的样点对应的时域谱包络参数。
由于在编码端将4 ~ 8kHz的高频信号折叠至0 ~ 4kHz,因此在解码端还原 时,应再次进行频谱折叠。折叠方法与编码端的频谱折叠方式类似,由于重建 的输出信号为0 ~ 3kHz,因此可将3 ~ 4kHz的频域系数补0后进行折叠获得4 ~ 7kHz的高频重建信号。
在提出本发明的过程中,发明人发现,上述带宽扩展技术的解码端激励生 成采用类似语音生成模型中的二元激励产生方法产生,适合对语音信号编码, 而对类音乐信号的编码效果则较差;并且实-验证明在上述激励生成方式下,若 将该带宽扩展技术用于7 14kHz的超宽带扩展,噪声大,编码效果差,说明 该技术不适合应用到超宽带扩展中。

发明内容
本发明提供一种带宽扩展中激励信号的生成方法以及相应的高频信号的 重建方法和装置,适用于在宽带和超宽带扩展中对语音和音乐等音频信号进行 高频重建。
一种带宽扩展中激励信号的生成方法,包括生成频率范围为0 Bo的第 一激励信号exc(n), n = 0, ..., N-l;对exc(n)进行频镨折叠,生成频率范围为B。 ~ 2Bo的第二激励信号exc編(n);对exc(n)和exc脇(n)进行合成滤波,输出频率范 围为0 2Bo的第三激励信号excHB(m), m = 0,…,2N-l。
一种带宽扩展中高频信号的重建方法,包括按照前述激励信号的生成方 法生成激励信号excHB(m), m = 0,…,2N-1;解码获得时域谱包络参数丁,()和频域谱包络参数Fenv(j),其中i = 0,…,I-l、j = 0,…,J-l;按照Tenv(i)对eXCjffi(m)
的时域谱包络进行调整,每个Te肌(i)对应调整excHB(m)中包括A个时域样点的一 段,A《2N/1,生成时域调整后的信号ST(m);按照Fenv(j)对ST(m)的频域谱包络 进行调整,每个Fenv(j)对应调整sT(m)频域中带宽为B!的一个子带,Bi^B^J, B2为sT(m)的频带宽度,生成频域调整后的重建信号SF(m);对sF(m)进行频谱折 叠,生成频率范围为2Bo ~ 2Bo + B2的高频重建信号SHB(m)。
一种带宽扩展中激励信号的生成装置,包括核心解码模块,用于输出频 率范围为0 Bo的第一激励信号exc(n), n = 0,…,N-1;频谱折叠模块,用于对 exc(n)进行频谱折叠,输出频率范围为Bo 2B()的第二激励信号excf。w(n);合成 滤波模块,用于对exc(n)和exc,(n)进行合成滤波,输出频率范围为O ~ 2B。的 第三激励信号exc朋(m), m = 0,…,2N-l。
一种带宽扩展中高频信号的重建装置,包括激励信号生成单元,采用权 利要求15 ~ 17任意一项所述的激励信号的生成装置的逻辑结构,用于生成激励 信号exc朋(m), m = 0,…,2N-1;解码单元,用于解码输出时域谱包络参数T,(i) 和频域谱包络参数Fenv(j),其中1 = 0,…,I-l、 j = 0,…,J-1;时域整形单元,用 于按照T,(i)对excHB(m)的时域镨包络进行调整,每个Tenv(i)对应调整exc朋(m) 中包括A个时域样点的一I殳,A《2N/1,输出时域调整后的信号ST(m);频域整 形单元,用于按照F,(j)对ST(m)的频域谱包络进行调整,每个Fenv(j)对应调整 ST(m)频域中带宽为B!的一个子带,B,《B2/J, B2为sT(m)的频带宽度,输出频 域调整后的重建信号SF(m);频i普折叠单元,用于对输入的sF(m)进行频谱折叠, 生成频率范围为2B。 ~ 2B0 + B2的高频重建信号SHB(m)。
上述技术方案采用将窄带低频信号通过频谱折叠再合成的方式生成所需 要的高频激励信号;由于利用低频信号产生高频信号,基于信号低频和高频频 谱具有的调和特性,能够对语音和音乐信号都进行较好的扩展,所采用的频谱 折叠方式也保证了高低频在衔接处信号频谱的连续;实验证明,不仅适合对 4 7kHz频带信号进行带宽扩展,而且也适合对7 14kHz超宽带信号进行扩展。


图l是本发明实施例的激励信号的生成方法的步骤示意ii图2是本发明实施例的激励信号的生成装置的逻辑结构示意图; 图3是本发明实施例的高频信号的重建方法的步骤示意图; 图4是本发明实施例的高频信号的重建装置的逻辑结构示意图。
具体实施例方式
本发明实施例提供一种带宽扩展中激励信号的生成方法,将窄带低频信号 通过频语折叠再合成,生成所需要的高频激励信号。本发明实施例还提供相应 的带宽扩展中高频信号的重建方法,以及带宽扩展中激励信号的生成装置和高 频信号的重建装置。以下分别进行详细说明。
参考图l,本发明实施例的带宽扩展中激励信号的生成方法主要包括步骤 Al、生成频率范围为0 Bo的第一激励信号,该第一激励信号通常为一种 窄带激励信号。
本实施例中,作为第一激励信号的窄带激励信号exc(n), n = 0,…,N-l, 由解码核心层码流获得的参数重建得到。exc(n)可基于编码端的核心层编码方 式采用码本激励线性预测(CELP: Code Excited Linear Prediction)重建获得, 例如前述背景技术中的激励信号重建方式。
为简化处理过程,降低运算复杂度,本实施例中提供一种基于CELP的简 单有效的exc(n)生成方式,包括
根据编码端核心层的编码方式,固定码本激励可由基本层固定码本激励
C(n)和增强层增强激励C,(n)两部分组成,相应的增益分别为ge和genh。
②按照各自的增益加权迭加固定码本激励和自适应码本激励获得exc(n)。
在固定码本激励包括两部分的情况下,exc(n)的计算公式为 exc(n) = gp.v(n) + gc.c(n) + genh.c,(n) 其中,v(n)为自适应码本激励,gp为v(n)的增益。
通常exc(n)的频率范围为O ~ 4kHz, 一帧由时长为20ms的160个时域样点组 成,即Bo-4kHz, N= 160。
A2、对exc(n)进行频谙折叠,生成频率范围为Bo ~ 2B。的第二激励信号;对应于exc(n)窄带、低频的性质,该第二激励信号可视为窄带高频信号 exc脇(n)。 . 此过程等价于将exc(n)的N个时域样点均乘以(-l)n。
A3、对exc(n)和excf。w(n)进行合成滤波,输出频率范围为0 ~ 2B。的第三激 励信号,该第三激励信号即为带宽扩展的高频激励信号。
所称合成滤波是将exc(n)和exc,(n)的频谱进行合并,获得带宽扩展为0 ~ 2Bo的高频激励信号excHB(m), m = 0,…,2N-l。 一种可选的合成方式为
采用正交镜象滤波器(QMF: Quandrature Mirror Filter )对exc(n)和exc/。w(n) 进4亍正交镜Z象合成滤波。
此外,还可以根据实际应用的需要,进一步对频率范围为0 ~ 2B。的excHB(m) 进4亍j氐通、高通或带通滤波,输出部分频率范围的excHB(m)。基于目前的音频 信号编码对频率范围的要求, 一般对于宽带信号要求的频率范围为0 7kHz, 包括0 ~ 4kHz的低频部分和4 ~ 7kHz的高频部分;对于超宽带信号要求的频率 范围为0 ~ 14kHz,包括0 ~ 8kHz的低频部分和8 ~ 14kHz的高频部分,可见高频 部分编码的带宽通常为低频部分的3/4,因此这种情况下,还需要对基于低频 激励生成的高频激励进行进一步的处理,即
A4、对频率范围为0 2Bo的excHB(m)进行3/4低通滤波,输出频率范围为 0~ 3B(/2的excHB(m)。
该频率范围为0 ~ 3 B 0/2的高频激励信号即可用于重建频率范围为2Bo ~ 3.5B。的宽带或超宽带高频信号。
下面对用于执行上述激励信号生成方法的本发明实施例的带宽扩展中激 励信号的生成装置进行说明,参考图2,其基本逻辑结构包括
核心解码模块IOI,用于输出频率范围为0 B。的第一激励信号exc(n), n =0,…,N-1;该核心解码模块101可采用基于CELP的处理模块,输出的exc(n) 可分为两路,分别提供给频谱折叠模块102和合成滤波模块103;
频谱折叠才莫块102,用于对exc(n)进行频镨折叠,输出频率范围为Bo ~ 2B0 的第二激励信号excf,n);
合成滤波才莫块103,用于对exc(n)和exc目(n)进行合成滤波,输出频率范围为0 2Bo的第三激励信号excHB(m), m = 0,…,2N-l;该合成滤波4莫块103可采用正交镜像合成滤波器。 .
此外,基于前述生成方法中对激励信号频率范围要求的描述,本实施例的激励信号生成装置还可包括
3/4低通滤波器104,用于输入频率范围为0 2Bo的excHB(m),对其进4亍3/4低通滤波,输出频率范围为0 ~ 3B。/2的exc朋(m)。
为更好的理解上述实施例,下面以在超宽带带宽扩展中的一种应用为例,说明上述激励信号生成过程首先由基于CELP编码的核心层提取出0 4kHz的一帧激励信号exc(n)( 160个样点);然后通过频谱折叠的方式折叠到4 ~ 8kHz频段,生成4 8kHz频段的激励信号exc^d(n) (160个样点);然后经过QMF合成滤波器,将exc(n)与excf。'd(n)合成所需的全频段激励exc—(m) ( 320个样点),此时信号的带宽为O ~ 8kHz;再将全频段激励信号excq1m)通过3/4低通滤波器滤波,得到0 6kHz的激励信号excHB(m) ( MO个样点)。
上述激励信号生成方法与装置实施例中,采用将窄带低频信号通过频:潜折叠再合成的方式生成所需要的高频激励信号;由于利用低频信号产生高频信号,基于信号低频和高频频谱具有的调和特性,能够对语音和音乐信号都进行较好的扩展,解决了现有时域带宽扩展中采用的类似语音生成模型中的二元激励产生方法对于类音乐信号的编码效果比较差的问题。此外,所采用的频谱折叠方式也保证了高低频在衔接处信号频语的连续;实-验证明,上述激励信号生成方案不仅适合对4 7kHz频带信号进行带宽扩展,而且也适合对7 14kHz超宽带信号进行扩展。
下面对基于上述激励信号生成方法的本发明实施例的带宽扩展中高频信号的重建方法进行说明。参考图3,主要包括步骤Bl、生成高频激励信号。
高频激励信号excHB(m), m = 0,…,2N-1,的生成方法参照前述实施例,其带宽为B2, B广2B。或3Bq/2,通常使用后者。
B2、解码获得时域谱包络参数和频域i普包络参数。
按照与编码端的编码方式对应的解码方式从码流中解码出时域谱包络参数Tenv(i), i = 0, ...,I-l,和频域谱包络参数Fenv(j), j = 0,…,J-1,具体编解码方式本实施例不作限定。需要说明的是,此解码的步骤在整个重建过程中并无严格的逻辑顺序要求,可与其他步骤同步或顺序进行,并且不一定要求同时解码出Tenv(i)和F,(j),只要在重建过程中使用某参数之前已执行相应参数的解码即可。
B3、按照T,(i)对excHB(m)的时域谱包络进行调整,生成时域调整后的信号ST(m)。
时域谱包络调整过程相应于编码端时域谱包络参数的提取过程执行,每个Tenv(i)对应调整excHB(m)中包括A个时域样点的一段,A<2N/I,即,所调整的样点数目可以是2N个样点的全部或部分。每个T,(i)与所调整样点的对应关系和编码端提取过程中的对应关系相同。具体调整方式可采用例如前述背景技术中的时域谱包络调整方式等。
为提供更好的调整效果,本实施例中提供一种时域谱包络调整方式,包括
①按照编码端计算Tenv(i)的方式,计算eXCHB(m)的时域谱包络参数T,env(i)。所称编码端计算Tenv(i)的方式即编码端提取需要编码的高频信号Shb(m)的
T,(i)的过程。Shb(m)通常由编码端对需要编码的信号的高频部分进行预处理得到首先将采样后分频得到的高频信号折叠到低频段,然后按编码的频率范
围要求进行低通滤波。
一种T,env(i)的计算方式示例如下
将excHB(m)的2N个样点分为I段,每段A个样点,计算每段的对数域能量
通常可取IO个样点为一段,即A-IO,此时T,env(i)的数目为I = N/5。
② 根据Tenv(i)与T,e。v(i)之间的能量差值计算时域初步增益因子g"i)。
一种gT(i)的计算方式示例如下
gT(i) = 2八[Tenv(i) — T,env(i)],显然,每个gT(i)对应于eXCHB(m)中包括A个时域样点的一段,对应关系与T,env(i)
和excHB(m)中样点的对应关系相同。
③ 插值每个gT(i)获得A个增益因子。
可根据需要釆用各种插值方式将每个gT(i)扩展为A个增益因子gT,i(a), a =0,…,A-1,例如可简单的令每个gT,i(a)均等于gT(i)。为获得较好的时域调整效果,在A-10的情况下,本实施例中提供一种平滑插值算法来计算gT,i(a):
gT,i(a) = wT(a) gT(i) + [1 _ wT(a)] g' (a);其中,WT(a)为窗函数,g'asV,i(a)为上一帧excHB(m)对应样点的增益因子。wT(a)具体为
wT(a)
l门
—人1 — COS
2
(a + l)7
,a = 0,...,4
1 ,a = 5,…,9
上述插值算法可以理解为,对前5个gT,i(a)采用上一帧平滑插值得到的相应的g^T,i(a)进行平滑处理,对后5个gT,i(a)则采用gT(i)的值。
④根据gT,i(a)调整excHB(m)的A x I个样点的增益,获得sT(m)。
excHB(m)的时域语包络整形通过将接受调整的样点值与相应的增益因子g丁,i(a)通过简单相乘得到
ST(m) = g丁,i(a) exc朋(m)。
B4、按照F,(j)对ST(m)的频域谱包络进行调整,生成频域调整后的重建信号SF(m)。
与时域谱包络调整过程类似,频域谱包络调整过程同样相应于编码端频域语包络参数的提取过程执行,每个F,(j)对应调整ST(m)频域中带宽为B:的一个子带,B,《B2/J, B2为sT(m)也即excHB(m)的频带宽度。每个Fenv(j)与所调整频带的对应关系和编码端提取过程中的对应关系相同。具体调整方式可采用例如前述背景技术中的频域谱包络调整方式等。
为降低运算复杂度,提高调整效果,本实施例中提供一种频域谱包络调整方式,包括
按照编码端计算Fenv(j)的方式,对ST(m)进行时频变换生成频域信号SF乂m)并且计算SF乂m)的频域谱包络参数Fenv(j)。
所称编码端计算F,(j)的方式即编码端提取需要编码的高频信号Shb(m)的
F,G)的过程。 一种F,env(j)的计算方式示例如下
为ST(m)及上一帧ST加t(m)加窗WTDAc(k)获得加窗后的信号SW(k), k = 0,…,
164N-1,其中,
Sw(k) = wTDAC(k) . ST,last(k), k=0,…,2N隱l,Sw(k) = wTDAC(k) . ST(k-2N), k = 2N,…,4N画l;对SW(k)进行离散余弦变换(DCT: Diserete Cosine Transform)生成S"(m),具体变换方式可采用改进型离散余弦变换(MDCT: Modified DCT),
4N-1 卩
SF1(m)= Z Sw(k)cos[A(2k + l + 2N)(2m + l)];k=o 8N
抽取S"^(m)的前D x J个样点计算F,env(j),
F,,(D- 4log2{HsF1(d + jxD)]2}。
由于excHB(m)的生成过程中可能执行了限制频带范围的3/4低通滤波处理,这种情况下仅有0 3Bo/2频段的数据是有效的,因此,在进行时频变换后,只需抽取2N个频域样点的前3/2N个点用于计算F,,(j)即可,此时D x J = 3/2N。
通常可取16个样点作为一个子频带,即D-16,此时F,env(j)的数目为J-3N/32。此外,所使用的窗函数WTDAc(k)可选择如下正弦窗
wTDAC(k) = sin[(k + 0.5)7i/4N]。
② 根据FenvCJ)与F,,(j)之间的能量差值计算频域初步增益因子gF(j),每个
gF(j)对应于SF乂m)中包括D个频域样点的一段,D x J< 2N。一种gF(j)的计算方式示例如下
gF(i) = 2八[Fenv①- F,env(j)],
每个gF(i)和sW(m)子频带的对应关系与F,env(j)和SF乂m)子频带的对应关系相同。
③ 插值每个gF(j)获得D个增益因子gF/d), d = 0,…,D-1。
具体插值方法可参考前述时域增益因子的插值方法,当然也可以采用其他插值方法,不再赘述。
④ 根据gFj(d)调整SW(m)的D x J个样点的增益,生成调整后的频域信号SF2(m)。与时域i普包络的调整类似,将频域样点值与相应的增益因子gp,j(d)简单相乘即可
SF2(m) = gF,j(d) SF1(m)。
17⑤对S、m)进行所述时频变换的逆变换,获得sF(m)。 例如,若在频域调整前采用MDCT变换到频域,此时则采用逆MDCT (IMDCT)变换到时域。
B5、对SF(m)进行频谱折叠,生成频率范围为2Bo 2B() + B2的高频重建信 号SHB(m)。
由于在编码端是将高频信号折叠至低频段,因此在解码端还原时,应再次 进行频谱折叠。折叠方法与编码端进行高频信号预处理时的频镨折叠方式类 似。若在重建过程中,基于编码对频率范围的要求对激励信号进行了低通滤波, 此时可将滤波去掉的高频部分的频域系数补0后进行折叠获得最终的高频重 建信号。
进一步的,由于在上述信号重建过程中过了时域和频域两重调整,很可能 使重建信号出现毛刺,为了消除这些毛刺,可以在进行频谱折叠之前先对时频 调整后的信号SP(m)进行后处理,即,在步骤B5之前增加如下步骤
B51、使用包络调整阈值limit《i)、 limit2(i)对SF(m)进行包络调整。调整后 的SF(m)为
在n^r^ m2的部分中,若I SF'°ld(m) | 〈limit,(i),则SF(m) = SF,°ld(m), 在111 = 1112+1 m3的部分中,若limit!(i)《I SF,old(m) I《limit2(i),则SF(m)
=[SF,old(m) - limit"i)]/2 + limit"i),
在m-m3+l m4的部分中,若I SF'°ld(m) I 〉limit2(i),则SF(m) = [SF'°ld(m)
- limit2(i)]/16 + limit2(i),
其中,S,d(m)为包络调整前的SF(m); limi^(i)、 limit2(i)与SF(m)中时域样点的 对应关系,和T,(i)与SF(m)中时域样点的对应关系相同。
在上述后处理过程中, 一种较好的阈值limit"i)、 limit2(i)设置方式为 limit
(i)-2Ki), limit2(i) = [2ATenv(i)]x2.5。 此外,上述后处理过程可对每80个样点处理一次,将每80个样点分为三段, 前6个样点(nM m2的部分),中间70个样点(m2+l m3的部分),最后4个样 点(m3+l m4的部分)。举例-说明如下若N二160,则时频调整后的信号为320个样点,可分4次进行后处理;其中m广m2的部分为0 5、 80~85、 160- 165、 240~245的部分;m2+l ~ ni3的部分为6 ~ 75、 86 ~ 155、 166-235、 246-315 的部分;m3+l m4的部分为76 79、 156 ~ 159、 236-239、 316-319的部分。
下面对用于执行上述高频信号重建方法的本发明实施例的带宽扩展中高 频信号的重建装置进行说明,参考图4,其基本逻辑结构包括
激励信号生成单元201,采用前述实施例的激励信号的生成装置的逻辑结 构,用于生成激励信号excHB(m), m = 0,…,2N-l;
解码单元202,用于解码输出时域谱包络参数T,(i)和频域谱包络参数 F,(j),其中1 = 0,…,I-l、 j = 0,…,J-1;
时域整形单元203,用于按照解码单元202输出的Tenv(i)对激励信号生成单
元201输出的excHB(m)的时域谱包络进行调整,每个Tenv(i)对应调整excHB(m)中 包括A个时域样点的一段,A《2N/1,输出时域调整后的信号ST(m);
频域整形单元204,用于按照解码单元202输出的Fenv(j)对时域整形单元203 输出的ST(m)的频域谱包络进行调整,每个Fenv(j)对应调整sT(m)频域中带宽为 Bj的一个子带,B^B乂J, B2为ST(m)的频带宽度,输出频域调整后的重建信号 SF(m);
频谱折叠单元205,用于对输入的SF(m)进行频谱折叠,生成频率范围为 2B。 ~ 2Bo + B2的高频重建信号SHB(m)。
此外,基于前述重建方法中为消除信号毛刺使用的后处理过程,本实施例 的高频信号重建装置还可包括
后处理单元206,用于使用包络调整阈值limit"i)、 limit2(i)对频域整形单元 204输出的SF(m)进行包络调整,调整后的SF(m)为在m = m! ~ 1112的部分中, 若I SF'old(m) I 〈limit"i), U'JSF(m) = SF'old(m);在m = m2+l ~ ni3的部分中,若 limit"i)^ I SF,old(m) | <limit2(i), J^SF(m) = [SF'old(m) _ limit"i)]/2 + limit!(i);在 m = m3+l ~ m4的部分中,若| SF'°ld(m) | > limit2(i),则SF(m) = [SF'°ld(m) -limit2(i)]/16 + limit2(i);其中,sF,础(m)为包络调整前的SF(m); limit"i)、 limit2(i) 与SF(m)中时域样点的对应关系,和Tenv(i)与SF(m)中时域样点的对应关系相同; 将调整后的SF(m)输出给频i普折叠单元205 。
19上述高频信号重建方法与装置实施例中进一步提供的时域增益因子平滑 插值方法能够获得更好的时域调整效果;进一步提供的具体频域谱包络调整方 式避免了在解码端使用多项滤波器组分频段对信号滤波,简化了处理过程,降
低了运算复杂度;进一步提供的整形后处理方式能够更好的消除整形过程出现 的毛刺。
为更好的理解上述实施例,下面以在超宽带带宽扩展中的 一种应用为例, 说明上述高频信号重建过程
① 生成0 6kHz的高频激励信号excHB(m),时域每帧320个样点。即,2N =320, B0 = 4kHz, B2 = 3B(/2 = 6kHz。
② 从码流中解码获得32个时域谱包络参数Tenv(i), i = 0,…,31,每个对应
IO个时域样点,即1 = 32, A=10。
③ 将excHB(m)同样分为32个小段,每段10个样点,计算对应的T;v(i):
然后计算时域增益gT(i) = 2A [Tenv(i) _ T,env(i)],并用平滑插值算法插值每个 gT(i):
gT,i(a) = w丁(a) . gT(i) + [1 - w丁(a)] . glastT,i(a), a = 0,…,4。
gT,i(a) = gT(i), a = 5, ...,9。 其中,wT(a) = {0.066987298If, 0.2500000000f, 0.5000000000f, 0.7500000000f, 0.9330127019f}, a依次为0 4, f表示浮点数。然后计算出时域整形后的信号
ST(m) = g丁,i(a) exc朋(m)。
④ 从码流中解码获得15个频域谱包络参数Fenv(j), j = 0, 14,每个对应
0.4kHz带宽的子频带,即J-15。
⑤ 对ST(m)及上一帧S"ast(m)加正弦窗WTDAc(k),
wTDAC(k) = sin[(k + 0.5)7c/640], k = 0,…,639; 获得加窗后的信号SW(k),
Sw(k)-wTDAC(k) . ST,last(k), k = 0, ...,319, Sw(k) = wTDAC(k) . ST(k - 2N), k = 320,…,639;
20然后对加窗后的S,k)序列进行640点的MDCT,生成频域信号SF乂m),
639 ^
SF1(m) = S Sw (k)cos[^(2k +1 + 320)(2m +1)]; k=o 丄W(J
由于生成exc朋(m)的过程中进行了3/4低通滤波,滤除了6 ~ 8kHz的频段数据, 因此只有0 ~ 6kHz频段的数据是有效的,因此抽取sw(m)的前240个点用于计算 15个F,env(j),每16个点一组,即0=16,
F ,env(j) = ^ l。g2 <[ E [SF1 (d + j X 1 6)]2 }。
2 U=o J
然后计算频域增益gF(i) = 2A [Fenv(j) - F,env(j)],获得频域整形后的信号SF2(111)=
gF(i) . SF1(m)。再对S"(m)进行IMDCT得到sF(m)。
⑥ 对SF(m)的320个样点每80个样点处理一次,每次分为三段,前6个样点, 中间70个样点,最后4个样点,按照limit"i)^2ATenv(i), limit2(i) - [2ATenv(i)] x 2.5进行包络调整。
⑦ 然后对包络调整后的0 ~ 6kHz的信号进行频谱折叠,获得8 ~ 14kHz的高 频重建信号SHB(m)。
将SHB(m)与核心码流解码得到的低频信号(0 ~ 8kHz )合并(例如通过QMF 合成)即可得到完整的超宽带重建信号(0 14kHz)。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步 骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读 存储介质中,存储介质可以包括ROM、 RAM、磁盘或光盘等。
以上对本发明所提供的带宽扩展中激励信号的生成方法以及相应的高频 信号的重建方法和装置进行了详细介绍,本文中应用了具体个例对本发明的原 理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法 及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具 体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解 为对本发明的限制。
2权利要求
1、一种带宽扩展中激励信号的生成方法,其特征在于,包括生成频率范围为0~B0的第一激励信号exc(n),n=0,...,N-1;对exc(n)进行频谱折叠,生成频率范围为B0~2B0的第二激励信号excfold(n);对exc(n)和excfold(n)进行合成滤波,输出频率范围为0~2B0的第三激励信号excHB(m),m=0,...,2N-1。
2、 根据权利要求1所述的激励信号的生成方法,其特征在于,所述对exc(n) 和exc/。'd(n)进行合成滤波的步骤具体为对exc(n)和excf。w(n)进行正交镜像合成 滤波。
3、 根据权利要求1或2所述的激励信号的生成方法,其特征在于,还包括 对频率范围为0 ~ 2BQ的excHB(m)进行3/4低通滤波,输出频率范围为0 ~3Bo/2的excHB(m)。
4、 根据权利要求3所述的激励信号的生成方法,其特征在于,所述生成 exc(n)的步骤具体为解码核心码流获得固定码本激励和自适应码本激励以及各自的增益; 按照各自的增益加权迭加所述固定码本激励和自适应码本激励获得 exc(n》
5、 根据权利要求4所述的激励信号的生成方法,其特征在于所述固定码本激励包括基本层固定码本激励c(n)和增强层增强激励c,(n),相应的增益分别为ge和g根据下式计算exc(n):exc(n) = gp'v(n) + gc.c(n) + genh.c,(n) 其中,v(n)为自适应码本激励,gp为v(n)的增益,N=160, B。 = 4kHz。
6、 一种带宽扩展中高频信号的重建方法,其特征在于,包括 按照权利要求l ~ 5任意一项所述的方法生成激励信号excHB(m), m = 0,…,2N-1;解码获得时域谱包络参数Tenv(i)和频域谱包络参数Fenv(j),其中i = 0,…,I誦l、 j = 0,…,J-1;按照T,(i)对excHB(m)的时域i普包络进行调整,每个T面(i)对应调整excHB(m) 中包括A个时域样点的一段,A《2N/1,生成时域调整后的信号ST(m);按照F,(j)对sT(m)的频域谱包络进行调整,每个Fenv(j)对应调整ST(m)频域 中带宽为Bi的一个子带,B,《B2/J, B2为sT(m)的频带宽度,生成频域调整后的 重建信号S气m);对S气m)进行频谱折叠,生成频率范围为2Bo ~ 2Bo + Bs的高频重建信号 S朋(m)。
7、 根据权利要求6所述的高频信号的重建方法,其特征在于,所述按照 Ten力)对excHB(m)的时域"潜包络进行调整的步骤包括按照编码端计算Tenv(i)的方式,计算excHB(m)的时域谱包络参数T,節v(i);根据T,(i)与T,env(i)之间的能量差值计算时域初步增益因子gT(i),每个gT(i)对应于excHB(m)中包括A个时域样点的一段;插值每个gT(i)获得A个增益因子gT,i(a), a=0,…,A-1; 根据gT,i(a)调整excHB(m)的A x I个样点的增益,获得ST(m)。
8、 根据权利要求7所述的高频信号的重建方法,其特征在于,A=10, I =N/5,所述根据T,(i)与T,證(i)之间的能量差值计算gT(i)的步骤具体为gT(i) = 2A [Tenv(i) - T,,(i)]; 所述插值每个gT(i)获得A个gT,i(a)的步骤具体为gT,i(a) = wT(a) gT(i) + [1 - w丁(a)] - g
(a); 其中,WT(a)为窗函数,当& = 0,…,4时,wT(a)= 1/2{1-cos[(a+1)兀/6]},当a =5,…,9时,wT(a)=l; g^V,i(a)为上一帧excHB(m)对应样点的增益因子。
9、 根据权利要求6 8任意一项所述的高频信号的重建方法,其特征在于, 所述按照Fenv(j)对sT(m)的频域语包络进行调整的步骤包括按照编码端计算FenvG)的方式,对ST(m)进行时频变换生成频域信号SF乂m) 并且计算SF乂m)的频域谱包络参数F,(j);根据F,(i)与F,env(j)之间的能量差值计算频域初步增益因子gF(j),每个gF(j)对应于S,m)中包括D个频域样点的一段,D x J<2N;插值每个gF(j)获得D个增益因子gFj(d), d=0,…,D-1;根据gF,j(d)调整S,m)的D x J个样点的增益,生成调整后的频域信号 SF2(m);对S,m)进行所述时频变换的逆变换,获得SF(m)。
10、根据权利要求9所述的高频信号的重建方法,其特征在于,所述4要照 编码端计算Fenv(j)的方式生成S"(m)并且计算F,,(j)的步骤包括为sT(m)及上 一 帧S"ast(m)加窗WTDAc(k)获得加窗后的信号Sw(k), k = 0,…, 4N-1,其中,Sw(k) = wTDAC(k) . ST'last(k), k = 0,…,2N-l, Sw(k) = w匿(k) . ST(k _ 2N), k = 2N,…,4N-1; 对SW(k)进行离散余弦变换生成S"(m),4N—1 ^SF1(m) = Z Sw(k)cos[—(2k +1 + 2N)(2m +1)]; k=o 8N抽取S^m)的前D x J个样点计算F;v(i),
11、 根据权利要求10所述的高频信号的重建方法,其特征在于D=16, J = 3N/32,所述窗函数WTDAc(k)为wTDAC(k) = sin[(k + 0.5)兀/4N]。
12、 根据权利要求6 ll任意一项所述的高频信号的重建方法,其特征在 于,在对SF(m)进行频谱折叠前,还包括使用包络调整阈值limit"i)、 limit2(i)对sF(m)进行包络调整,调整后的S^m)为在n^m广m2的部分中,若| SF,°ld(m) | 〈limit"i),则SF(m) = SF'°ld(m), 在111 = 1112+1 iri3的部分中,若limit《i)《I SF'。Id(m) i《limit2(i), U'jSF(m)=[SF'old(m) - limit"i)]/2 + limit!(i),在111 = 1113+1-nu的部分中,若I SF,°ld(m) I 〉limit2(i),则SF(m) = [SF,°ld(m)_ limit2(i)]/16 + limit2(i),其中,SF'。w(m)为包络调整前的sF(m); limit!(i)、 limit2(i)与sF(m)中时域样点的对应关系,和T,(i)与SF(m)中时域样点的对应关系相同。
13、 根据权利要求12所述的高频信号的重建方法,其特征在于所述 limit"i)、 limit2(i)为,limit!(i) =T,(i), Umit2(i) = [2A T,(i)] x 2,5。
14、 根据权利要求13所述的高频信号的重建方法,其特征在于N=160; 所述m广m2的部分为0-5、 80- 85、 160- 165、 240~245的部分;所述1112+1 ~ m3的部分为6 75、 86- 155、 166 ~ 235、 246~315的部分;所述013+1~1114的 部分为76~79、 156 ~ 159、 236-239、 316~319的部分。
15、 一种带宽扩展中激励信号的生成装置,其特征在于,包括 核心解码模块,用于输出频率范围为0 Bo的第一激励信号exc(n), n =0,…,N-1;频谱折叠模块,用于对exc(n)进行频镨折叠,输出频率范围为Bo 2Bo的第 二激励信号excf。w(n);合成滤波模块,用于对exc(n)和exc,(n)进行合成滤波,输出频率范围为 0 2Bo的第三激励信号excHB(m), m = 0,…,2N-l。
16、 根据权利要求15所述的激励信号的生成装置,其特征在于所述合成 滤波模块为正交镜像合成滤波器。
17、 根据权利要求15或16所述的激励信号的生成装置,其特征在于,还包括3/4低通滤波器,用于输入频率范围为0 2B。的excHB(m),对其进行3/4低 通滤波,输出频率范围为0 ~ 3B(/2的exCHB(m)。
18、 一种带宽扩展中高频信号的重建装置,其特征在于,包括 激励信号生成单元,采用权利要求15 ~ 17任意一项所述的激励信号的生成装置的逻辑结构,用于生成激励信号excHB(m), m = 0,…,2N-l;解码单元,用于解码输出时域谱包络参数Tenv(i)和频域谱包络参凄tFenv(j),其中i-O, .",I-l、 j = 0,…,J-1;时域整形单元,用于按照Te"i)对eXCHB(m)的时域谱包络进行调整,每个Tenv(i)对应调整excHB(m)中包括A个时域样点的一段,A<2N/I,输出时域调整后的信号ST(m);频域整形单元,用于按照F,(j)对ST(m)的频域谱包络进行调整,每个Fenv(j) 对应调整ST(m)频域中带宽为B,的一个子带,B!《B2/J, B2为ST(m)的频带宽度, 输出频域调整后的重建信号SF(m);频谱折叠单元,用于对输入的sF(m)进行频谱折叠,生成频率范围为2Bo 2B0 + B2的高频重建信号SHB(m)。
19、根据权利要求18所述的高频信号的重建装置,其特征在于,还包括后处理单元,用于使用包络调整阈值limit!(i)、 limit2(i)对所述频域整形单 元输出的SF(m)进行包络调整,调整后的SF(m)为在m = mi ~ 1112的部分中,若 I SF'old(m) I < limit,(i),贝寸SF(m) = SF,。ld(m);在m = m2+l ~ ni3的部分中,若limit!(i) 《I SF,old(m) I <limit2(i), Jil'JSF(m) = [sF,。w(m) — limit!(i)]/2+ 1^11^(0;在m = m3+l ~ mu的部分中,若I SF'。ld(m) | 〉 limit2(i),则SF(m) = [SF'°ld(m) — limit2(i)]/16 + limit2(i);其中,SF,。w(m)为包络调整前的sF(m); limit"i)、 limit2(i)与SF(m)中 时域样点的对应关系,和T,(i)与SF(m)中时域样点的对应关系相同;将调整后 的SF(m)输出给所述频谱折叠单元。
全文摘要
本发明公开了一种带宽扩展中激励信号的生成方法,将窄带低频信号通过频谱折叠再合成,生成所需要的高频激励信号。本发明还提供相应的带宽扩展中高频信号的重建方法及装置。本发明方案由于利用低频信号产生高频信号,基于信号低频和高频频谱具有的调和特性,能够对语音和音乐信号都进行较好的扩展,所采用的频谱折叠方式也保证了高低频在衔接处信号频谱的连续;实验证明本发明方案适合对7~14kHz超宽频信号进行扩展。
文档编号G10L21/02GK101458930SQ20071019877
公开日2009年6月17日 申请日期2007年12月12日 优先权日2007年12月12日
发明者勇 张, 王庭红, 王晓晨, 玮 肖, 胡瑞敏, 昭 谢, 马付伟 申请人:华为技术有限公司;武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1