用于对音频帧丢失隐藏进行控制的方法和设备的制造方法_2

文档序号:9252475阅读:来源:国知局
br>[0045] 在该方程式中,w(n)表示窗函数,通过该窗函数来对长度为L的分析帖进行提取 和加权。典型的窗函数是例如如图1所示的针对nG[0. ..kl]等于1并且否则等于0的 矩形窗。本文假设设置了之前接收的音频信号的时间索引,使得通过时间索引n= 0. .. 引用分析帖。其它可W更适于谱分析的窗函数是例如Hamming窗、Hanning窗、Kaiser窗或 Blackman窗。更有用的窗函数是Hamming窗与矩形窗的组合。如图2所示,该窗具有形状 像长度为L1的化mming窗左半边的上升沿和形状像长度为L1的化mming窗的右半边的下 降沿,并且在上升沿和下降沿之间窗口针对长度kLl等于1。
[0046] 加窗的分析帖IX(m)I的幅度谱的波峰构成对所要求的正弦频率fk的逼近。然而, 该逼近的精度受到DFT的频率间隔的限制。针对具有块长度L的DFT,该精度限制于^
[0047] 实验显示,在本文描述的方法范围内,该精度级别太低。可W基于W下考虑的结果 来获得提高的精度:
[004引通过窗函数的谱与正弦模型信号S(Q)的线谱的卷积来给出加窗的分析帖的谱, 随后在DFT的网格点处采样;
[0049]
[0050] 通过使用正弦模型信号的谱表达式,该方程式可W写成:
[0051]
[0052] 因此,采样后的谱由W下方程式给出:
[0053]
其中m= 0. . . 1^-1。
[0054] 基于该考虑,设想分析帖的幅度谱中观察到的波峰来自于具有K个正弦波的加窗 的正弦信号,其中在临近波峰的位置找到真的正弦频率。
[005引假设nik是观察到的第kth个波峰的DFT索引(网格点),则对应的频率是i; =^'乂.,其可W被视为对真的正弦频率fk的逼近。真的正弦频率fk可W假设为位于区
)
[0056] 为了清楚起见,应当注意的是,窗函数的谱与正弦模型信号的线谱的卷积可W被 理解为窗函数谱的频移版本的叠加,从而偏移频率是正弦波的频率。然后在DFT网格点处 对该叠加进行采样。通过W下附图示出了该些步骤。图3显示了窗函数的幅度谱的示例。 图4示出了具有单个频率的正弦波的正弦信号示例的幅度谱(线谱)。图5示出了加窗的正 弦信号的幅度谱,该加窗的正弦信号在正弦波的频率处重复并叠加频移窗口波谱。图6中 的条对应于加窗的正弦波的DFT的网格点的幅度,该加窗的正弦波通过计算分析帖的DFT 来获得。应该注意的是,所有的波谱是周期的,具有对应于采样频率f;的归一化频率参数 Q,其中Q= 231。
[0057] 之前的讨论和图6的说明建议;仅可W通过增大查找的分辨率超过使用的频域变 换的频率分辨率来找到对真的正弦频率的更好的逼近。
[0058] -种找到对正弦波的频率fk的更好的逼近的优选方式是应用抛物线内插。一种 该样的方法是将抛物线穿过围绕波峰的DFT幅度谱的网格点,并且计算属于抛物线顶点的 相应频率。对于抛物线的阶数(order)的一种合适的选择是2。更详细地,可W应用W下步 骤:
[0059] 1.识别加窗的分析帖的DFT的波峰。波峰查找将会传送波峰数量K和波峰的对应 索引。波峰查找能够典型地在DFT幅度谱或对数DFT幅度谱上进行。
[0060]2.针对每个具有对应DFT索引化的波峰k(其中k=1.. .K),将抛物线穿过S个 点;{P1;P2;P:3}=(姑-1,l〇g(|X(mk_l)|);姑,log(|X(nik)|);姑+1,log(|X(nik+l)|)}。 该导致抛物线的抛物线系数bk(0)、bk(1)、bk(2)由W下公式限定:
[0061]
[0062] 图7示出了该抛物线拟合。
[0063] 3.针对K个抛物线中的每一个来计算对应于q的值的内插的频率索引W,,、,该抛 物线针对q的值具有其最大值。使用= /如' <、乂作为对正弦频率fk的逼近。
[0064] 所述方法提供良好的结果,但可能由于抛物线不与窗函数的幅度谱|W(Q)I的主 瓣的形状逼近而具有一些限制。该样做的备选方案是如下所述使用主瓣逼近的增强的频率 估计。该备选的主要想法是:拟合函数P(q),该函数P(q)通过环绕波峰的DFT幅度谱的网 格点来逼近I ?y)I的主瓣;W及计算属于函数最大值的相应频率。函数P(q)可W等 同于窗函数的频移幅度谱?的-苗))|。为了数值的简单,应当例如宁愿是允许直接 IJ 计算函数最大值的多项式。可W应用W下过程。
[0065] 1.识别加窗的分析帖的DFT的波峰。波峰查找将会传送波峰数量K和波峰的对应 DFT索引。波峰查找能够典型地在DFT幅度谱或对数DFT幅度谱上进行。 2
[006引 2.对于给定的区间(屯,屯)导出逼近窗函数的幅度谱|W(^'(/)|或对数幅度谱 IJ 2死 logII的函数P(q)。用图8示出了逼近窗谱主瓣的逼近函数的选择。 Ju
[0067] 3.对每个具有对应DFT索引化的波峰k(其中k= 1...K),通过环绕加窗正弦 信号的连续谱的期望真实波峰的两个DFT网格点来拟合频移函数巧9"如)。因此,如果 X(mk-l)I大于 |X(nik+l)I,贝ij通过点{Pi;P2}=(姑-1,l〇g(|X(mk_l)I);姑,log(|X(nik)I)} 拟合巧卖.),否则通过点化;?2}二{姑,l〇g(|X(nik)|);姑+1,log(|X(mk+l)|)}拟合 巧g-矣)。可W简单地将P(q)选为2或4阶的多项式。该将步骤2中的逼近呈现为简单的 线性回归计算和直接的东的计算。可W将该间隔(qi,q2)选为固定的并且对于所有波峰相 同,例如灿,屯)=(-1,1),或自适应的。在自适应方法中,可化选择区间使得函数/中/-矣) 在相关DFT网格点化;P2}的范围内拟合窗函数谱的主瓣。图9中可W看出该拟合过程。
[0068] 4.对于针对期望加窗的正弦信号的连续谱具有其波峰的K个频移参数中的每一 个偏移参数矣,计算A二么作为对正弦频率fk的逼近。
[0069] 存在许多发送信号是谐波情况,意味着信号由频率为某一基频f。的整数倍的正弦 波组成。当信号非常具有周期性时是该种情况,例如对于发声的语音或某一乐器的持续音。 该意味着实施例的正弦模型的频率不是独立的,而是具有谐波关系并源自同一基频。将该 谐波属性纳入考虑可W因此实质上对正弦分量频率的分析进行改进。
[0070] 概述了一种增强可能方式如下:
[0071] 1.检查信号是否是谐波。该可W例如通过在帖丢失之前评估信号的周期性来完 成。一种直接方法是执行对信号的自相关分析。该种自相关函数对于某一时滞T>0的 最大值可W用作指示符。如果该最大值的值超过给定阔值,则可W认为信号是谐波。相应 的时滞T通过人对应于与基频有关的信号的周期。 T
[0072] 许多线性预测语音编码方法应用所谓的开环或闭环音高预测或使用自适应码本 的CELP编码。如果信号是谐波,则通过该种编码方法导出的音高增益和相关联的音高迟滞 参数也分别是针对时滞的有用指示符。
[0073]W下描述了用于获得f。的另一种方法。
[0074] 2.对于整数范围1...内的每个谐波索引j,检查在谐波频率f^二j?f。 邻近范围内的分析帖的(对数)DFT幅度谱中是否存在波峰。可W将的邻近范 围定义为其中增量与DFT的频率分辨率^相对应的fj.周围的增量范围,即区间 J_j
[007引一旦出现该种具有相应估计的正弦频率fk的波峰,则用fk=j?f。来取代fk。
[0076] 对于上述两步过程,也可能做出关于信号是否是谐波的检查,并隐式且可能地按 照迭代方式导出基频,而不必使用来自某一单独方法的指示符。W下给出了该种技术的一 个示例:
[0077] 对于一组备选值中的每个f。,。,应用过程步骤2(尽管不取代fk),但 是对在谐波频率(即f。,P的整数倍)邻近范围内存在多少个DFT波峰计数。识别基频f。, pm。,,对于该基频获得了在谐波频率处或谐波频率周围的最大数量的波峰。如果波峰 的最大数量超过给定阔值,则认为信号是谐波。在那种情况下,将f。,pmay认为是基频,然后 用基频执行步骤2而得到增强的正弦频率fk。然而,一种更优选的备选方式是,首先 基于已经被发现与谐波频率一致的波峰频率fk来对基频f。进行优化。假设已经发现一组 M个谐波(即某一基频的整数倍{ni...rU)与频率fk(m),m= 1...M处的某组M个谱峰相 一致,则可W计算下层(优化后的)基频f。,。。,,W使谐波频率和谱峰频率之间的误差最小。 如果将误差最小化为均方误差
则最优基频被计算为
[0078] 0
[0079] 可W从DFT波峰的频率或所估计的正弦频率fk获得备选频率的初始集合if。, 1. . .f〇,p}。
[0080] 提高所估计的正弦频率fk的精度的另一种可能方式是考虑它们的时间演化。为 此,可W例如通过平均或预测来对来自多个分析帖的正弦频率的估计进行组合。在平均或 预测之前,可W应用波峰追踪,其将所估计的谱峰与相应的同一下层正弦波联系起来。
[00引]应用正弦模型
[0082] 为了执行本文描述的帖丢失隐藏操作而应用正弦模型可W描述为W下内容:
[0083] 假设由于相应的编码信息不可用而导致解码器不能重构编码信号的给定段。还假 设信号在该段之前的部分可用。假设y(n)(n= 0...N-1)是不可用的段,必须针对该段生 成替代帖Z(n),并且y(
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1