用于高频带激励产生的系统、方法和设备的制作方法

文档序号:6121966阅读:202来源:国知局
专利名称:用于高频带激励产生的系统、方法和设备的制作方法
技术领域
本发明涉及信号处理。
背景技术
公共交换电话网络(PSTN)上的语音通信的带宽传统上限于300-3400 kHz的频率 范围。用于语音通信(例如蜂窝式电话和IP语音(因特网协议,VoIP))的新的网络可 能不具有相同的带宽限制,且可能需要在此类网络上发射和接收包含宽频带频率范围的 语音通信。举例来说,可能需要支持向下延伸到50 Hz和/或一直到7或8 kHz的音频频 率范围。还可能需要支持可能具有在传统PSTN限制以外的范围内的音频语音内容的其 它应用,例如高质量音频或音频/视频会议。
语音编码器所支持的范围向较高频率的延伸可改进清晰度。举例来说,区分例如"s" 与"f"的摩擦音的信息主要处于高频率。高频带延伸还可改进语音的其它质量,例如存 在率。举例来说,甚至浊元音也可具有远远高于PSTN限制的频谱能量。
宽频带语音编码的一种方法涉及縮放窄频带语音编码技术(例如,经配置以编码0-4 kHz的范围的技术)以覆盖宽频带频谱。举例来说,语音信号可以较高速率取样以包含 处于高频率的分量,且窄频带编码技术可重新配置以使用更多滤波系数来表示此宽频带 信号。然而,例如CELP (密码本激励线性预测)的窄频带编码技术计算量较大,而宽 频带CELP编码器可能消耗过多处理循环,以至于对于许多移动和其它嵌入式应用而言 不现实。使用这种技术将宽频带信号的整个频谱编码为所需质量还可能导致带宽大大增 加而令人无法接受。此外,甚至在此经编码信号的窄频带部分可传输到仅支持窄频带编 码的系统中和/或由所述系统解码之前,将需要对所述经编码信号进行代码转换。
宽频带语音编码的另一种方法涉及从经编码窄频带频谱包络外推高频带频谱包络。 虽然这种方法可在不增加带宽且不需要代码转换的情况下实施,但通常无法从窄频带部 分的频谱包络中精确地预测出语音信号的高频带部分的粗略频谱包络或共振峰结构。
可能需要实施宽频带语音编码,使得至少经编码信号的窄频带部分可通过窄频带信 道(例如,PSTN信道)发送,而不进行代码转换或其它显著修改。还可能需要宽,频带 编码延伸有效率,以便(例如)避免在例如无线蜂窝式电话以及有线和无线信道上的广 播的应用中可能接受服务的用户的数目显著减少。

发明内容
在一个实施例中, 一种产生高频带激励信号的方法包含谐波延伸基于低频带激励 信号的信号的频谱;计算基于所述低频带激励信号的信号的时域包络;以及根据所述时 域包络来调制噪声信号。所述方法还包含组合(A)基于所述谐波延伸的结果的经谐波 延伸信号与(B)基于所述调制的结果的经调制噪声信号。在此方法中,所述高频带激 励信号基于所述组合的结果。
在另一实施例中, 一种设备包含频谱延伸器,其经配置以执行基于低频带激励信 号的信号的频谱的谐波延伸;包络计算器,其经配置以计算基于所述低频带激励信号的 信号的时域包络;第一组合器,其经配置以根据所述时域包络执行噪声信号的调制;以 及第二组合器,其经配置以计算(A)基于所述谐波延伸的结果的经谐波延伸信号与(B) 基于所述调制的结果的经调制噪声信号的总和。所述高频带激励信号基于所述总和的结 果。
在另一实施例中, 一种设备包含用于谐波延伸基于低频带激励信号的信号的频谱 的装置;用于计算基于所述低频带激励信号的信号的时域包络的装置;用于根据所述时 域包络来调制噪声信号的装置;以及用于组合(A)基于所述谐波延伸的结果的经谐波 延伸信号与(B)基于所述调制的结果的经调制噪声信号的装置。在此设备中,所述高
频带激励信号基于所述组合的结果。
在另一实施例中, 一种产生高频带激励信号的方法包含通过将非线性函数应用于
从语音信号的低频率部分导出的低频带激励信号来计算经谐波延伸信号;以及将所述经
谐波延伸信号与经调制噪声信号混合以产生高频带激励信号。


图la展示根据一实施例的宽频带语音编码器A100的方块图。 图lb展示宽频带语音编码器A100的实施方案A102的方块图。 图2a展示根据一实施例的宽频带语音解码器B100的方块图。 图2b展示宽频带语音编码器B100的实施方案B102的方块图。 图3a展示滤波器组A110的实施方案A112的方块图。
图3b展示滤波器组B120的实施方案B122的方块图。
图4a展示滤波器组A110的一个实例的低和高频带的带宽覆盖。
图4b展示滤波器组A110的另一实例的低和高频带的带宽覆盖。
图4c展示滤波器组A112的实施方案A114的方块图。
图4d展示滤波器组B122的实施方案B124的方块图。
图5a展示语音信号的频率与对数幅值的曲线的实例。
图5b展示基础线性预测编码系统的方块图。
图6展示窄频带编码器A120的实施方案A122的方块图。
图7展示窄频带解码器B110的实施方案B112的方块图。
图8a展示浊语音的残留信号的频率与对数幅值的曲线的实例。
图8b展示浊语音的残留信号的时间与对数幅值的曲线的实例。
图9展示也执行长期预测的基础线性预测编码系统的方块图。
图10展示高频带编码器A200的实施方案A202的方块图。
图11展示高频带激励发生器A300的实施方案A302的方块图。
图12展示频谱延伸器A400的实施方案A402的方块图。
图12a展示频谱延伸操作的一个实例中各点处的信号频谱的曲线。
图12b展示频谱延伸操作的另一实例中各点处的信号频谱的曲线。
图13展示高频带激励发生器A302的实施方案A304的方块图。
图14展示高频带激励发生器A302的实施方案A306的方块图。
图15展示包络计算任务T100的流程图。
图16展示组合器490的实施方案492的方块图。
图17说明计算高频带信号S30的周期性的指标的方法。
图18展示高频带激励发生器A302的实施方案A312的方块图。
图19展示高频带激励发生器A302的实施方案A314的方块图。
图20展示高频带激励发生器A302的实施方案A316的方块图。
图21展示增益计算任务T200的流程图。
图22展示增益计算任务T200的实施方案T210的流程图。
图23a展示窗口函数的图。
图23b展示将如图23a所示的窗口函数应用于语音信号的子帧。
图24展示高频带解码器B200的实施方案B202的方块图。
图25展示宽频带语音编码器A100的实施方案ADIO的方块图。 图26a展示延迟线D120的实施方案D122的示意图。
图26b展示延迟线D120的实施方案D124的示意图。
图27展示延迟线D120的实施方案D130的示意图。
图28展示宽频带语音编码器AD10的实施方案AD12的方块图。
图29展示根据一实施例的信号处理方法MD100的流程图。
图30展示根据一实施例的方法M100的流程图。
图31a展示根据一实施例的方法M200的流程图。
图31b展示方法M200的实施方案M210的流程图。
图32展示根据一实施例的方法M300的流程图。
在各图以及随附的描述中,相同参考标号表示相同或类似的元件或信号。
具体实施例方式
本文描述的实施例包含可经配置以向窄频带语音编码器提供延伸以支持传输和/或 存储宽频带语音信号而带宽仅增加约800到1000 bps (位/秒)的系统、方法和设备。此 类实施方案的潜在优点包含支持与窄频带系统的兼容性的嵌入式编码、在窄频带与高频 带编码信道之间相对容易地分配和再分配位、避免计算量较大的宽频带合成操作,以及 维持待通过计算量较大的波形编码例行程序处理的信号的低取样速率。
除非特别受到上下文限制,否则本文使用术语"计算"来表示其普通含义的任一者, 例如计算、产生和从值的列表中选择。本描述内容和权利要求书中使用术语"包括"时, 不排除其它元件或操作。使用术语"A基于B"来表示其普通含义的任一者,包含以下 情况(i) "A等于B"和(ii) "A至少基于B"。术语"因特网协议"包含如正TF (因 特网工程工作小组)RFC (请求注解)791中描述的版本4和随后版本(例如,版本6)。
图la展示根据一实施例的宽频带语音编码器A100的方块图。滤波器组A110经配 置以对宽频带语音信号S10进行滤波以产生窄频带信号S20和高频带信号S30。窄频带 编码器A120经配置以编码窄频带信号S20以产生窄频带(NB)滤波器参数S40和窄频 带残留信号S50。如本文进一步详细描述,窄频带编码器A120通常经配置以作为密码 本索引或采取另一量化形式而产生窄频带滤波器参数S40和经编码窄频带激励信号 S50。高频带编码器A200经配置以根据经编码窄频带激励信号S50中的信息编码高频带 信号S30以产生高频带编码参数S60。如本文进一步详细描述,高频带编码器A200通 常经配置以作为密码本索引或采取另一量化形式而产生高频带编码参数S60。宽频带语 音编码器A100的一个特定实例经配置以在约8.55 kbps (千位/秒)的速率下编码宽频带
语音信号SIO,其中约7.55 kbps用于窄频带滤波器参数S40和经编码窄频带激励信号 S50,且约1 kbps用于高频带编码参数S60。
可能需要将经编码窄频带和高频带信号组合为单一位流。举例来说,可能需要将经 编码信号多路复用在一起以作为经编码宽频带语音信号用于传输(例如,在有线、光学 或无线传输信道上)或用于存储。图lb展示宽频带语音编码器A100的实施方案A102 的方块图,宽频带语音编码器AIOO包含多路复用器A130,其经配置以将窄频带滤波器 参数S40、经编码窄频带激励信号S50和高频带滤波器参数S60组合为多路复用信号 S70。
一种包含编码器A102的设备还可包含经配置以将多路复用信号S70传输到例如有 线、光学或无线信道的传输信道中的电路。此设备还可经配置以对信号执行一个或一个 以上信道编码操作,例如误差校正编码(例如,速率兼容巻积编码)和/或误差检测编码 (例如,循环冗余编码),和/或一层或一层以上网络协议编码(例如,以太网、TCP/IP、 cdma2000)。
可能需要多路复用器A130经配置以嵌入经编码窄频带信号(包含窄频带滤波器参 数S40和经编码窄频带激励信号S50)作为可分离的多路复用信号S70支流,使得经编 码窄频带信号可独立于多路复用信号S70的另一部分(例如,高频带和/或低频带信号) 被恢复并解码。举例来说,多路复用信号S70可经配置使得经编码窄频带信号可通过剥 除高频带滤波器参数S60而恢复。这一特征的一个潜在优点是避免在将经编码宽频带信 号传递到支持窄频带信号的解码但不支持高频带部分的解码的系统之前需要对所述经 编码宽频带信号进行代码转换。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。窄频带解码器B110 经配置以解码窄频带滤波器参数S40和经编码窄频带激励信号S50以产生窄频带信号 S90。高频带解码器B200经配置以基于经编码窄频带激励信号S50根据窄频带激励信号 S80而解码高频带编码参数S60,以产生高频带信号SIOO。在此实例中,窄频带解码器 B110经配置以将窄频带激励信号S80提供到高频带解码器B200。滤波器组B120经配 置以将窄频带信号S90与高频带信号SIOO组合以产生宽频带语音信号SllO。
图2b是宽频带语音解码器B100的实施方案B102的方块图,宽频带语音解码器B100 包含多路分解器B130,其经配置以从多路复用信号S70中产生经编码信号S40、 S50和 S60。 一种包含解码器B102的设备可包含经配置以从例如有线、光学或无线信道的传输 信道接收多路复用信号S70的电路。此设备还可经配置以对信号执行一个或一个以上信 道解码操作,例如误差校正解码(例如,速率兼容巻积解码)和/或误差检测解码(例如,
循环冗余解码),和/或一层或一层以上网络协议解码(例如,以太网、TCP/IP、cdma2000)。 滤波器组A110经配置以根据分裂频带方案对输入信号进行滤波以产生低频率子频 带和高频率子频带。视特定应用的设计标准而定,输出子频带可具有相等或不等的带宽 且可能重叠或不重叠。产生两个以上子频带的滤波器组A110配置也是可能的。举例来 说,此滤波器组可经配置以产生一个或一个以上低频带信号,所述低频带信号包含处于 窄频带信号S20的频率范围以下的频率范围(例如50-300 Hz的范围)内的分量。此滤 波器组也可能经配置以产生一个或一个以上额外高频带信号,所述额外高频带信号包含 处于高频带信号S30的频率范围以上的频率范围(例如14-20、 16-20或16-32 kHz的范 围)内的分量。在此情况下,可实施宽频带语音编码器A100以单独编码此信号(一个 或多个),且多路复用器A130可经配置以将额外经编码信号(一个或多个)包含在多路 复用信号S70中(例如,作为可分离部分)。
图3a展示滤波器组A110的实施方案A112的方块图,滤波器组A110经配置以产 生具有减小的取样速率的两个子频带信号。滤波器组A110经配置以接收具有高频率(或 高频带)部分和低频率(或低频带)部分的宽频带语音信号SIO。滤波器组A112包含 经配置以接收宽频带语音信号S10并产生窄频带语音信号S20的低频带处理路径,和经 配置以接收宽频带语音信号S10并产生高频带语音信号S30的高频带处理路径。低通滤 波器110对宽频带语音信号S10进行滤波以通过选定的低频率子频带,且高通滤波器130 对宽频带语音信号S10进行滤波以通过选定的高频率子频带。因为两个子频带信号的带 宽比宽频带语音信号S10窄,所以其取样速率可在一定程度上减小而无信息损失。向下 取样器120根据所需的抽选因数(例如,通过去除信号的样本和/或用平均值代替样本) 来减小低通信号的取样速率,且向下取样器140同样地根据另一所需的抽选因数来减小
高通信号的取样速率。
图3b展示滤波器组B120的相应实施方案B122的方块图。向上取样器150 (例如,
通过零塞入和/或通过复制样本)增加窄频带信号S90的取样速率,且低通滤波器160 对向上取样信号进行滤波以仅通过低频带部分(例如,以防止混叠)。同样,向上取样 器170增加高频带信号S100的取样速率,且高通滤波器180对向上取样信号进行滤波 以仅通过高频赉部分。接着,将两个通频带信号求和以形成宽频带语音信号SllO。在解 码器B100的一些实施方案中,滤波器组B120经配置以根据由高频带解码器B200接收 和/或计算的一个或一个以上权数来产生两个通频带信号的加权总和。还预期将两个以上 通频带信号组合的滤波器组B120配置。
滤波器IIO、 130、 160、 180的每一者可实施为有限脉冲响应(FIR)滤波器或实施为无限脉冲响应(IIR)滤波器。编码器滤波器110和130的频率响应可具有抑止频带与 通频带之间的对称或相异形状的转变区。同样,解码器滤波器160和180的频率响应可 具有抑止频带与通频带之间的对称或相异形状的转变区。可能需要(但不是严格有必要) 低通滤波器110与低通滤波器160具有相同响应,且高通滤波器130与高通滤波器180 具有相同响应。在一个实例中,两个滤波器对110、 130和160、 180是正交镜像滤波器 (QMF)组,其中滤波器对110、 130与滤波器对160、 180具有相同系数。
在典型实例中,低通滤波器110具有包含300-3400 Hz的有限PSTN范围的通频带 (例如,0到4kHz的频带)。图4a和4b展示两个不同实施实例中宽频带语音信号SIO、 窄频带信号S20和高频带信号S30的相对带宽。在这两个特定实例中,宽频带语音信号 S10具有16 kHz的取样速率(表示O到8 kHz范围内的频率分量),且窄频带信号S20 具有8 kHz的取样速率(表示0到4 kHz范围内的频率分量)。
在图4a的实例中,两个子频带之间不存在明显重叠。此实例中所示的高频带信号 S30可通过使用具有4-8 kHz的通频带的高通滤波器130来获得。在此情况下,可能需 要通过以2为因数向下取样经滤波信号而将取样速率减小为8 kHz。可预期此操作会显 著减小对信号的进一步处理操作的计算复杂性,此操作将把通频带能量下移到0到4kHz
范围内而无信息损失。
在图4b的替代实例中,上部和下部子频带具有明显重叠,使得两个子频带信号均 描述3.5到4 kHz的区域。此实例中的高频带信号S30可通过使用具有3.5-7 kHz的通频 带的高通滤波器130来获得。在此情况下,可能需要通过以16/7为因数向下取样经滤波 信号而将取样速率减小为7 kHz。可预期此操作会显著减小对信号的进一步处理操作的 计算复杂性,此操作将把通频带能量下移到0到3.5 kHz范围内而无信息损失。
在典型电话通信手机中,一个或一个以上变换器(即,麦克风和耳机或扬声器)缺 乏7-8kHz的频率范围上的明显响应。在图4b的实例中,宽频带语音信号S10的处于7 与8 kHz之间的部分不包含在经编码信号中。高通滤波器130的其它特定实例具有 3.5-7.5 kHz和3.5-8 kHz的通频带。
在一些实施方案中,如在图4b的实例中在子频带之间提供重叠允许使用在重叠区 上具有平滑衰减的低通和/或高通滤波器。此类滤波器与具有较急剧或"砖墙式 (brick-wall)"响应的滤波器相比,通常较易设计,计算上不太复杂,且/或引起的延迟 较少。具有急剧转变区的滤波器往往比具有平滑衰减的类似等级的滤波器具有更高的旁 瓣(这可能引起混叠)。具有急剧转变区的滤波器还可能具有长脉冲响应,这可能引起 振铃假象。对于具有一个或一个以上IIR滤波器的滤波器组实施方案,允许重叠区上的
平滑衰减可使得能够使用极点较远离单位圆的滤波器(一个或多个),这对于确保稳定 的定点实施方案可能较重要。
子频带重叠允许低频带与高频带的平滑混合,这可导致较少的可听到的假象,减少 混叠,且/或使一个频带到另一频带的转变不太明显。此外,窄频带编码器A120 (例如, 波形编码器)的编码效率可随着频率不断增加而下降。举例来说,可能在低位速率下, 尤其在存在背景噪声的情况下减小窄频带编码器的编码质量。在此类情况下,提供子频 带重叠可提高重叠区中复制的频率分量的质量。
此外,子频带重叠允许低频带与高频带的平滑混合,其可能导致较少的可听到的假 象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此特征对于窄频带编码器 A120和高频带编码器A200根据不同编码方法操作的实施方案可能尤其合乎需要。举例
来说,不同编码技术可产生听起来非常不同的信号。以密码本索引形式编码频谱包络的 编码器可产生具有与改为编码幅值谱的编码器不同的声音的信号。时域编码器(例如,
脉冲-代码调制或PCM编码器)可产生具有与频域编码器不同的声音的信号。以频谱包 络和相应残留信号的表示形式编码信号的编码器可产生具有与仅以频谱包络表示形式 编码信号的编码器不同的声音的信号。将信号编码为其波形的表示形式的编码器可产生 具有与来自正弦编码器的输出不同的声音的输出。在此类情况下,使用具有急剧转变区 的滤波器来界定非重叠子频带可能导致合成的宽频带信号中子频带之间的转变较突然 且感觉上较明显。
尽管子频带技术中通常使用具有互补重叠频率响应的QMF滤波器组,但此类滤波 器不适于本文描述的宽频带编码实施方案中的至少一些实施方案。编码器处的QMF滤 波器组经配置以产生较大程度的混叠,所述混叠在解码器处的相应QMF滤波器组中被 消去。此配置可能不适于信号招致滤波器组之间的大量失真的应用,因为失真可减小混 叠消去性质的效力。举例来说,本文描述的应用包含经配置以在非常低的位速率下操作 的编码实施方案。由于位速率非常低,所以经解码信号很可能与原始信号相比呈现为明 显失真,使得QMF滤波器组的使用可导致未消去的混叠。
另外,编码器可经配置以产生感觉上类似于原始信号但实际上显著不同于原始信号
的合成信号。举例来说,如本文所描述从窄频带残留中导出高频带激励的编码器可产生 此信号,因为经解码信号中可能完全不存在实际高频带残留。在此类应用中使用QMF 滤波器组可导致由未消去的混叠引起的较大程度的失真。使用QMF滤波器组的应用通 常具有较高位速率(例如,对于AMR超过12kbps,且对于G722超过64kbps)。
如果受影响子频带较窄,那么可减小QMF混叠引起的失真量,因为混叠的影响限
于与子频带宽度相等的带宽。然而,对于本文描述的其中每一子频带包含宽频带带宽的 约一半的实例,由未消去的混叠引起的失真可能影响信号的大部分。信号的质量也可能 受上面发生未消去的混叠的频带的位置影响。举例来说,宽频带语音信号中心附近(例 如,3与4kHz之间)产生的失真可能比信号边缘附近(例如,6kHz以上)发生的失真 有害得多。
虽然QMF滤波器组的滤波器的响应彼此严格相关,但滤波器组A110和B120的低 频带和高频带路径可经配置以具有除两个子频带的重叠外完全不相关的频谱。我们将两 个子频带的重叠定义为高频带滤波器的频率响应下降到-20 dB的点至低频带滤波器的频 率响应下降到-20 dB的点的距离。在滤波器组A110和/或B120的各种实例中,此重叠 范围为约200 Hz到约1 kHz。约400到约600 Hz的范围可表示编码效率与感知平滑度 之间的理想折衷。在上文提及的一个特定实例中,重叠在500Hz附近。
可能需要实施滤波器组A112和/或B122来在若干阶段执行图4a和4b中说明的操 作。举例来说,图4c展示滤波器组A112的实施方案A114的方块图,实施方案A114 使用一系列内插、再取样、抽选和其它操作来执行功能等效的高通滤波和向下取样操作。 此类实施方案可较易设计且/或可允许再使用逻辑和/或代码的功能块。举例来说,可使 用相同功能块来执行如图4c所示至14 kHz的抽选以及至7 kHz的抽选的操作。可通过 将信号与函数e^或序歹U(-l)n相乘来实施频谱反转操作,所述序列(-l)n的值在+1与-1 之间交替。频谱成形操作可实施为经配置以使信号成形从而获得所需的总体滤波器响应 的低通滤波器。
注意到,由于频谱反转操作的缘故,高频带信号S30的频谱反转。可相应地配置编 码器和相应解码器中的后续操作。举例来说,本文描述的高频带激励发生器A300可经 配置以产生同样具有频谱反转形式的高频带激励信号S120。
图4d展示滤波器组B122的实施方案B124的方块图,滤波器组B122使用一系列 内插、再取样和其它操作来执行功能等效的向上取样和高通滤波操作。滤波器组B124 包含高频带中的频谱反转操作,其使与例如编码器的滤波器组(例如,滤波器组A114) 中执行的类似的操作反转。在此特定实例中,滤波器组B124还包含低频带和高频带中 的陷波滤波器,其削弱7100Hz处的信号分量,但此类滤波器是任选的且不需要包含此 类滤波器。与此一同申请的代理人案号为050551的专利申请案"SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING"包含关于滤波器组AllO和B120 的特定实施方案的元件的响应的额外描述和图式,且此材料在此以引用的方式并入。
窄频带编码器A120根据源-滤波器模型而实施,其将输入语音信号编码为(A) —
组描述滤波器的参数和(B)驱动所描述的滤波器产生输入语音信号的合成复制物的激 励信号。图5a展示语音信号的频谱包络的实例。表现此频谱包络的特征的峰值表示声 域的谐振且称为共振峰。大多数语音编码器至少将此粗略谱结构编码为一组参数(例如, 滤波器系数)。
图5b展示如应用于窄频带信号S20的频谱包络的编码的基础源-滤波器配置的实 例。分析模块计算描述对应于一段时间(通常20毫秒)内的语音声音的滤波器的一组 参数。根据那些滤波器参数配置的白化滤波器(也称为分析或预测误差滤波器)去除频 谱包络以对信号进行频谱整平。所得的白化信号(也称为残留)与原始语音信号相比, 具有较少能量且因此变化较小并且较易于编码。由于对残留信号编码引起的误差还可能 较均匀地散布在频谱上。滤波器参数和残留通常经过量化以用于在信道上有效传输。在 解码器处,根据滤波器参数配置的合成滤波器由基于残留的信号激励以产生原始语音声 音的合成版本。合成滤波器通常经配置以具有转移函数,所述转移函数是白化滤波器的 转移函数的反转形式。
图6展示窄频带编码器A120的基础实施方案A122的方块图。在此实例中,线性 预测编码(LPC)分析模块210将窄频带信号S20的频谱包络编码为一组线性预测(LP) 系数(例如,全极滤波器的系数1/A(z))。分析模块通常将输入信号处理为一系列非重叠 帧,其中为每一帧计算一组新的系数。帧周期通常是可预期信号在本地静止的周期;一 个常见实例为20毫秒(等效于8 kHz的取样速率下160个样本)。在一个实例中,LPC 分析模块210经配置以计算一组10个LP滤波器系数以描述每一 20毫秒帧的共振峰结 构。也可能实施分析模块以将输入信号处理为一系列重叠帧。
分析模块可经配置以直接分析每一帧的样本,或者可首先根据窗口函数(例如,汉 明窗口)对样本进行加权。也可在大于帧的窗口 (例如,30毫秒窗口)上执行分析。此 窗口可对称(例如5-20-5,使得其包含紧接着20毫秒帧之前和之后的5毫秒)或不对 称(例如10-20,使得其包含先前帧的最后IO毫秒)。LPC分析模块通常经配置以使用 Levinson-Durbin递归式或Leroux-Gueguen算法计算LP滤波器系数。在另一实施方案中, 分析模块可经配置以计算每一帧的一组倒谱系数而不是一组LP滤波器系数。
编码器A120的输出速率可通过量化滤波器系数而显著减小,且对复制质量的影响 相对较小。线性预测滤波器系数难以有效量化,且通常映射为另一表示形式,例如线谱 对(LSP)或线谱频率(LSF),以用于量化和/或熵编码。在图6的实例中,LP滤波器 系数-LSF变换220将所述组LP滤波器系数变换为一组相应的LSF。LP滤波器系数的其 它一对一表示形式包含部分自相关系数、对数面积比值、导抗谱对(ISP)和导抗谱频
率(ISF),其用于GSM (全球移动通信系统)AMR-WB (自适应多速宽频带)编译码 器中。通常, 一组LP滤波器系数与一组相应的LSF之间的变换是可逆的,但实施例还 包含变换不可在无误差情况下可逆的编码器A120实施方案。
量化器230经配置以量化所述组窄频带LSF (或其它系数表示形式),且窄频带编 码器A122经配置以输出此量化的结果作为窄频带滤波器参数S40。此量化器通常包含 向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
如图6所示,窄频带编码器A122还通过使窄频带信号S20通过根据所述组滤波器 系数配置的白化滤波器260 (也称为分析或预测误差滤波器)来产生残留信号。在此特 定实例中,白化滤波器260实施为FIR滤波器,但也可使用IIR实施方案。此残留信号 通常将含有窄频带滤波器参数S40中未表示的感觉上较重要的语音帧信息,例如与音调 有关的长期结构。量化器270经配置以计算此残留信号的量化表示形式以作为经编码的 窄频带激励信号S50输出。此量化器通常包含向量量化器,其将输入向量编码为对于表 或密码本中的相应向量条目的索引。或者,此量化器可经配置以发送一个或一个以上参 数,可在解码器处从所述参数中动态地产生向量,而不是如稀疏密码本方法中一样从存 储装置中检索向量。此方法用于例如代数CELP (密码本激励线性预测)的编码方案和 例如3GPP2 (第三代合作伙伴关系2) EVRC (增强可变速率编译码器)的编译码器中。
需要窄频带编码器A120根据将可用于相应窄频带解码器的相同滤波器参数值来产 生经编码窄频带激励信号。以此方式,所得的经编码窄频带激励信号可能已在某种程度 上考虑那些参数值的不理想性,例如量化误差。因此,需要使用将在解码器处可用的相 同系数值来配置白化滤波器。在如图6所示的编码器A122的基础实例中,反转量化器 240对窄频带编码参数S40解量化,LSF-LP滤波器系数变换250将所得值映射回一组相 应的LP滤波器系数,且此组系数用于配置白化滤波器260以产生由量化器270量化的 残留信号。
窄频带编码器A120的一些实施方案经配置以通过从一组密码本向量中识别出与残 留信号最佳匹配的一个向量来计算经编码窄频带激励信号S50。然而,注意到,窄频带 编码器A120也可经实施以计算残留信号的量化表示形式而不实际上产生残留信号。举 例来说,窄频带编码器A120可经配置以使用许多密码本向量来产生相应的合成信号(例 如,根据一组当前滤波器参数),并选择与感知加权域中和原始窄频带信号S20最佳匹 配的所产生信号相关联的密码本向量。
图7展示窄频带解码器B110的实施方案B112的方块图。反转量化器310对窄频带 滤波器参数S40解量化(在此情况下,解量化为一组LSF),且LSF-LP滤波器系数变换
320将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化 器240和变换250所描述)。反转量化器340对窄频带残留信号S40解量化以产生窄频 带激励信号S80。基于滤波器系数和窄频带激励信号S80,窄频带合成滤波器330合成 窄频带信号S90。换句话说,窄频带合成滤波器330经配置以根据解量化滤波器系数对 窄频带激励信号S80进行频谱成形,以产生窄频带信号S90。窄频带解码器B112还将 窄频带激励信号S80提供到高频带编码器A200,高频带编码器A200使用窄频带激励信 号S80来导出高频带激励信号S120,如本文所描述。在下文描述的一些实施方案中,窄 频带解码器B110可经配置以将与窄频带信号有关的额外信息(例如,频谱倾斜、音调 增益和滞后,以及语音模式)提供到高频带解码器B200。
窄频带编码器A122和窄频带解码器B112的系统是合成分析语音编译码器的基础实 例。密码本激励线性预测(CELP)编码是合成分析编码的一个普遍系列,且此类编码 器的实施方案可执行残留的波形编码,其中包含例如从固定和自适应密码本中选择条目 的操作、误差最小化操作和/或感知加权操作。合成分析编码的其它实施方案包含混合激 励线性预测(MELP)、代数CELP(ACELP)、松弛CELP(RCELP)、规则脉冲激励(RPE)、 多脉冲CELP (MPE)和向量和激励线性预测(VSELP)编码。相关编码方法包含多频 带激励(MBE)和原型波形内插(PWI)编码。标准合成分析语音编译码器的实例包含 使用残留激励线性预测(RELP)的ETSI(欧洲电信标准协会)GSM全速率编译码器(GSM 06.10)、 GSM增强全速率编译码器(ETSI-GSM 06.60)、 ITU (国际电信联盟)标准11.8 kb/s G.729 Annex E编码器、IS-136的IS (临时标准)641编译码器(时分多址方案)、 GSM自适应多速率(GSM-AMR)编译码器,禾q 4GVtm (第四代Vocoder )编译码器 (加州圣地亚哥市的高通公司(QUALCOMM Incorporated, San Diego, CA))。窄频带编 码器A120和相应的解码器B110可根据这些技术中的任一者或任何其它语音编码技术 (已知的或待开发的)实施,所述语音编码技术将语音信号表示为(A) —组描述滤波器 的参数和(B)用于驱动所描述的滤波器复制语音信号的激励信号。
即使在白化滤波器已从窄频带信号S20中去除粗略频谱包络之后,也可能保留相当 大量的精细谐波结构(尤其对于浊语音来说)。图8a展示浊音信号(例如,元音)的残 留信号(如可能由白化滤波器产生)的一个实例的频谱曲线。此实例中可见的周期性结 构与音调有关,且同一说话者发出的不同浊音可能具有不同的共振峰结构但具有类似的 音调结构。图8b展示此残留信号的实例的时域曲线,其展示音调脉冲的时间序列。
可通过使用一个或一个以上参数值编码音调结构的特性来增加编码效率和/或语音 质量。音调结构的一个重要特性是第一谐波的频率(也称为基频),其通常在60到400 Hz 范围内。此特性通常编码为基频的反转形式,也称为音调滞后(pitch lag)。音调滞后指 示一个音调周期中样本的数目,且可编码为一个或一个以上密码本索引。来自男性说话 者的语音信号往往比来自女性说话者的语音信号具有更大的音调滞后。
与音调结构有关的另一信号特性是周期性,其指示谐波结构的强度,或换句话说, 信号为谐波或非谐波的程度。周期性的两个典型指示符是零交叉和标准化自相关函数 (NACF)。周期性也可由音调增益来指示,所述音调增益通常编码为密码本增益(例如, 量化自适应密码本增益)。
窄频带编码器A120可包含经配置以编码窄频带信号S20的长期谐波结构的一个或 一个以上模块。如图9所示,可使用的一个典型CELP范例包含开放式回路LPC分析模 块,其编码短期特性或粗略频谱包络,之后是闭合式回路长期预测分析阶段,所述阶段 编码精细音调或谐波结构。短期特性编码为滤波器系数,且长期特性编码为例如音调滞 后和音调增益的参数的值。举例来说,窄频带编码器A120可经配置以便以包含一个或 一个以上密码本索引(例如,固定密码本索引和自适应密码本索引)和相应增益值的形 式输出经编码窄频带激励信号S50。窄频带残留信号的这种量化表示形式的计算(例如, 通过量化器270)可包含选择这些索引和计算这些值。音调结构的编码还可包含内插音 调原型波形,所述操作可包含计算连续音调脉冲之间的差。可针对对应于清语音(其通 常类似于噪声且未系统化)的帧禁用长期结构的建模。
根据图9所示的范例的窄频带解码器B110的实施方案可经配置以在长期结构(音 调或谐波结构)己恢复之后将窄频带激励信号S80输出到高频带解码器B200。举例来 说,此解码器可经配置以输出窄频带激励信号S80作为经编码窄频带激励信号S50的解 量化版本。当然,也可能实施窄频带解码器BllO,使得高频带解码器B200执行经编码 窄频带激励信号S50的解量化以获得窄频带激励信号S80。
在根据图9所示的范例的宽频带语音编码器A100的实施方案中,高频带编码器 A200可经配置以接收由短期分析或白化滤波器产生的窄频带激励信号。换句话说,窄 频带编码器A120可经配置以在编码长期结构之前将窄频带激励信号输出到高频带编码 器A200。然而,高频带编码器A200需要从窄频带信道接收将由高频带解码器B200接 收的相同编码信息,使得高频带编码器A200产生的编码参数可能已在某种程度上考虑 所述信息的不理想性。因此,可能优选的是,高频带编码器A200从待由宽频带语音编 码器A100输出的相同参数化和/或量化经编码窄频带激励信号S50中重建窄频带激励信 号S80。此方法的一个潜在优点是较准确地计算下文描述的高频带增益因数S60b。
除了描述窄频带信号S20的短期和/或长期结构的参数外,窄频带编码器A120还可 产生与窄频带信号S20的其它特性有关的参数值。这些值(其可能经适宜量化以由宽频 带语音编码器A100输出)可包含在窄频带滤波器参数S40中或单独输出。高频带编码 器A200也可经配置以根据这些额外参数中的一者或一者以上(例如,解量化之后)计 算高频带编码参数S60。在宽频带语音解码器B100处,高频带解码器B200可经配置以 经由窄频带解码器BllO (例如,解量化之后)接收参数值。或者,高频带解码器B200 可经配置以直接接收(且可能用于解量化)参数值。
在额外窄频带编码参数的一个实例中,窄频带编码器A120产生每一帧的频谱倾斜 和语音模式参数的值。频谱倾斜与通频带上频谱包络的形状有关,且通常由量化第一反 射系数表示。对于大多数浊音,频谱能量随着频率的不断增加而减小,使得第一反射系 数为负且可接近-1。大多数清音具有平整的频谱,从而使得第一反射系数接近零,或者 在高频率下具有较多能量,从而使得第一反射系数为正且可接近+1。
语音模式(也称为发声模式)指示当前帧表示浊语音还是清语音。此参数可具有二 进制值,其基于周期性的一个或一个以上指标(例如,零交叉、NACF、音调增益)和/ 或帧的声音活动(例如,此指标与阈值之间的关系)。在其它实施方案中,语音模式参 数具有一个或一个以上其它状态以指示例如无声或背景噪声或无声与浊语音之间的转
变的模式。
高频带编码器A200经配置以根据源-滤波器模型来编码高频带信号S30,其中此滤 波器的激励是基于经编码窄频带激励信号。图10展示高频带编码器A200的实施方案 A202的方块图,高频带编码器A200经配置以产生包含高频带滤波器参数S60a和高频 带增益因数S60b的高频带编码参数S60流。高频带激励发生器A300从经编码窄频带激 励信号S50中导出高频带激励信号S120。分析模块A210产生描述高频带信号S30的频 谱包络的一组参数值。在此特定实例中,分析模块A210经配置以执行LPC分析以便为 高频带信号S30的每一帧产生一组LP滤波器系数。线性预测滤波器系数-LSF变换410 将所述组LP滤波器系数变换为一组相应的LSF。如上文参照分析模块210和变换220 所述,分析模块A210和/或变换410可经配置以使用其它系数组(例如,倒谱系数)和 /或系数表示形式(例如,ISP)。
量化器420经配置以量化所述组高频带LSF (或其它系数表示形式,例如ISP),且 高频带编码器A202经配置以输出此量化的结果作为高频带滤波器参数S60a。此量化器 通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
高频带编码器A202还包含合成滤波器A220,其经配置以根据分析模块A210产生 的高频带激励信号S120和经编码频谱包络(例如,所述组LP滤波器系数)来产生合成
高频带信号S130。合成滤波器A220通常实施为IIR滤波器,但也可使用FIR实施方案。 在特定实例中,合成滤波器A220实施为六次线性自回归滤波器。
高频带增益因数计算器A230计算原始高频带信号S30与合成高频带信号S130的电 平之间的一个或一个以上差,以指定帧的增益包络。量化器430可实施为将输入向量编 码为对于表或密码本中的相应向量条目的索引的向量量化器,其量化指定增益包络的值 (一或多个),且高频带编码器A202经配置以输出此量化的结果作为高频带增益因数 S60b。
在如图IO所示的实施方案中,合成滤波器A220经配置以从分析模块A210接收滤 波器系数。高频带编码器A202的替代实施方案包含反转量化器和反转变换,其经配置 以从高频带滤波器参数S60a中解码滤波器系数,且在此情况下合成滤波器A220经配置 以改为接收经解码滤波器系数。此替代配置可支持由高频带增益计算器A230较准确地 计算增益包络。
在一个特定实例中,分析模块A210和高频带增益计算器A230分别每帧输出一组 六个LSF和一组五个增益值,使得可仅用每帧十一个额外值来实现窄频带信号S20的宽 频带延伸。耳朵对于高频率下的频率误差往往较不敏感,因而低LPC级的高频带编码可 产生具有可与较高LPC级的窄频带编码相比的感知质量的信号。高频带编码器A200的 典型实施方案可经配置以每帧输出8到12位用于频谱包络的高质量重建,以及每帧输 出另外8到12位用于时间包络的高质量重建。在另一特定实例中,分析模块A210每帧 输出一组八个LSF。
高频带编码器A200的一些实施方案经配置以通过以下方式产生高频带激励信号 S120:产生具有高频带频率分量的随机噪声信号,并根据窄频带信号S20、窄频带激励 信号S80或高频带信号S30的时域包络对噪声信号进行幅值调制。虽然这种基于噪声的 方法对于清音可产生适当结果,然而,其对于浊音可能不理想,浊音的残留通常为谐波 且因此具有某种周期性结构。
高频带激励发生器A300经配置以通过将窄频带激励信号S80的频谱延伸到高频带 频率范围中来产生高频带激励信号S120。图11展示高频带激励发生器A300的实施方 案A302的方块图。反转量化器450经配置以解量化经编码窄频带激励信号S50以产生 窄频带激励信号S80。频谱延伸器A400经配置以基于窄频带激励信号S80产生谐波延 伸信号S160。组合器470经配置以将噪声发生器480产生的随机噪声信号与包络计算器 460计算的时域包络组合以产生经调制噪声信号S170。组合器490经配置以将谐波延伸 信号S60与经调制噪声信号S170混合以产生高频带激励信号S120。
在一个实例中,频谱延伸器A400经配置以对窄频带激励信号S80执行频谱折叠操 作(也称为镜射)以产生谐波延伸信号S160。频谱折叠可由零塞入激励信号S80执行且 接着应用高通滤波器来保留伪信号。在另一实例中,频谱延伸器A400经配置以通过将 窄频带激励信号S80频谱转译到高频带中(例如,经由向上取样,之后与恒定频率余弦 信号相乘)来产生谐波延伸信号S160。
频谱折叠和转译方法可产生谐波结构在相位和/或频率上与窄频带激励信号S80的 原始谐波结构不连续的频谱延伸信号。举例来说,此类方法可产生具有通常不位于基频 的倍数处的峰值的信号,这可能在重建的语音信号中引起声音微弱的假象。这些方法往 往还产生具有不自然较强音调特性的高频率谐波。然而,因为PSTN信号可在8kHz下 取样但带宽被限制为不大于3400 Hz,所以窄频带激励信号S80的上部频谱可能含有极 少或不含有能量,使得根据频谱折叠或频谱转译操作产生的延伸信号可具有3400 Hz以 上的频谱缺陷。
产生谐波延伸信号S160的其它方法包含识别窄频带激励信号S80的一个或一个以 上基频,和根据所述信息产生谐音。举例来说,激励信号的谐波结构可由基频与幅值和 相位信息一起描述。高频带激励发生器A300的另一实施方案基于基频和幅值(例如, 如由音调滞后和音调增益指示)来产生谐波延伸信号S160。然而,除非谐波延伸信号与 窄频带激励信号S80在相位上相干,否则所得的经解码语音的质量可能不可接受。
可使用非线性函数来产生与窄频带激励相位上相干并保持谐波结构而没有相位不 连续性的高频带激励信号。非线性函数还可提供高频率谐波之间的增加的噪声电平,其 往往比通过例如频谱折叠和频谱转译的方法产生的音调高频率谐波听起来更为自然。可 由频谱延伸器A400的各种实施方案应用的典型无记忆非线性函数包含绝对值函数(也 称为全波整流)、半波整流、平方、立方和削波。频谱延伸器A400的其它实施方案可经 配置以应用具有记忆的非线性函数。
图12是频谱延伸器A400的实施方案A402的方块图,频谱延伸器A400经配置以 应用非线性函数来延伸窄频带激励信号S80的频谱。向上取样器510经配置以对窄频带 激励信号S80进行向上取样。可能需要对信号进行充分向上取样以使应用非线性函数时 的混叠最小化。在一个特定实例中,向上取样器510以8为因数对信号进行向上取样。 向上取样器510可经配置以通过对输入信号进行零塞入并对结果进行低通滤波来执行向 上取样操作。非线性函数计算器520经配置以将非线性函数应用于经向上取样信号。对 于频谱延伸(例如,平方)而言,绝对值函数相对于其它非线性函数的一个潜在优点是, 不需要能量标准化。在一些实施方案中,可通过剥离或清除每一样本的符号位来有效地
应用绝对值函数。非线性函数计算器520还可经配置以执行经向上取样或频谱延伸信号 的幅值偏差。
向下取样器530经配置以对应用非线性函数的频谱延伸结果进行向下取样。向下取 样器530可能需要执行带通滤波操作以在减小取样速率(例如,以便减小或避免由于不 必要图像引起的混叠或讹误)之前选择频谱延伸信号的所需频带。向下取样器530可能 还需要在一个以上阶段减小取样速率。
图12a是展示频谱延伸操作的一个实例中各点处的信号频谱的图,其中频率标度在 各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号 S80已被以8为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的延伸频谱 的实例。曲线(d)展示低通滤波之后的频谱。在此实例中,通频带延伸到高频带信号S30 的频率上限(例如,7kHz或8kHz)。
曲线(e)展示向下取样的第一阶段之后的频谱,其中使取样速率以4为因数减小以获 得宽频带信号。曲线(f)展示进行高通滤波操作以选择延伸信号的高频带部分之后的频 谱,且曲线(g)展示向下取样的第二阶段之后的频谱,其中使取样速率以2为因数减小。 在一个特定实例中,向下取样器530通过使宽频带信号通过滤波器组A112 (或具有相 同响应的其它结构或例行程序)的高通滤波器130和向下取样器140来执行高通滤波和 向下取样的第二阶段,以产生具有高频带信号S30的频率范围和取样速率的频谱延伸信 号。
如曲线(g)中可见,曲线(f)所示的高通信号的向下取样促使其频谱反转。在此实例中, 向下取样器530还经配置以对信号执行频谱翻转操作。曲线(h)展示应用频谱翻转操作的 结果,所述频谱翻转操作可通过将信号与函数,"或序列(-l)n相乘来执行,所述序列(-l)11 的值在+1与-1之间交替。此操作等效于在频域中将信号的数字频谱移位距离兀。注意到, 还可通过以不同次序应用向下取样和频谱翻转操作来获得相同结果。向上取样和/或向下 取样的操作还可经配置以包含再取样来获得具有高频带信号S30的取样速率(例如,7 kHz)的频谱延伸信号。
如上文注意到,滤波器组A110和B120可经实施使得窄频带和高频带信号S20、S30 中的一者或两者在滤波器组A110的输出处具有频谱反转形式,以频谱反转形式被编码 和解码,并在宽频带语音信号S110中输出之前在滤波器组B120处再次频谱反转。当然, 在此情况下,将不需要如图12a所示的频谱翻转操作,因为高频带激励信号S120将也 需要具有频谱反转形式。
频谱延伸器A402执行的频谱延伸操作的向上取样和向下取样的各个任务可以许多
不同方式配置和安排。举例来说,图12b是展示频谱延伸操作的另一实例中各点处的信 号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实 例的频谱。曲线(b)展示信号S80已被以2为因数向上取样之后的频谱。曲线(c)展示应用 非线性函数之后的延伸频谱的实例。在此情况下,接受较高频率中可能发生的混叠。
曲线(d)展示频谱反转操作之后的频谱。曲线(e)展示向下取样的单一阶段之后的频 谱,其中使取样速率以2为因数减小以获得所需频谱延伸信号。在此实例中,所述信号 采取频谱反转形式,且可用于处理采取此形式的高频带信号S30的高频带编码器A200 的实施方案中。
非线性函数计算器520产生的频谱延伸信号很可能随着频率增加而幅值明显降低。 频谱延伸器A402包含频谱整平器540,其经配置以对经向下取样信号执行白化操作。 频谱整平器540可经配置以执行固定白化操作或执行自适应白化操作。在自适应白化的 特定实例中,频谱整平器540包含LPC分析模块,其经配置以依据经向下取样信号计 算一组四个滤波器系数;以及四次分析滤波器,其经配置以根据那些系数对信号进行白 化。频谱延伸器A400的其它实施方案包含频谱整平器540在向下取样器530之前对频 谱延伸信号操作的配置。
可实施高频带激励发生器A300以输出谐波延伸信号S160作为高频带激励信号 S120。然而,在一些情况下,仅使用谐波延伸信号作为高频带激励可能导致可听到的假 象。语音的谐波结构在高频带中通常不如低频带中明显,且在高频带激励信号中使用过 多谐波结构可能导致嗡嗡声。此假象在来自女性说话者的语音信号中可能尤其明显。
实施例包含经配置以将谐波延伸信号S160与噪声信号混合的高频带激励发生器 A300的实施方案。如图ll所示,高频带激励发生器A302包含噪声发生器480,其经配 置以产生随机噪声信号。在一个实例中,噪声发生器480经配置以产生单位方差白色伪 随机噪声信号,但在其它实施方案中,噪声信号不需要为白色的且可具有随着频率变化 的功率密度。噪声发生器480可能需要经配置以输出噪声信号作为确定性函数以便可在 解码器处复制其状态。举例来说,噪声发生器480可经配置以输出噪声信号作为早先在 相同帧内编码的信息(例如,窄频带滤波器参数S40和/或经编码窄频带激励信号S50) 的确定性函数。
在与谐波延伸信号S160混合之前,噪声发生器480产生的随机噪声信号可经幅值 调制以具有近似窄频带信号S20、高频带信号S30、窄频带激励信号S80或谐波延伸信 号S160的随时间能量分布的时域包络。如图11所示,高频带激励发生器A302包含组 合器470,其经配置以根据包络计算器460计算的时域包络对噪声发生器480产生的噪
声信号进行幅值调制。举例来说,组合器470可实施为乘法器,其经设置以根据包络计 算器460计算的时域包络来缩放噪声发生器480的输出以产生经调制噪声信号S170。
如图13的方块图所示,在高频带激励发生器A302的实施方案A304中,包络计算 器460经设置以计算谐波延伸信号S160的包络。如图14的方块图所示,在高频带激励 发生器A302的实施方案A306中,包络计算器460经设置以计算窄频带激励信号S80 的包络。高频带激励发生器A302的另外的实施方案可以其它方式配置以根据窄频带音 调脉冲的位置及时向谐波延伸信号S160添加噪声。
包络计算器460可经配置以作为一项包含一系列子任务的任务而执行包络计算。图 15展示此任务的实例T100的流程图。子任务T110计算包络待建模的信号(例如,窄 频带激励信号S80或谐波延伸信号S160)的帧的每一样本的平方以产生平方值序列。子 任务T120对平方值序列执行平滑操作。在一个实例中,子任务T120根据以下表达式向 序列应用一次IIR低通滤波器-<formula>formula see original document page 24</formula> (1)
其中x是滤波器输入,y是滤波器输出,n是时域索引,且a是具有0.5与l之间的 值的平滑系数。平滑系数a的值可为固定的,或者在替代实施方案中,可根据输入信号 中噪声的指示而自适应,使得在无噪声的情况下a较接近1,且在存在噪声的情况下较 接近0.5。子任务T130将平方根函数应用于经平滑序列的每一样本以产生时域包络。
包络计算器460的此实施方案可经配置以按照串行和/或并行方式执行任务T100的 各个子任务。在任务T100的另外的实施方案中,子任务TUO之前可以是带通操作,其 经配置以选择包络待建模的信号的所需频率部分,例如3-4kHz范围。
组合器490经配置以将谐波延伸信号S160与经调制噪声信号S170混合以产生高频 带激励信号S120。组合器490的实施方案可经配置(例如)以将高频带激励信号S120 计算为谐波延伸信号S160与经调制噪声信号S170的和。组合器490的此实施方案可经 配置以通过在求和之前向谐波延伸信号S160和/或向经调制噪声信号S170应用加权因 数,而将高频带激励信号S120计算为加权总和。可根据一个或一个以上标准来计算每 一此类加权因数,且所述加权因数可为固定值,或者在逐帧或逐子帧基础上计算出的自 适应值。
图16展示组合器490的实施方案492的方块图,所述实施方案492经配置以将高 频带激励信号S120计算为谐波延伸信号S160与经调制噪声信号S170的加权总和。组
合器492经配置以根据谐波加权因数S180加权谐波延伸信号S160,根据噪声加权因数 S190加权经调制噪声信号S170,并输出高频带激励信号S120作为被加权信号的总和。 在此实例中,组合器492包含加权因数计算器550,其经配置以计算谐波加权因数S180 和噪声加权因数S190。
加权因数计算器550可经配置以根据高频带激励信号S120中谐波含量与噪声含量 的所需比率来计算加权因数S180和S190。举例来说,组合器492可能需要产生高频带 激励信号S120以具有与高频带信号S30的谐波能量与噪声能量比相似的谐波能量与噪 声能量比。在加权因数计算器550的一些实施方案中,根据与窄频带信号S20或窄频带 残留信号的周期性有关的一个或一个以上参数(例如,音调增益和/或语音模式)来计算 加权因数S180、 S190。加权因数计算器550的此实施方案可经配置以向谐波加权因数 S180指派(例如)与音调增益成正比的值,及/或对于清语音信号比对于浊语音信号向 噪声加权因数S190指派更高的值。
在其它实施方案中,加权因数计算器550经配置以根据高频带信号S30的周期性的 指标来计算谐波加权因数S180和/或噪声加权因数S190的值。在一个此类实例中,加 权因数计算器550将谐波加权因数S180计算为高频带信号S30的当前帧或子帧的自相 关系数的最大值,其中在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围内 执行自相关。图17展示以一个音调滞后的延迟为中心并具有不大于一个音调滞后的宽 度的长度为n个样本的此搜索范围的实例。
图17还展示加权因数计算器550在若干阶段计算高频带信号S30的周期性的指标 的另一方法的实例。在第一阶段,将当前帧划分为许多子帧,且针对每一子帧单独识别 自相关系数为最大时的延迟。如上文所提及,在包含一个音调滞后的延迟且不包含零样 本的延迟的搜索范围内执行自相关。
在第二阶段,通过将相应识别的延迟应用于每一子帧、连接所得的子帧以建立最佳 延迟帧、并将谐波加权因数S180计算为原始帧与最佳延迟帧之间的相关系数来建立延 迟帧。在另一替代实施方案中,加权因数计算器550将谐波加权因数S180计算为第一 阶段中针对每一子帧获得的最大自相关系数的平均值。加权因数计算器550的实施方案 还可经配置以縮放相关系数,和/或将其与另一值组合,以计算谐波加权因数S180的值。
加权因数计算器550可能需要仅在以其它方式指示帧存在周期性的情况下计算高频 带信号S30的周期性的指标。举例来说,加权因数计算器550可经配置以根据当前帧的 周期性的另一指示符(例如,音调增益)与阈值之间的关系来计算高频带信号S30的周 期性的指标。在一个实例中,加权因数计算器550经配置以仅当帧的音调增益(例如,
窄频带残留的自适应密码本增益)的值大于0.5 (或者,至少0.5)时才对高频带信号S30 执行自相关运算。在另一实例中,加权因数计算器550经配置以仅针对具有特定语音模 式状态的帧(例如,仅针对浊音信号)对高频带信号S30执行自相关运算。在此类情况 下,加权因数计算器550可经配置以针对具有其它语音模式状态和/或较小的音调增益值 的帧分派默认加权因数。
实施例包含经配置以根据不同于周期性或除周期性以外的特性来计算加权因数的 加权因数计算器550的另外的实施方案。举例来说,此实施方案可经配置以针对具有大 音调滞后的语音信号比针对具有小音调滞后的语音信号向噪声增益因数Sl卯分派更大 的值。加权因数计算器550的另一此类实施方案经配置以根据处于基频的倍数处的信号 能量相对于处于其它频率分量处的信号能量的指标,来确定宽频带语音信号S10或高频 带信号S30的谐度的指标。
宽频带语音编码器A100的一些实施方案经配置以基于本文描述的音调增益和/或周 期性或谐度的另一指标,来输出周期性或谐度的指示(例如,指示帧为谐波还是非谐波 的l位旗标)。在一个实例中,相应的宽频带语音解码器B100使用此指示来配置例如加 权因数计算的操作。在另一实例中,此指示用于编码器和/或解码器处来计算语音模式参 数的值。
可能需要高频带激励发生器A302产生高频带激励信号S120,使得激励信号的能量 大致不受加权因数S180和S190的特定值的影响。在此情况下,加权因数计算器550可 经配置以计算谐波加权因数S180或噪声加权因数S190的值(或从存储装置或高频带编 码器A200的另一元件接收此值),并根据例如以下表达式导出另一加权因数的值
(W谐波)2 + (W噪声)、1, (2)
其中W谐波表示谐波加权因数S180,且W噪声表示噪声加权因数S190。或者,加权 因数计算器550可经配置以根据当前帧或子帧的周期性测量的值从多对加权因数S180、 S190中选出相应一者,其中所述对经预先计算以满足例如表达式(2)的恒定能量比。 对于遵循表达式(2)的加权因数计算器550的实施方案,谐波加权因数S180的典型值 在约0.7到约l.O范围内,且噪声加权因数S190的典型值在约0.1到约0.7范围内。加 权因数计算器550的其它实施方案可经配置以根据依据谐波延伸信号S160与经调制噪 声信号S170之间的所需基线加权修改的表达式(2)型式来操作。
当已使用稀疏密码本(条目大部分为零值的密码本)来计算残留的量化表示形式时,
合成语音信号中可能发生假象。尤其当以低位速率编码窄频带信号时,会发生密码本稀 疏。密码本稀疏引起的假象通常在时间上是准周期性的,且主要在3kHz以上发生。因 为人耳在较高频率下具有较好的时间分辨能力,所以这些假象在高频带中可能较明显。
实施例包含经配置以执行抗稀疏滤波的高频带激励发生器A300的实施方案。图18 展示高频带激励发生器A302的实施方案A312的方块图,所述实施方案A312包含抗稀 疏滤波器600,其经配置以对反转量化器450产生的经解量化窄频带激励信号进行滤波。 图19展示高频带激励发生器A302的实施方案A314的方块图,所述实施方案A314包 含抗稀疏滤波器600,其经配置以对频谱延伸器A400产生的频谱延伸信号进行滤波。 图20展示高频带激励发生器A302的实施方案A316的方块图,所述实施方案A316包 含抗稀疏滤波器600,其经配置以对组合器490的输出进行滤波以产生高频带激励信号 S120。当然,预期并在此明确地揭示将实施方案A304和A306的任一者的特征与实施 方案A312、 A314和A316的任一者的特征组合的高频带激励发生器A300的实施方案。 抗稀疏滤波器600也可配置在频谱延伸器A400内例如在频谱延伸器A402中的元件 510、 520、 530和540的任一者之后。特别注意到,抗稀疏滤波器600也可用于频谱延 伸器A400的执行频谱折叠、频谱转译或谐波延伸的实施方案。
抗稀疏滤波器600可经配置以改变其输入信号的相位。举例来说,抗稀疏滤波器600 可能需要经配置和安排,使得高频带激励信号S120的相位随着时间随机化或其它方式 更为均匀地分布。可能还需要抗稀疏滤波器600的响应为频谱整平的,使得经滤波信号 的幅值频谱不会有相当大的改变。在一个实例中,抗稀疏滤波器600根据以下表达式实 施为具有转移函数的全通滤波器
<formula>formula see original document page 27</formula>
(3)
此滤波器的一个作用可以是将输入信号的能量散布开使得其不再仅集中于几个样 本中。
密码本稀疏引起的假象通常对于其中残留包含较少音调信息的类似噪声的信号较 明显,且对于背景噪声中的语音也较明显。稀疏在激励具有长期结构的情况下通常引起 较少假象,且事实上相位修改可引起浊音信号中的噪声。因此,可能需要配置抗稀疏滤 波器600以对清音信号进行滤波并在不作出改变的情况下使至少一些浊音信号通过。清 音信号的特征在于低音调增益(例如,量化窄频带自适应密码本增益)和接近零或为正的频谱倾斜(例如,量化第一反射系数),从而指示整平或随着频率的不断增加而向上 倾斜的频谱包络。抗稀疏滤波器600的典型实施方案经配置以对清音(例如,如频谱倾 斜的值所指示)进行滤波,当音调增益低于阈值(或者,不大于阈值)时对浊音进行滤 波,且否则在不作出改变的情况下使信号通过。
抗稀疏滤波器600的另外的实施方案包含两个或两个以上滤波器,其经配置以具有 不同的最大相位修改角(例如,高达180度)。在此情况下,抗稀疏滤波器600可经配 置以根据音调增益(例如,量化自适应密码本或LTP增益)的值在这些组成滤波器中进 行选择,以便将较大的最大相位修改角用于具有较低音调增益值的帧。抗稀疏滤波器600 的实施方案还可包含不同的组成滤波器,其经配置以在频谱的或多或少的部分上修改相 位,以便将经配置以在输入信号的较宽频率范围上修改相位的滤波器用于具有较低音调 增益值的帧。
为了准确地复制经编码语音信号,可能需要使合成宽频带语音信号S100的高频带 与窄频带部分的电平之间的比率类似于原始宽频带语音信号S10中的所述比率。除了高 频带编码参数S60a表示的频谱包络外,高频带编码器A200还可经配置以通过指定时间 或增益包络来表示高频带信号S30的特征。如图IO所示,高频带编码器A202包含高频 带增益因数计算器A230,其经配置和安排以根据高频带信号S30与合成高频带信号S130 之间的关系(例如,所述两个信号在帧或其某一部分上的能量之间的差或比率)来计算 一个或一个以上增益因数。在高频带编码器A202的其它实施方案中,高频带增益计算 器A230可同样地配置但改为经安排以根据高频带信号S30与窄频带激励信号S80或高 频带激励信号S120之间的这种时间变化关系来计算增益包络。
窄频带激励信号S80和高频带信号S30的时间包络很可能类似。因此,编码基于高 频带信号S30与窄频带激励信号S80 (或从中导出的信号,例如高频带激励信号S120 或合成高频带信号S130)之间的关系的增益包络通常将比编码仅基于高频带信号S30 的增益包络有效。在典型实施方案中,高频带编码器A202经配置以输出为每一帧指定 5个增益因数的8到12位的量化索引。
高频带增益因数计算器A230可经配置以作为一项包含一个或一个以上系列的子任 务的任务而执行增益因数计算。图21展示根据高频带信号S30与合成高频带信号S130 的相对能量计算相应子帧的增益值的任务的实例T200的流程图。任务220a和220b计 算各个信号的相应子帧的能量。举例来说,任务220a和220b可经配置以将能量计算为 各个子帧的样本的平方的和。任务T230将子帧的增益因数计算为那些能量的比率的平 方根。在此实例中,任务T230将增益因数计算为子帧上高频带信号S30的能量与合成
高频带信号S130的能量的比率的平方根。
高频带增益因数计算器A230可能需要经配置以根据窗口函数来计算子帧能量。图 22展示增益因数计算任务T200的此实施方案T210的流程图。任务T215a将窗口函数 应用于高频带信号S30,且任务T215b将相同窗口函数应用于合成高频带信号S130。任 务220a和220b的实施方案222a和222b计算各自窗口的能量,且任务T230将子帧的 增益因数计算为能量的比率的平方根。
可能需要应用与邻近子帧重叠的窗口函数。举例来说,可以重叠-相加方式应用的产 生增益因数的窗口函数可帮助减小或避免子帧之间的不连续性。在一个实例中,高频带 增益因数计算器A230经配置以应用如图23a所示的梯形窗口函数,其中窗口与两个邻 近子帧的每一者重叠一毫秒。图23b展示将此窗口函数应用于20毫秒帧的五个子帧的 每一者。高频带增益因数计算器A230的其它实施方案可经配置以应用具有不同重叠周 期和/或不同窗口形状(例如,矩形、汉明)(其可对称或不对称)的窗口函数。高频带 增益因数计算器A230的实施方案还可能经配置以将不同窗口函数应用于帧内的不同子 帧和/或包含具有不同长度的子帧的帧。
提供以下值(没有限制)作为特定实施方案的实例。针对这些情况假定一个20毫 秒的帧,但可使用任何其它持续时间。对于以7kHz取样的高频带信号,每一帧具有140 个样本。如果将此帧划分为具有相等长度的五个子帧,那么每一子帧将具有28个样本, 且如图23a所示的窗口将为42个样本宽。对于以8kHz取样的高频带信号,每一帧具有 160个样本。如果此帧划分为具有相等长度的五个子帧,那么每一子帧将具有32个样本, 且如图23a所示的窗口将为48个样本宽。在其它实施方案中,可使用具有任何宽度的 子帧,且甚至可能使高频带增益计算器A230的实施方案经配置以针对帧的每一样本产 生不同的增益因数。
图24展示高频带解码器B200的实施方案B202的方块图。高频带解码器B202包 含高频带激励发生器B300,其经配置以基于窄频带激励信号S80产生高频带激励信号 S120。视特定系统设计选择而定,可根据本文描述的高频带激励发生器A300的实施方 案的任一者来实施高频带激励发生器B300。通常,需要将高频带激励发生器B300实施 为具有与特定编码系统的高频带编码器的高频带激励发生器相同的响应。然而,因为窄 频带解码器B110通常将执行经编码窄频带激励信号S50的解量化,所以在大多数情况 下,高频带激励发生器B300可实施为从窄频带解码器B110接收窄频带激励信号S80, 而不需要包含经配置以对经编码窄频带激励信号S50解量化的反转量化器。窄频带解码 器B110也可实施为包含抗稀疏滤波器600的实例,其经设置以在将经解量化的窄频带
激励信号输入到例如滤波器330的窄频带合成滤波器之前对所述信号进行滤波。
反转量化器560经配置以对高频带滤波器参数S60a (在此实例中为一组LSF)解量 化,且LSF-LP滤波器系数变换570经配置以将LSF变换为一组滤波器系数(例如,如 上文参照窄频带编码器A122的反转量化器240和变换250所描述)。在其它实施方案中, 如上文所提及,可使用不同系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。 高频带合成滤波器B200经配置以根据高频带激励信号S120和所述组滤波器系数产生合 成高频带信号。对于其中高频带编码器包含合成滤波器的系统(例如,如在上述编码器 A202的实例中),可能需要将高频带合成滤波器B200实施为具有与所述合成滤波器相 同的响应(例如,相同转移函数)。
高频带解码器B202还包含经配置以对高频带增益因数S60b解量化的反转量化器 580,和经配置和安排以将经解量化的增益因数应用于合成高频带信号以产生高频带信 号S100的增益控制元件590 (例如,乘法器或放大器)。对于其中帧的增益包络由一个 以上增益因数指定的情况,增益控制元件590可包含经配置以可能根据窗口函数将增益 因数应用于各个子帧的逻辑,所述窗口函数可与由相应高频带编码器的增益计算器(例 如,高频带增益计算器A230)应用的窗口函数相同或不同。在高频带解码器B202的其 它实施方案中,增益控制元件590经类似地配置但经安排以改为将经解量化的增益因数 应用于窄频带激励信号S80或应用于高频带激励信号S120。
如上文所提及,可能需要在高频带编码器与高频带解码器中获得相同状态(例如, 通过在编码期间使用经解量化值)。因此,可能需要在根据此实施方案的编码系统中确 保高频带激励发生器A300和B300中的相应噪声发生器具有相同状态。举例来说,此实 施方案的高频带激励发生器A300和B300可经配置而使得噪声发生器的状态是相同帧内 已编码的信息(例如,窄频带滤波器参数S40或其一部分,和/或经编码窄频带激励信号 S50或其一部分)的确定性函数。
本文描述的元件的量化器中的一者或一者以上(例如,量化器230、 420或430)可 经配置以执行分类向量量化。举例来说,此量化器可经配置以基于窄频带信道中和/或高 频带信道中的相同帧内已编码的信息从一组密码本中选出一个密码本。此技术通常以存 储额外的密码本为代价提供增加的编码效率。
如上文参看例如图8和9所论述,在从窄频带语音信号S20中去除粗略频谱包络之 后,相当大量的周期性结构可能保留在残留信号中。举例来说,残留信号可随时间而含 有粗略周期性脉冲或尖峰信号序列。此结构(通常与音调有关)尤其有可能发生在浊音 语音信号中。窄频带残留信号的量化表示形式的计算可包含根据由(例如) 一个或一个
以上密码本表示的长期周期性的模型来编码此音调结构。
实际残留信号的音调结构可能不与周期性模型完全匹配。举例来说,残留信号可能 包含音调脉冲的位置规则性的较小抖动,使得帧中连续音调脉冲之间的距离不完全相等 且所述结构并非相当规则。这些不规则性往往会降低编码效率。
窄频带编码器A120的一些实施方案经配置以通过在量化之前或期间将自适应时间 偏差应用于残留,或通过以其它方式在经编码激励信号中包含自适应时间偏差,来执行 音调结构的规则化。举例来说,此编码器可经配置以选择或以其它方式计算时间偏差的 程度(例如,根据一个或一个以上感知加权和/或误差最小化标准),使得所得的激励信 号与长期周期性的模型最佳拟和。音调结构的规则化由称为松弛代码激励线性预测 (RCELP)编码器的CELP编码器子组执行。
RCELP编码器通常经配置以执行时间偏差作为自适应时移。此时移可为负几毫秒到 正几毫秒范围的延迟,且其通常平滑地变化以避免可听到的不连续性。在一些实施方案 中,此编码器经配置以用分段方式应用规则化,其中每一帧或子帧偏差相应的固定时移。 在其它实施方案中,编码器经配置以应用规则化作为连续偏差函数,使得帧或子帧根据 音调轮廓(也称为音调轨迹)而偏差。在一些情况下(例如,如第2004/0098255号美国 专利申请公开案中所描述),编码器经配置以通过将偏移应用于用于计算经编码激励信 号的感知加权输入信号而在经编码激励信号中包含时间偏差。
编码器计算规则化和量化的经编码激励信号,且解码器对经编码激励信号解量化以 获得用于合成经解码语音信号的激励信号。经解码输出信号因此展现出与通过规则化而 包含在经编码激励信号中的延迟相同的变化的延迟。通常,不将任何指定规则化量的信 息传输到解码器。
规则化往往使残留信号较易编码,这改进了来自长期预测器的编码增益且因此推进 了总体编码效率,而通常不会产生假象。可能需要仅对浊音帧执行规则化。举例来说, 窄频带编码器A124可经配置以仅偏移那些具有长期结构(例如,浊音信号)的帧或子 帧。甚至可能需要仅对包含音调脉冲能量的子帧执行规则化。第5,704,003号美国专利 (Kleijn等人)和第6,879,955号美国专利(Rao)和第2004/0098255号美国专利申请公 开案(Kovesi等人)中描述了 RCELP编码的各种实施方案。RCELP编码器的现有实施 方案包含如电信工业协会(TIA) IS-127中所描述的增强可变速率编译码器(EVRC), 和第三代合作伙伴关系计划2 (3GPP2)可选模式声码器(SMV)。
不幸的是,规则化对于其中从经编码窄频带激励信号导出高频带激励的宽频带语音 编码器(例如,包含宽频带语音编码器A100和宽频带语音解码器B100的系统)可能导
致若干问题。由于高频带激励信号是从时间偏差信号导出的,所以高频带激励信号通常 将具有与原始高频带语音信号的时间特性不同的时间特性。换句话说,高频带激励信号 将不再与原始高频带语音信号同步。
偏差高频带激励信号与原始高频带语音信号之间的时间上的不对准可能引起若干 问题。举例来说,偏差高频带激励信号可能不再为根据从原始高频带语音信号中提 取的滤波器参数配置的合成滤波器提供适宜的源激励。因此,合成高频带信号可含有减 小经解码宽频带语音信号的感知质量的可听到的假象。
时间上的不对准还可能引起增益包络编码的低效率。如上文所提及,窄频带激励^f言 号S80与高频带信号S30的时间包络之间很可能存在相关。通过根据这两个时间包络之 间的关系编码高频带信号的增益包络,与直接编码增益包络相比可实现编码效率的提 高。然而,当经编码窄频带激励信号规则化时,此相关可能削弱。窄频带激励信号S80 与高频带信号S30之间的时间上的不对准可导致高频带增益因数S60b中出现波动,且 编码效率可能降低。
实施例包含根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号 执行时间偏差的宽频带语音编码方法。此类方法的潜在优点包含改进经解码宽频带语音 信号的质量和/或改进编码高频带增益包络的效率。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。编码器AD10包含 窄频带编码器A120的实施方案A124,所述实施方案A124经配置以在计算经编码窄频 带激励信号S50期间执行规则化。举例来说,窄频带编码器A124可根据上文论述的 RCELP实施方案中的一者或一者以上配置。
窄频带编码器A124还经配置以输出指定所应用的时间偏差的程度的规则化数据^f言 号SD10。对于窄频带编码器A124经配置以将固定时移应用于每一帧或子帧的各种情7兄, 规则化数据信号SD10可包含一系列值,其以样本、毫秒或某一其它时间增量为单位将 每一时移量指示为整数或非整数值。对于窄频带编码器A124经配置以用其它方式修改 帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)的情况,规 则化信息信号SD10可包含对修改的相应描述,例如一组函数参数。在一个特定实例中, 窄频带编码器A124经配置以将帧划分为三个子帧并计算每一子帧的固定时移,使得规 则化数据信号SD10指示经编码窄频带信号的每一规则化帧的三个时移量。
宽频带语音编码器AD10包含延迟线D120,其经配置以根据由输入信号指示的延迟 量来推进或阻滞高频带语音信号S30的若干部分,从而产生时间偏差高频带语音信号 S30a。在图25所示的实例中,延迟线D120经配置以根据由规则化数据信号SD10指示
的偏差来对高频带语音信号S30执行时间偏差。以此方式,经编码窄频带激励信号S50 中包含的相同时间偏差量也在分析之前应用于高频带语音信号S30的相应部分。尽管此 实例将延迟线D120展示为高频带编码器A200的单独元件,但在其它实施方案中,延 迟线D120配置为高频带编码器的一部分。
高频带编码器A200的另外的实施方案可经配置以执行未偏差高频带语音信号S30 的频谱分析(例如,LPC分析),并在计算高频带增益参数S60b之前执行高频带语音信 号S30的时间偏差。此编码器可包含(例如)经配置以执行时间偏差的延迟线D120的 实施方案。然而,在此类情况下,基于对未偏差信号S30的分析的高频带滤波器参数S60a 可描述与高频带激励信号S120在时间上不对准的频谱包络。
延迟线D120可根据适于将所需时间偏差操作应用于高频带语音信号S30的逻辑元 件与存储元件的任何组合来配置。举例来说,延迟线D120可经配置以根据所需的时移 从缓冲器中读取高频带语音信号S30。图26a展示延迟线D120的此实施方案D122的示 意图,所述延迟线D120包含移位寄存器SR1。移位寄存器SR1是经配置以接收和存储 高频带语音信号S30的m个最新近样本的具有大约长度m的缓冲器。值m至少等于将 支持的最大正(或"推进")与负(或"阻滞")时移的总和。值m等于高频带信号S30 的帧或子帧的长度可能会较方便。
延迟线D122经配置以从移位寄存器SR1的偏移位置OL输出时间偏差高频带信号 S30a。偏移位置OL的定位根据由例如规则化数据信号SD10指示的当前时移而在参考 位置(零时移)附近变化。延迟线D122可经配置以支持相等的推进和阻滞限制,或者 一个限制大于另一限制,使得可在一个方向上比在另一方向上执行更大偏移。图26a展 示支持的正时移大于负时移的特定实例。延迟线D122可经配置以一次输出一个或一个 以上样本(例如视输出总线宽度而定)。
具有大于几毫秒的量值的规则化时移可引起经解码信号中的可听到的假象。通常, 由窄频带编码器A124执行的规则化时移的量值将不超过几毫秒,使得由规则化数据信 号SD10指示的时移将有限。然而,在此类情况下可能需要延迟线D122经配置以对正 和/或负方向上的时移强加最大限制(例如,以遵循比窄频带编码器强加的限制更为严格 的限制)。
图26b展示延迟线D122的实施方案D124的示意图,延迟线D122包含移位窗口 SW。在此实例中,偏移位置OL的定位受移位窗口 SW限制。尽管图26b展示缓冲器长 度m大于移位窗口 SW的宽度的情况,但延迟线D124也可经实施使得移位窗口 SW的 宽度等于m。
在其它实施方案中,延迟线D120经配置以根据所需时移将高频带语音信号S30写 入到缓冲器。图27展示延迟线D120的实施方案D130的示意图,所述实施方案D130 包含经配置以接收和存储高频带语音信号S30的两个移位寄存器SR2和SR3。延迟线 D130经配置以根据例如由规则化数据信号SD10指示的时移而将来自移位寄存器SR2 的帧或子帧写入到移位寄存器SR3。移位寄存器SR3配置为FIFO缓冲器,其经配置以 输出时间偏差高频带信号S30。
在图27所示的特定实例中,移位寄存器SR2包含帧缓冲器部分FBI和延迟缓冲器 部分DB,且移位寄存器SR3包含帧缓冲器部分FB2、推进缓冲器部分AB和阻滞缓冲 器部分RB。推进缓冲器AB和阻滞缓冲器RB的长度可相等,或者其中一者可大于另一 者,使得所支持的一个方向上的偏移大于所支持的另一方向上的偏移。延迟缓冲器DB 和阻滞缓冲器部分RB可经配置以具有相同长度。或者,延迟缓冲器DB可比阻滞缓冲 器RB短以考虑到将样本从帧缓冲器FBI转移到移位寄存器SR3所需的时间间隔,所述 转移可包含例如在存储到移位寄存器SR3之前先使样本偏差的其它处理操作。
在图27的实例中,帧缓冲器FBI经配置以具有与高频带信号S30的一个帧的长度 相等的长度。在另一实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个子帧 的长度相等的长度。在此情况下,延迟线D130可经配置以包含用于将相同(例如,平 均)延迟应用于待偏移的帧的所有子帧的逻辑。延迟线D130还可包含用于将来自帧缓 冲器FBI的值与阻滞缓冲器RB或推进缓冲器AB中待重写的值进行平均的逻辑。在另 一实例中,移位寄存器SR3可经配置以仅经由帧缓冲器FB1接收高频带信号S30的值, 且在此情况下,延迟线D130可包含用于在写入到移位寄存器SR3的连续帧或子帧之间 的间隙上进行内插的逻辑。在其它实施方案中,延迟线D130可经配置以在将来自帧缓 冲器FBI的样本写入到移位寄存器SR3之前对所述样本执行偏差操作(例如,根据由 规则化数据信号SD10描述的函数)。
延迟线D120可能需要应用基于但不等同于由规则化数据信号SD10指定的偏差的 时间偏差。图28展示宽频带语音编码器AD10的实施方案AD12的方块图,宽频带语音 编码器ADIO包含延迟值映射器DllO。延迟值映射器D10经配置以将由规则化数据信 号SDIO指示的偏差映射为经映射延迟值SD10a。延迟线D120经配置以根据由经映射 延迟值SD10a指示的偏差来产生时间偏差高频带语音信号S30a。
可预期窄频带编码器应用的时移随时间平滑地进展。因此,通常计算语音帧期间应 用于子帧的平均窄频带时移并根据此平均值来偏移高频带语音信号S30的相应帧已足 够。在一个此类实例中,延迟值映射器D110经配置以计算每一帧的子帧延迟值的平均
值,且延迟线D120经配置以将计算出的平均值应用于高频带信号S30的相应帧。在其 它实例中,可计算和应用较短周期(例如,两个子帧,或半个帧)或较长周期(例如, 两个帧)内的平均值。在平均值是样本的非整数值的情况下,延迟值映射器D110可经 配置以在将所述值输出到延迟线D120之前将所述值四舍五入为样本的整数数目。
窄频带编码器A124可经配置以在经编码窄频带激励信号中包含非整数数目的样本 的规则化时移。在此情况下,延迟值映射器D110可能需要经配置以将窄频带时移四舍 五入为样本的整数数目,且延迟线D120可能需要将经四舍五入的时移应用于高频带语 音信号S30。
在宽频带语音编码器AD10的一些实施方案中,窄频带语音信号S20与高频带语音 信号S30的取样速率可能不同。在此类情况下,延迟值映射器D110可经配置以调节规 则化数据信号SD10中指示的时移量,以考虑窄频带语音信号S20 (或窄频带激励信号 S80)与高频带语音信号S30的取样速率之间的差异。举例来说,延迟值映射器D110 可经配置以根据取样速率的比率縮放时移量。在上文提及的一个特定实例中,以8kHz 对窄频带语音信号S20进行取样,且以7kHz对高频带语音信号S30进行取样。在此情 况下,延迟值映射器D110经配置以将每一偏移量乘以7/8。延迟值映射器D110的实施 方案还可经配置以执行此缩放运算以及本文描述的整数四舍五入和/或时移平均运算。
在另外的实施方案中,延迟线D120经配置以用其它方式修改帧或其它样本序列的 时间标度(例如,通过压縮一个部分并扩展另一部分)。举例来说,窄频带编码器A124 可经配置以根据例如音调轮廓或轨迹的函数来执行规则化。在此情况下,规则化数据信 号SD10可包含对所述函数的相应描述(例如一组参数),且延迟线D120可包含经配置 以根据所述函数对高频带语音信号S30的帧或子帧执行偏差的逻辑。在其它实施方案中, 延迟值映射器D110经配置以在将所述函数通过延迟线D120应用于高频带语音信号S30 之前对所述函数进行平均、縮放和/或四舍五入。举例来说,延迟值映射器D110可经配 置以根据所述函数计算一个或一个以上延迟值,每一延迟值指示样本数目,其接着由延 迟线D120应用以对高频带语音信号S30的一个或一个以上相应帧或子帧执行时间偏差。
图29展示根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执 行时间偏差的方法MDIOO的流程图。任务TDIOO处理宽频带语音信号以获得窄频带语 音信号和高频带语音信号。举例来说,任务TD100可经配置以使用具有低通滤波器和高 通滤波器的滤波器组(例如滤波器组A110的实施方案)对宽频带语音信号进行滤波。 任务TD200将窄频带语音信号至少编码为经编码的窄频带激励信号和多个窄频带滤波 器参数。所述经编码的窄频带激励信号和/或滤波器参数可量化,且经编码的窄频带激励 信号还可包含例如语音模式参数的其它参数。任务TD200还包含经编码的窄频带激励信 号中的时间偏差。
任务TD300基于窄频带激励信号产生高频带激励信号。在此情况下,窄频带激励信 号基于经编码的窄频带激励信号。任务TD400根据至少所述高频带激励信号,将高频带 语音信号至少编码为多个高频带滤波器参数。举例来说,任务TD400可经配置以将高频 带语音信号编码为多个量化LSF。任务TD500将时移应用于高频带语音信号,所述时移 基于与经编码窄频带激励信号中包含的时间偏差有关的信息。
任务TD400可经配置以对高频带语音信号执行频谱分析(例如,LPC分析),且/ 或计算高频带语音信号的增益包络。在此类情况下,任务TD500可经配置以在所述分析 和/或增益包络计算之前将时移应用于高频带语音信号。
宽频带语音编码器A100的其它实施方案经配置以将由经编码窄频带激励信号中包 含的时间偏差引起的高频带激励信号S120的时间偏差反转。举例来说,高频带激励发 生器A300可经实施以包含延迟线D120的实施方案,延迟线D120的所述实施方案经配 置以接收规则化数据信号SD10或经映射延迟值SD10a,并将相应的反转时移应用于窄 频带激励信号S80,且/或应用于基于所述窄频带激励信号S80的随后信号(例如,谐波 延伸信号S160或高频带激励信号S120)。
另外的宽频带语音编码器实施方案可经配置以彼此独立地对窄频带语音信号S20和 高频带语音信号S30进行编码,使得高频带语音信号S30被编码为高频带频谱包络和高 频带激励信号的表示形式。此实施方案可经配置以根据与经编码窄频带激励信号中包含 的时间偏差有关的信息对高频带残留信号执行时间偏差,或用其它方式将时间偏差包含 在经编码高频带激励信号中。举例来说,高频带编码器可包含本文描述的经配置以将时 间偏差应用于高频带残留信号的延迟线D120和/或延迟值映射器D110的实施方案。此 操作的潜在优点包含对高频带残留信号的较有效编码,和合成窄频带与高频带语音信号 之间的较好匹配。
如上文所提及,本文描述的实施例包含可用于执行嵌入式编码的实施方案、支持与 窄频带系统的兼容性并避免需要代码转换。对高频带编码的支持还可用于按照成本来区 分具有宽频带支持与向后兼容性的芯片、芯片组、装置和/或网络与仅具有窄频带支持的 芯片、芯片组、装置和/或网络。如本文所描述的对高频带编码的支持也可与用于支持低 频带编码的技术结合使用,且根据此实施例的系统、方法或设备可支持对例如约50或 100 Hz —直到约7或8 kHz的频率分量的编码。
如上文所提及,向语音编码器添加高频带支持可改进清晰度,尤其是在摩擦音的区
分方面。尽管这种区分通常可能由人类收听者根据特定上下文推导出来,但高频带支持 可在语音识别和其它机器解译应用(例如用于自动化语音菜单导航和/或自动呼叫处理的 系统)中充当启用特征。
根据一实施例的设备可嵌入到便携式无线通信装置(例如,蜂窝式电话或个人数字 助理(PDA))中。或者,此设备可包含在另一通信装置中,例如VoIP手机、经配置以 支持VoIP通信的个人计算机或经配置以路由电话或VoIP通信的网络装置。举例来说, 根据一实施例的设备可实施在通信装置的芯片或芯片组中。视特定应用而定,此装置还
可包含例如以下特征对语音信号的模拟-数字和/或数字-模拟转换、用于对语音信号执
行放大和/或其它信号处理操作的电路,和/或用于发射和/或接收经编码语音信号的射频 电路。
明确预期且揭示实施例可包含第60/667,901号和第60/673,965号美国临时专利申请 案中揭示的其它特征中的任一者或一者以上且/或与其一起使用,本申请案中主张所述临 时专利申请案的权益。此类特征包含去除发生于高频带中且在窄频带中大体上不存在的 具有短持续时间的高能量突发。此类特征包含例如高频带LSF的系数表示形式的固定或 自适应平滑。此类特征包含与例如LSF的系数表示形式的量化相关联的噪声的固定或自 适应成形。此类特征还包含增益包络的固定或自适应平滑,以及增益包络的自适应衰减。
提供对所描述实施例的以上介绍以便使所属领域的技术人员能够制造或使用本发 明。可能对这些实施例作出各种修改,且本文提供的一般原理也可应用于其它实施例。 举例来说,实施例可部分或整体地实施为硬连线电路,实施为制造到专用集成电路中的 电路配置,或者实施为作为机器可读代码加载到非易失性存储装置中的固件程序、或从 数据存储媒体加载或加载到数据存储媒体中的软件程序,所述代码为可由例如微处理器 或其它数字信号处理单元的逻辑元件阵列执行的指令。数据存储媒体可为存储元件阵 列,例如半导体存储器(其可包含(不限于)动态或静态RAM(随机存取存储器)、ROM (只读存储器)和/或快闪RAM),或铁电、磁阻、双向开关半导体、聚合物或相变存储 器;或者例如磁盘或光盘的圆盘式媒体。术语"软件"应理解为包含源代码、汇编语言 代码、机器代码、二进制代码、固件、宏代码、微码、可由逻辑元件阵列执行的任何一 个或一个以上指令组或序列,以及此类实例的任何组合。
高频带激励发生器A300和B300、高频带编码器A100、高频带解码器B200、宽频 带语音编码器A100和宽频带语音解码器B100的实施方案的各种元件可实施为(例如) 驻存在芯片组中的同一芯片上或两个或两个以上芯片之间的电子和/或光学装置,但也预 期存在没有此限制的其它配置。此设备的一个或一个以上元件可整体或部分地实施为一
个或一个以上指令组,所述指令组经配置以在一个或一个以上固定或可编程逻辑元件 (例如,晶体管、门)阵列上执行,所述元件例如为微处理器、内嵌式处理器、IP核心、 数字信号处理器、FPGA (场可编程门阵列)、ASSP (专用标准产品)和ASIC (专用集 成电路)。 一个或一个以上此类元件也可能具有共同结构(例如,用于在不同时间执行 对应于不同元件的代码部分的处理器、经执行以在不同时间执行对应于不同元件的任务 的指令组,或者在不同时间针对不同元件执行操作的电子和/或光学装置的配置)。此外, 一个或一个以上此类元件可能用于执行与设备的操作并不直接相关的任务或其它指令 组,例如与内嵌有所述设备的装置或系统的另一操作相关的任务。
图30展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带 部分进行编码的方法M100的流程图。任务X100计算表征高频带部分的频谱包络的一 组滤波器参数。任务X200通过将非线性函数应用于从窄频带部分导出的信号来计算频 谱延伸信号。任务X300根据(A)所述组滤波器参数和(B)基于所述频谱延伸信号的 高频带激励信号来产生合成高频带信号。任务X400基于(C)高频带部分的能量与(D) 从窄频带部分导出的信号的能量之间的关系来计算增益包络。
图31a展示根据一实施例产生高频带激励信号的方法M200的流程图。任务YIOO 通过将非线性函数应用于从语音信号的窄频带部分导出的窄频带激励信号来计算经谐 波延伸信号。任务Y200将经谐波延伸信号与经调制噪声信号混合以产生高频带激励信 号。图31b展示根据包含任务Y300和Y400的另一实施例产生高频带激励信号的方法 M210的流程图。任务Y300根据窄频带激励信号和经谐波延伸信号中的一者的随时间的 能量来计算时域包络。任务Y400根据时域包络调制噪声信号以产生经调制噪声信号。
图32展示根据一实施例对具有窄频带部分和髙频带部分的语音信号的所述高频带 部分进行解码的方法M300的流程图。任务Z100接收表征所述高频带部分的频谱包络 的一组滤波器参数和表征所述高频带部分的时间包络的一组增益因数。任务Z200通过 将非线性函数应用于从窄频带部分导出的信号来计算频谱延伸信号。任务Z300根据(A) 所述组滤波器参数和(B)基于所述频谱延伸信号的高频带激励信号来产生合成高频带 信号。任务Z400基于所述组增益因数来调制所述合成高频带信号的增益包络。举例来 说,任务Z400可经配置以通过将所述组增益因数应用于从窄频带部分导出的激励信号、 应用于频谱延伸信号、应用于高频带激励信号,或应用于合成高频带信号,来调制所述 合成高频带信号的增益包络。
实施例还包含如本文中(例如)通过对经配置以执行额外语音译码、编码和解码方 法的结构实施例的描述而明确揭示的所述额外语音译码、编码和解码方法。这些方法的 每一者也可确实地实施(例如,在如上文列举的一个或一个以上数据存储媒体中)为可 由包含逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)阵列的机器 读取和/或执行的一个或一个以上指令组。因此,本发明不希望限于上文展示的实施例, 而是应符合与本文中(包含所提交的形成原始揭示案的一部分的所附权利要求书中)以 任何方式揭示的原理和新颖特征一致的最广泛范围。
权利要求
1.一种产生高频带激励信号的方法,所述方法包括谐波延伸基于低频带激励信号的信号的频谱;计算基于所述低频带激励信号的信号的时域包络;根据所述时域包络来调制噪声信号;以及组合(A)基于所述谐波延伸的结果的经谐波延伸信号与(B)基于所述调制的结果的经调制噪声信号,其中所述高频带激励信号基于所述组合的结果。
2. 根据权利要求1所述的方法,其中所述谐波延伸包括将非线性函数应用于基于所述 低频带激励信号的信号。
3. 根据权利要求2所述的方法,其中所述应用非线性函数包括在时域中应用所述非线 性函数。
4. 根据权利要求2所述的方法,其中所述非线性函数是无记忆非线性函数。
5. 根据权利要求2所述的方法,其中所述非线性函数是不随时间变化的。
6. 根据权利要求2所述的方法,其中所述非线性函数包括绝对值函数、平方函数和削 波函数中的至少一者。
7. 根据权利要求2所述的方法,其中所述非线性函数是所述绝对值函数。
8. 根据权利要求1所述的方法,其中所述计算基于所述低频带激励信号的信号的时域 包络包含计算所述低频带激励信号、基于所述低频带激励信号的低频带语音信号和 所述经谐波延伸信号中的一者的时域包络。
9. 根据权利要求1所述的方法,其中所述谐波延伸包含谐波延伸基于所述低频带激励 信号的向上取样信号的频谱。
10. 根据权利要求l所述的方法,所述方法包括(A)在所述组合之前对所述经谐波延 伸信号进行频谱整平和(B)对所述高频带激励信号进行频谱整平中的至少一者。
11. 根据权利要求IO所述的方法,其中所述频谱整平包括基于待频谱整平的信号计算多个滤波器系数;以及用根据所述多个滤波器系数配置的白化滤波器对所述待频谱整平的信号进行滤 波。
12. 根据权利要求1所述的方法,所述方法包括根据经编码语音信号内的信息的确定性 函数来产生所述噪声信号。
13. 根据权利要求1所述的方法,其中所述组合包含计算所述经谐波延伸信号与所述经 调制噪声信号的加权总和,其中所述高频带激励信号基于所述加权总和。
14. 根据权利要求1所述的方法,其中所述计算加权总和包含根据第一加权因数加权所 述经谐波延伸信号,以及根据第二加权因数加权所述经调制噪声信号,其中所述方法包括根据时间变化条件计算所述第一和第二加权因数中的一者,以 及计算所述第一和第二加权因数中的另一者,使得所述第一和第二加权因数的能量 总和随着时间大体上恒定。
15.根据权利要求1所述的方法,其中所述计算加权总和包含根据第一加权因数加权所 述经谐波延伸信号,以及根据第二加权因数加权所述经调制噪声信号,其中所述方法包括根据(A)语音信号的周期性的指标和(B)语音信号的发声 程度中的至少一者来计算所述第一和第二加权因数中的至少一者。
16. 根据权利要求15所述的方法,其中所述方法包括从低频带残留的量化表示形式获 得所述低频带激励信号和音调增益值,且其中所述方法包括根据至少所述音调增益值来计算所述第一和第二加权因数中 的一者。
17. 根据权利要求1所述的方法,所述方法包括(i)根据所述高频带激励信号编码高 频带语音信号和(ii)根据所述高频带激励信号解码高频带语音信号中的至少一者。
18. —种具有机器可执行指令的数据存储媒体,所述机器可执行指令描述根据权利要求 1所述的信号处理方法。
19. 一种设备,其包括频谱延伸器,其经配置以执行基于低频带激励信号的信号的频谱的谐波延伸; 包络计算器,其经配置以计算基于所述低频带激励信号的信号的时域包络; 第一组合器,其经配置以根据所述时域包络执行噪声信号的调制;以及 第二组合器,其经配置以计算(A)基于所述谐波延伸的结果的经谐波延伸信号 与(B)基于所述调制的结果的经调制噪声信号的总和, 其中所述高频带激励信号基于所述总和的结果。
20. 根据权利要求19所述的设备,其中所述频谱延伸器经配置以应用非线性函数来执 行基于所述低频带激励信号的信号的频谱的所述谐波延伸。
21. 根据权利要求20所述的设备,其中所述非线性函数包括绝对值函数、平方函数和 削波函数中的至少一者。
22. 根据权利要求20所述的设备,其中所述非线性函数是所述绝对值函数。
23. 根据权利要求19所述的设备,其中所述包络计算器经配置以基于所述低频带激励 信号、基于所述低频带激励信号的低频带语音信号和所述经谐波延伸信号中的一者 计算所述时域包络。
24. 根据权利要求19所述的设备,其中所述频谱延伸器经配置以执行基于所述低频带 激励信号的向上取样信号的频谱的谐波延伸。
25. 根据权利要求19所述的设备,所述设备包括频谱整平器,所述频谱整平器经配置 以对所述经谐波延伸信号和所述高频带激励信号中的至少一者进行频谱整平。
26. 根据权利要求25所述的设备,其中所述频谱整平器经配置以基于待频谱整平的信 号计算多个滤波器系数,并用根据所述多个滤波器系数配置的白化滤波器对所述待 频谱整平的信号进行滤波。
27. 根据权利要求19所述的设备,所述设备包括噪声发生器,所述噪声发生器经配置 以根据经编码语音信号内的信息的确定性函数来产生所述噪声信号。
28. 根据权利要求19所述的设备,其中所述第二组合器经配置以计算所述经谐波延伸 信号与所述经调制噪声信号的加权总和,其中所述高频带激励信号基于所述加权总 禾口。
29. 根据权利要求28所述的设备,其中所述第二组合器经配置以根据第一加权因数加 权所述经谐波延伸信号,并根据第二加权因数加权所述经调制噪声信号,且其中所述第二组合器经配置以根据时间变化条件计算所述第一和第二加权因数 中的一者,且其中所述第二组合器经配置以计算所述第一和第二加权因数中的另一者,使得所 述第一和第二加权因数的能量总和随着时间大体上恒定。
30. 根据权利要求19所述的设备,其中所述第二组合器经配置以根据第一加权因数加 权所述经谐波延伸信号,并根据第二加权因数加权所述经调制噪声信号,其中所述第二组合器经配置以根据(A)语音信号的周期性的指标和(B)语音 信号的发声程度中的至少一者来计算所述第一和第二加权因数中的至少一者。
31. 根据权利要求30所述的设备,其中所述设备包含解量化器,所述解量化器经配置 以从低频带残留的量化表示形式获得所述低频带激励信号和音调增益值,且其中所述第二组合器经配置以根据至少所述音调增益值来计算所述第一和第二 加权因数中的至少一者。
32. 根据权利要求19所述的设备,所述设备包含以下中的至少一者(i)高频带语音 编码器,其经配置以根据所述高频带激励信号编码高频带语音信号和(ii)高频带 语音解码器,其经配置以根据所述高频带激励信号解码高频带语音信号。
33. 根据权利要求19所述的设备,所述设备包括蜂窝式电话。
34. 根据权利要求19所述的设备,所述设备包括经配置以发射与因特网协议的版本一 致的多个包的装置,其中所述多个包描述所述窄频带激励信号。
35. 根据权利要求19所述的设备,所述设备包括经配置以接收与因特网协议的版本一 致的多个包的装置,其中所述多个包描述所述窄频带激励信号。
36. —种设备,其包括用于谐波延伸基于低频带激励信号的信号的频谱的装置; 用于计算基于所述低频带激励信号的信号的时域包络的装置;用于根据所述时域包络来调制噪声信号的装置;以及用于组合(A)基于所述谐波延伸的结果的经谐波延伸信号与(B)基于所述调 制的结果的经调制噪声信号的装置,其中所述高频带激励信号基于所述组合的结果。
37. 根据权利要求36所述的设备,所述设备包括蜂窝式电话。
38. —种产生高频带激励信号的方法,所述方法包括通过将非线性函数应用于从语音信号的低频率部分导出的低频带激励信号来计 算经谐波延伸信号;以及将所述经谐波延伸信号与经调制噪声信号混合以产生高频带激励信号。
39. 根据权利要求38所述的方法,其中所述非线性函数是绝对值函数。
40. 根据权利要求38所述的方法,所述方法包括通过根据所述低频带激励信号、基于 所述低频带激励信号的低频带语音信号和所述经谐波延伸信号中的一者的时域包 络调制噪声信号来计算所述经调制噪声信号。
41. 根据权利要求38所述的方法,其中所述混合包含计算所述经谐波延伸信号与所述 经调制噪声信号的加权总和,其中所述高频带激励信号基于所述加权总和。
42. 根据权利要求38所述的方法,所述方法包括以下中的至少一者(i)根据所述高 频带激励信号编码所述语音信号的高频带部分和(ii)根据所述高频带激励信号解 码所述语音信号的高频带部分。
全文摘要
在一个实施例中,一种产生高频带激励信号的方法包含谐波延伸基于低频带激励信号的信号的频谱;计算基于所述低频带激励信号的信号的时域包络;以及根据所述时域包络来调制噪声信号。所述方法还包含组合(A)基于所述谐波延伸的结果的经谐波延伸信号与(B)基于所述调制的结果的经调制噪声信号。在此方法中,所述高频带激励信号基于所述组合的结果。
文档编号G01L21/02GK101184979SQ200680018351
公开日2008年5月21日 申请日期2006年4月3日 优先权日2005年4月1日
发明者科恩·贝尔纳德·福斯, 阿南塔帕德马纳卜汉·A·坎达达伊 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1