用于增益因子限制的系统、方法及设备的制作方法

文档序号:2830520阅读:510来源:国知局
专利名称:用于增益因子限制的系统、方法及设备的制作方法
技术领域
本发明涉及语音编码。
背景技术
经由公共交换电话网络(PSTN)的话音通信的带宽传统上限于300-3400 kHz的频 率范围。用于话音通信的新网络(例如蜂窝电话及IP话音(因特网协议,VoIP))可能 不具有相同的带宽限制,且其可能需要经由所述网络来传输及接收包括宽带频率范围的 话音通信。举例来说,可能需要支持延伸低达50 Hz及/或高达7 kHz或S kHz的音频范 围。还可能需要支持例如高质量音频或音频/视频会议的其它应用,其可具有在传统PSTN 限制以外的范围内的音频语音内容。
语音编码器所支持的范围延伸到更高频率可改进可懂度。举例来说,区分例如"s" 与"f"的摩擦音的信息大多在高频率下。高带延伸还可改进其它语音质量,例如真实度。 举例来说,即使是有声元音也可具有远远超出PSTN限制的频谱能量。
一种宽带语音编码方法涉及按比例縮放窄带语音编码技术(例如, 一种经配置以编 码0-4kHz的范围的技术)以重叠宽带频谱。举例来说,可以较高速率对语音信号进行 取样以包括在高频率的分量,且窄带编码技术可经重配置以使用更多滤波器系数来表示 此宽带信号。然而,例如CELP (码簿激发线性预测)的窄带编码技术在计算上为密集 的,且宽带CELP编码器可能耗费过多处理循环而对许多移动及其它嵌入式应用不实用。 使用此技术将宽带信号的整个频谱编码到所要质量还可能导致带宽不可接受地大幅增 加。此外,甚至在此经编码信号的窄带部分可被传输到仅支持窄带编码的系统中及/或由 所述系统解码之前,将需要对此经编码信号进行码变换。
可能需要实施宽带语音编码,以使得至少经编码信号的窄带部分可经由窄带信道
7(例如PSTN信道)发送而无需码变换或其它显著修改。还可能需要宽带编码延伸的效 率,(例如)以避免显著减少例如经由有线及无线信道的无线蜂窝电话及广播的应用中 可服务的用户的数目。
宽带语音编码的另一方法涉及将语音信号的窄带及高带部分编码为单独的子带。在 此类型的系统中,可通过从已在解码器处可用的信息(例如,窄带激发信号)导出用于 高带合成滤波器的激发来实现提高的效率。可通过将一系列增益因子包括在经编码信号 中来提高此系统中的质量,所述增益因子指示原始高带信号的电平与合成的高带信号的 电平之间的时间变化关系。

发明内容
一种根据一配置的语音处理方法包括基于(A)基于语音信号的第一子带的第一 信号的时间的一部分与(B)基于从所述语音信号的第二子带导出的分量的第二信号的 时间的对应部分之间的关系而计算增益因子;及根据所述增益因子值将第一索引选择到 量化值的一有序集合中。所述方法包括评估所述增益因子值与由所述第一索引所指示 的量化值之间的关系;及根据所述评估的结果来将第二索引选择到量化值的所述有序集 合中。
一种根据另一配置的用于语音处理的设备包括计算器,其经配置以基于(A)基 于语音信号的第一子带的第一信号的时间的一部分与(B)基于从所述语音信号的第二
子带导出的分量的第二信号的时间的对应部分之间的关系而计算增益因子值;及量化
器,其经配置以根据所述增益因子值将第一索引选择到量化值的一有序集合中。所述设
备包括限制器,所述限制器经配置(A)以评估所述增益因子值与由所述第一索引所指 示的量化值之间的关系,及(B)以根据所述评估的结果来将第二索引选择到量化值的
所述有序集合中。
一种根据另一配置的用于语音处理的设备包括用于基于(A)基于语音信号的第
一子带的第一信号的时间的一部分与(B)基于从所述语音信号的第二子带导出的分量 的第二信号的时间的对应部分之间的关系而计算增益因子值的装置;及用于根据所述增
益因子值将第一索引选择到量化值的一有序集合中的装置。所述设备包括用于评估所述 增益因子值与由所述第一索引所指示的量化值之间的关系及用于根据所述评估的结果 来将第二索引选择到量化值的所述有序集合中的装置。
8


图la展示宽带语音编码器A100的框图。
图lb展示宽带语音编码器A100的实施方案A102的框图。
图2a展示宽带语音解码器B100的框图。
图2b展示宽带语音解码器B100的实施方案B102的框图。
图3a展示用于滤波器组A110的一实例的低带及高带的带宽重叠。
图3b展示用于滤波器组AUO的另一实例的低带及高带的带宽重叠。
图4a展示语音信号的频率对对数振幅的曲线的实例。
图4b展示基本线性预测编码系统的框图。
图5展示窄带编码器A120的实施方案A122的框图。
图6展示窄带解码器B110的实施方案B112的框图。
图7a展示有声语音的残余信号的频率对对数振幅的曲线的实例。
图7b展示有声语音的残余信号的时间对对数振幅的曲线的实例。
图8展示还执行长期预测的基本线性预测编码系统的框图。
图9展示高带编码器A200的实施方案A202的框图。
图10展示用于编码高带部分的方法M10的流程图。
图11展示增益计算任务T200的流程图。
图12展示增益计算任务T200的实施方案T210的流程图。
图13a展示开窗函数的图。
图13b展示如图13a中所示的开窗函数应用于语音信号的子帧。
图Ma展示高带增益因子计算器A230的实施方案A232的框图。
图14b展示包括高带增益因子计算器A232的布置的框图。
图15展示高带增益因子计算器A232的实施方案A234的框图。
图16展示高带增益因子计算器A232的另一实施方案A236的框图。
图17展示如可由标量量化器执行的一维映射的实例。
图18展示由向量量化器执行的多维映射的一简单实例。
图19a展示如可由标量量化器执行的一维映射的另一实例。
图19b展示输入空间映射成不同大小的量化区域的实例。
图19c说明其中用于增益因子值R的经量化的值大于原始值的实例。
图20a展示根据一一般实施方案的增益因子限制的方法M100的流程图。
9图20b展示用于方法M100的实施方案M110的流程图。 图20c展示用于方法M100的实施方案M120的流程图。 图20d展示用于方法M100的实施方案M130的流程图。 图21展示高带编码器A202的实施方案A203的框图。 图22展示高带编码器A203的实施方案A204的框图。 图23a展示用于限制器L10的实施方案L12的操作图。 图23b展示用于限制器L10的另一实施方案L14的操作图。 图23c展示用于限制器L10的另一实施方案L16的操作图。 图24展示高带解码器B200的实施方案B202的框图。
具体实施例方式
可听假象可出现于(例如)经解码的信号的子带之中的能量分布不准确时。此假象 可显著地使得用户不愉快且因此可能降低编码器的感觉质量。
除非由上下文明确限制,否则术语"计算"在本文中用于指示其通常意义中的任一 者,例如计算、产生值列表及从值列表中进行选择。在本描述及权利要求书中使用术语 "包含"之处,其并不排除其它元件或操作。术语"A基于B"用于指示其通常意义中的 任一者,包括如下情况(i)"A等于B"及(ii) "A基于至少B"。术语"因特网协议" 包括如在IETF (因特网工程工作小组)RFC (意见请求)791中所描述的版本4,及后 续版本(例如,版本6)。
图la展示可经配置以执行本文所描述的方法的宽带语音编码器A100的框图。滤波 器组A110经配置以滤波宽带语音信号S10以产生窄带信号S20及高带信号S30。窄带 编码器A120经配置以编码窄带信号S20以产生窄带(NB)滤波器参数S40及窄带残余 信号S50。如本文进一步详细描述,窄带编码器A120通常经配置以产生作为码簿索引 或为另一量化形式的窄带滤波器参数S40及经编码窄带激发信号S50。高带编码器A200 经配置以根据经编码窄带激发信号S50中的信息而编码高带信号S30以产生高带编码参 数S60。如本文进一步详细描述,高带编码器A200通常经配置以产生作为码簿索引或 为另一量化形式的高带编码参数S60。宽带语音编码器A100的一特定实例经配置而以 约8.55 kbps (千位每秒)的速率来编码宽带语音信号S10,其中约7.55 kbps用于窄带 滤波器参数S40及经编码窄带激发信号S50,且约1 kbps用于高带编码参数S60。
可能需要将经编码窄带信号与高带信号组合为单一位流。举例来说,可能需要将所述经编码信号一起多路复用以作为经编码宽带语音信号而进行传输(例如,经由有线、 光学或无线传输信道)或存储。图lb展示宽带语音编码器A100的实施方案A102的框 图,其包括经配置以将窄带滤波器参数S40、经编码窄带激发信号S50及高带滤波器参 数S60组合为经多路复用信号S70的多路复用器A130。
包括编码器A102的设备还可包括电路,所述电路经配置以将经多路复用信号S70 传输到例如有线、光学或无线信道的传输信道中。此设备还可经配置以对信号执行一个 或一个以上信道编码操作(例如误差校正编码(例如,速率兼容巻积编码)及/或误差检 测编码(例如,循环冗余编码)),及/或一个或一个以上W络协议编码层(例如,以太网、 TCP/IP、 cdma2000)。
可能需要配置多路复用器A130以嵌入经编码窄带信号(包括窄带滤波器参数S40 及经编码窄带激发信号S50)作为多路复用信号S70的可分子流,以使得经编码窄带信 号可独立于经多路复用信号S70的另一部分(例如高带及/或低带信号)而经恢复并解码。 举例来说,经多路复用信号S70可经布置,以使得经编码窄带信号可通过去除高带滤波 器参数S60而得以恢复。此特征的潜在优势在于避免对在将经编码宽带信号传递到支持 窄带信号的解码但不支持高带部分的解码的系统之前对其进行编码转换的需要。
图2a为宽带语音解码器B100的框图,其可用于解码由宽带语音编码器A100所编 码的信号。窄带解码器B110经配置以解码窄带滤波器参数S40及经编码窄带激发信号 S50以产生窄带信^ S90。高带解码器B200经配置以根据窄带激发信号S80基于经编码 窄带激发信号S50来解码高带编码参数S60,以产生高带信号SIOO。在此实例中,窄带 解码器B110经配置以将窄带激发信号S80提供到高带解码器B200。滤波器组B120经 配置以将窄带信号S90与高带信号S100组合,以产生宽带语音信号SllO。
图2b为宽带语音解码器B100的实施方案B102的框图,其包括经配置以从经多路 复用信号S70产生经编码信号S40、 S50及S60的解多路复用器B130。包括解码器B102 的设备可包括电路,所述电路经配置以从例如有线、光学或无线信道的传输信道接收经 多路复用信号S70。此设备还可经配置以对信号执行一个或一个以上信道解码操作(例 如误差校正解码(例如,速率兼容巻积解码)及/或误差检测解码(例如,循环冗余解码)), 及/或一个或一个以上网络协议解码层(例如,以太网、TCP/IP、 cdma2000)。
滤波器组A110经配置以根据带分割方案(split-band scheme)滤波输入信号,以产 生低频率子带及高频率子带。视特定应用的设计准则而定,输出子带可能具有相等或不 等带宽且可为重叠或非重叠的。产生两个以上子带的滤波器组A110的配置也为可能的。 举例来说,此滤波器组可经配置以产生一个或一个以上低带信号,所述信号包括低于窄
11带信号S20的频率范围的频率范围(例如50-300 Hz的范围)内的分量。此滤波器组还 可能经配置以产生一个或一个以上额外高带信号,所述信号包括高于高带信号S30的频 率范围的频率范围(例如14-20 kHz、 16-20 kHz或16-32 kHz的范围)内的分量。在此 情况下,宽带语音编码器A100可经实施以单独编码此信号或这些信号,且多路复用器 A130可经配置以将额外经编码信号包括于经多路复用信号S70中(例如,作为可分部 分)。
图3a及图3b展示两个不同实施方案实例中的宽带语音信号SIO、窄带信号S20及 高带信号S30的相对带宽。在这些特定实例的两者中,宽带语音信号S10具有16 kHz 的取样速率(表示在0到8 kHz的范围内的频率分量),且窄带信号S20具有8 kHz的 取样速率(表示0到4 kHz的范围内的频率分量),但所述速率及范围不为对本文所描 述的原理的限制,可将其应用于任何其它取样速率及/或频率范围。
在图3a的实例中,在两个子带之间不存在显著重叠。可将如在此实例中的高带信 号S30向下取样为8 kHz的取祥速率。在图3b的替代实例中,上部子带与下部子带具 有明显重叠,使得两个子带信号均描述3.5到4 kHz的区域。可将如在此实例中的高带 信号S30向下取样为7 kHz的取样速率。如在图3b的实例中提供子带之间的重叠可允 许编码系统使用在重叠区域上具有平滑滚落(ralloff)的低通及/或高通滤波器及/或可提 高重叠区域中的再现频率分量的质量。
在用于电话通信的典型手机中,转换器(即,麦克风及耳机或扬声器)中的一者或 一者以上缺乏7-8kHz的频率范围内的明显响应。在图3b的实例中,经编码信号中不包 括宽带语音信号S10的在7 kHz与8 kHz之间的部分。高通滤波器130的其它特定实例 具有3.5-7.5 kHz及3.5-8 kHz的通带。
编码器可经配置以产生感知上类似于原始信号但实际上显著不同于原始信号的合 成信号。举例来说,从如本文所述的窄带残余导出高带激发的编码器可产生此信号,因 为实际高带残余可完全不存在于经解码信号中。在这些情况下,在子带之间提供重叠可 支持低带与高带的平滑掺合,此掺合可导致较少可听假象及/或从一频带到另一频带的较 不显著的过渡。
滤波器组AU0及B120的低带及高带路径可经配置以具有除两个子带的重叠以外完 全无关的频谱。我们将两个子带的重叠界定为从高带滤波器的频率响应下降到-20dB的 点直到低带滤波器的频率响应下降到-20 dB的点的距离。在滤波器组A110及/或B120 的各种实例中,此重叠在约200 Hz到约1 kHz的范围内。约400 Hz到约600 Hz的范围
可表示编码效率与感知平滑度之间的所要折衷。在以上提及的一特定实例中,重叠在500
12可能需要实施滤波器组A110及/或B120以在若干阶段中计算如图3a及图3b中所 说明的子带信号。可在沃斯(Vos)等人于2006年4月3日申请的标题为"用于语音信 号滤波的系统、方法和设备(SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING)"的代理人案号050551的美国专利申请案中的图3a、图3b、图 4c、图4d及图33到图39b及所附文本(包括段落
-
)处找到关于滤波器 组A110及B120的特定实施方案的元件的响应的额外描述及图,且出于提供关于滤波器 组A110及/或B120的额外揭示内容的目的,此材料藉此在允许以引用的方式并入的美 国及任何其它管辖区中以引用的方式并入。
高带信号S30可包括可能对于编码不利的高能量的脉冲("突发")。例如宽带语音 编码器A100的语音编码器可经实施以包括突发抑制器(例如,如在沃斯(Vos)等人于 2006年4月3 bJ申请的标题为"用于高带突发抑制的系统、方法和设备SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND BURST SUPPRESSION"的代理人案号 050549的美国专利申请案中所描述)以在(例如,通过高带编码器A200)编码之前滤 波高带信号S30。
通常根据源-滤波器模型来各自实施窄带编码器A120及高带编码器A200,所述源-滤波器模型将输入信号编码为(A)描述滤波器的一组参数及(B)驱动所描述的滤波器 产生输入信号的经合成再现的激发信号。图4a展示语音信号的频谱包络的实例。表现 此频谱包络的特征的峰值表示声道的共振且被称为共振峰。大多数语音编码器将至少此 粗略频谱结构编码为例如滤波器系数的一组参数。
图4b展示如应用于窄带信号S20的频谱包络编码的基本源-滤波器布置的实例。分 析模块计算表现对应于一时间周期(通常20毫秒(msec))内的语音的滤波器的特征的 一组参数。根据那些滤波器参数而配置的白化滤波器(还称为分析或预测误差滤波器) 移除频谱包络,从而以频谱方式平坦化信号。所得白化信号(还称为残余)具有较少能 量,且因此具有较小变化且比原始语音信号更容易编码。由残余信号的编码产生的误差 还可更均匀地散布于频谱上。滤波器参数及残余通常经量化以经由信道有效传输。在解 码器处,根据滤波器参数而配置的合成滤波器由信号基于残余而激发,以产生原始语音 的经合成版本。合成滤波器通常经配置以具有传递函数,所述传递函数为白化滤波器的 传递函数的倒数。
图5展示窄带编码器A120的基本实施方案A122的框图。在此实例中,线性预测 编码(LPC)分析模块210将窄带信号S20的频谱包络编码为一组线性预测(LP)系数
13(例如,全极滤波器的系数1/A (z))。分析模块通常将输入信号处理为一系列非重叠帧,其中针对每一帧计算一组新系数。帧周期一般为在其内信号可被预期为在位置上固定的周期; 一常见实例为20毫秒(等效于以8kHz的取样速率的160个样本)。在一实例中,LPC分析模块210经配置以计算一组十个LP滤波器系数来表现每一20毫秒帧的共振峰结构的特征。还可能实施分析模块以将输入信号处理为一系列重叠帧。
分析模块可经配置以直接分析每一帧的样本,或所述样本可根据开窗函数(例如,汉明窗口 (Hamming window))而先加权。还可在一大于帧的窗口 (例如30毫秒的窗口)上执行分析。此窗口可为对称的(例如5-20-5,使得其在20毫秒帧之前及之后立即包括5毫秒)或非对称的(例如10-20,使得其包括先前帧的最后IO毫秒)。一LPC分析模块通常经配置以使莱文森-德宾(用Levinson-Durbin)递归或勒鲁-古伊古恩(Leroux-Gueguen)算法来计算LP滤波器系数。在另一实施方案中,分析模块可经配置以针对每一帧计算一组倒频谱系数而并非一组LP滤波器系数。
通过量化滤波器参数,编码器A120的输出速率可显著降低,艮对再现质量具有相对较少影响。线性预测滤波器系数难以有效量化且通常映射为量化及/或熵编码的另一表示,例如线频谱对(LSP)或线频谱频率(LSF)。在图5的实例中,LP滤波器系数到LSF变换220将所述组LP滤波器系数变换为一组对应的LSF。 LP滤波器系数的其它一对一表示包括部分自相关系数;对数面积比值;导抗频谱对(ISP);及导抗频谱频率(ISF),以上均用于GSM (全球移动通信系统)AMR-WB (自适应多速率宽带)编解码器。通常, 一组LP滤波器系数与一组对应的LSF之间的变换为可逆的,但配置还包括编码器A120的实施方案,其中变换不能无误差地可逆。
量化器230经配置以量化所述组窄带LSF (或其它系数表示),目.窄带编码器A122经配置以将此量化结果作为窄带滤波器参数S40而输出。此量化器通常包括将输入向量编码为表或码簿中的对应向量条目的索引的向量量化器。
图9展示高带编码器A200的实施方案A202的框图。高带编码器A202的分析模块A210、变换410及量化器420可根据如上文所述的窄带编码器A122的对应元件(即,分别为LPC分析模块210、变换220及量化器230)来实施,但可能需要将较低阶LPC分析用于高带。甚至可能在不同时间使用相同结构(例如,门阵列)及/或指令集合(例如,若干行码)实施这些窄带及高带编码器元件。如下文所描述,窄带编码器A120及高带编码器A200的操作相对于残余信号的处理而不同。
如图5中所见,窄带编码器A122还通过使窄带信号S20通过白化滤波器260 (还
称为分析或预测误差滤波器)而产生残余信号,所述白化滤波器260根据所述组滤波器
14系数而经配置。在此特定实例中,白化滤波器260经实施为FIR滤波器,但也可使用IIR 实施方案。此残余信号通常将含有语音帧的感知上重要信息(例如与音高相关的长期结 构),其未表示在窄带滤波器参数S40中。量化器270经配置以计算此残余信号的量化 表示以作为经编码窄带激发信号S50而输出。此量化器通常包括将输入向量编码为一表 或码簿中的对应向量条目的索引的向量量化器。或者,此量化器可经配置以发送一个或
一个以上参数,向量可在解码器处丛所述一个或一个以上参数动态产生,而并非如稀疏 码簿方法中丛存储装置检索。此方法用于例如代数CELP (码簿激发线性预测)的编码 方案中及例如3GPP2 (第三代合作伙伴计划2) EVRC (增强型可变速率编解码器)的 编解码器中。
需要窄带编码器A120根据将可用于对应窄带解码器的相同滤波器参数值而产生经 编码窄带激发信号。以此方式,所得经编码窄带激发信号可已在某种程度上计及所述参 数值的非理想性,例如量化误差。因此,需要使用将可用于解码器处的相同系数值来配 置白化滤波器。在如图5所示的编码器A122的基本实例中,逆量化器240去量化窄带 编码参数S40, LSF到LP滤波器系数变换250将所得值映射回到一组对应的LP滤波器 系数,且此组系数用于配置白化滤波器260以产生由量化器270量化的残余信号。
窄带编码器A120的某些实施方案经配置以通过识别一组码簿向量中与残余信号最 佳匹配的一者来计算经编码窄带激发信号S50。然而,注意到,窄带编码器A120还可 经实施以计算残余信号的经量化表示,而实际上并不产生残余信号。举例来说,窄带编 码器A120可经配置以使用若干个码簿向量来产生对应经合成信号(例如,根据一组当 前滤波器参数),且选择与在感知加权域中与原始窄带信号S20最佳匹配的所产生信号 相关联的码簿向量。
即使在白化滤波器已丛窄带信号S20移除粗略频谱包络之后,仍可保留一相当量的 精密谐波结构(尤其对于有声语音来说)。图7a展示例如元音的有声信号的残余信号(如 可由白化滤波器产生)的一实例的频谱曲线。此实例中可见的周期性结构与音高相关, 且由同一说话者所说的不同有声声音可具有不同共振峰结构但具有类似音高结构。图7b 展示此残余信号的一实例的时域曲线,其按时间展示一音高脉冲序列。
窄带编码器A120可包括经配置以编码窄带信号S20的长期谐波结构的一个或一个 以上模块。如图8所示, 一可使用的典型CELP范例包括一开环LPC分析模块,其编码 短期特征或粗略频谱包络,之后为一闭环长期预测分析阶段,其编码精细音高或谐波结 构。短期特征经编码为滤波器系数,且长期特征经编码为例如音高滞后及音高增益的参 数值。举例来说,窄带编码器A120可经配置以输出为包括一个或一个以上码簿索引(例
15如,固定码簿索引及自适应码簿索引)及对应增益值的形式的经编码窄带激发信号S50。 窄带残余信号的此经量化表示的计算(例如,由量化器270进行)可包括选择所述索引 及计算所述值。音高结构的编码还可包括内插音高原型波形,此操作可包括计算连续音 高脉冲之间的差值。可针对对应于无声语音(其通常像噪声且未结构化)的帧停用长期 结构的模型化。
图6展示窄带解码器B110的实施方案B112的框图。逆量化器310去量化窄带滤波 器参数S40 (在此情况下,到一组LSF),且LSF到LP滤波器系数变换320将LSF变换 成一组滤波器系数(例如,如上文参考窄带编码器A122的逆量化器240及变换250所 描述)。逆量化器340去量化窄带残余信号S40以产生窄带激发信号S80。基于滤波器系 数及窄带激发信号S80,窄带合成滤波器330合成窄带信号S90。换句话说,窄带合成 滤波器330经配置以根据所述经去量化的滤波器系数而频谱成形窄带激发信号S80,以 产生窄带信号S90。窄带解码器B112还向高带编码器A200提供窄带激发信号S80,所 述高带编码器A200使用信号S80而导出如本文所述的高带激发信号S120。在如下文所 述的某些实施方案中,窄带解码器BU0可经配置以向高带解码器B200提供与窄带信号 相关的额外信息,例如频谱倾斜、音高增益及滞后,及语音模式。
窄带编码器A122与窄带解码器B112的系统为一分析合成语音编解码器 (analysis-by-synthesis speech codec)的基本实例。码簿激发线性预测(CELP)编码为一 系列普遍的分析合成编码,且所述编码器的实施方案可执行残余的波形编码,包括例如 丛固定及自适应码簿中选择条目、误差最小化操作及/或感知加权操作的操作。分析合成 编码的其它实施方案包括混合激发线性预测(MELP)、代数CELP(ACELP)、松弛CELP (RCELP)、规则脉冲激发(RPE)、多脉冲CELP(MPE)及向量和激发线性预测(VSELP) 编码。相关编码方法包括多带激发(MBE)及原型波形内插(PWI)编码。标准化分析 合成语音编解码器的实例包括ETSI(欧洲电信标准协会)-GSM全速率编解码器(GSM 06.10),其使用残余激发线性预测(RELP); GSM增强型全速率编解码器(ETSI-GSM 06.60); ITU (国际电信联合会)标准11.8 kb/sG.729附录E编码器;用于IS-I36(时分 多址方案)的IS (临时标准)-641编解码器;GSM自适应多速率(GSM-AMR)编解码 器;及4GV (第四代声码器 )编解码器(QUALCOMM公司(QUALCOMM Incorporated),加利福尼亚,圣地亚哥(San Diego, CA))。窄带编码器A120及对应解 码器B110可根据这些技术中的任一者、或将语音信号表示为(A)描述滤波器的一组参 数及(B)用以驱动所述滤波器以再现语音信号的激发信号的任何其它语音编码技术(无 论已知的还是待研发的)而实施。
16高带编码器A200经配置以根据源-滤波器模型编码高带信号S30。举例来说,高带 编码器A200通常经配置以执行高带信号S30的LPC分析以获取描述信号的频谱包络的 一组滤波器参数。如在窄带方面,用于激发此滤波器的源信号可从LPC分析的残余导出 或另外基于LPC分析的残余。然而,高带信号S30通常感知上不如窄带信号S20显著, 且对于经编码语音信号包括两个激发信号可能为高代价的。为了减小传递经编码宽带语 音信号所需的位速率,对于高带可能需要替代地使用一模型化激发信号。举例来说,用 于高带滤波器的激发可基于经编码窄带激发信号S50。
图9展示高带编码器A200的实施方案A202的框图,所述高带编码器A200经配置 以产生高带编码参数S60的流,包括高带滤波器参数S60a及高带增益因子S60b。高带 激发产生器A300从经编码窄带激发信号S50导出高带激发信号S120。分析模块A210 产生表现高带信号S30的频谱包络的特征的一组参数值。在此特定实例中,分析模块 A210经配置以执行LPC分析来产生高带信号S30的每一帧的一组LP滤波器系数。线 性预测滤波器系数到LSF变换410将所述组LP滤波器系数变换为一组对应的LSF。如 上文参考分析模块210及变换220所述,分析模块A210及/或变换410可经配置以使用 其它系数组(例如,倒频谱系数)及/或系数表示(例如,ISP)。
量化器420经配置以量化所述组高带LSF (或其它系数表示,例如ISP),且高带编 码器A202经配置以输出此量化结果作为高带滤波器参数S60a。此量化器通常包括将输 入向量编码为表或码簿中的对应向量条目的索引的向量量化器。
高带编码器A202还包括合成滤波器A220,所述合成滤波器A220经配置以根据高 带激发信号S120及由分析模块A210产生的经编码频谱包络(例如,所述组LP滤波器 系数)而产生经合成高带信号S130。合成滤波器A220通常经实施为IIR滤波器,但还 可使用FIR实施方案。在一特定实例中,合成滤波器A220经实施为六阶线性自回归滤 波器。
在宽带语音编码器A100的根据如图8所示的范例的实施方案中,高带编码器A200 可经配置以接收如由短期分析或白化滤波器产生的窄带激发信号。换句话说,窄带编码 器A120可经配置以在编码长期结构之前将窄带激发信号输出到高带编码器A200。然而, 需要高带编码器A200从窄带信道接收将由高带解码器B200接收的相同编码信息,以使 得由高带编码器A200产生的编码参数可己在某种程度上计及所述信息的非理想性。因 此,可优选使高带编码器A200从待由宽带语音编码器A100输出的相同经参数化及/或 经量化的编码窄带激发信号S50重构窄带激发信号S80。此方法的一潜在优势在于更准 确地计算高带增益因子S60b (下文描述)。高带增益因子计算器A230计算原始高带信号S30的电平与经合成高带信号S130 的电平之间的一个或一个以上差值来指定帧的增益包络。量化器430 (其可实施为将输 入向量编码为表或码簿中的对应向量条目的索引的向量量化器)量化指定增益包络的 值,且高带编码器A202经配置以输出此量化结果作为高带增益因子S60b。
本文所述的元件的量化器中的一者或一者以上(例如,量化器230、 420或430)可 经配置以执行分类向量量化。举例来说,此量化器可经配置以基于已在窄带信道及/或高 带信道中的同一帧内经编码的信息而选择一组码簿中的一者。此技术通常以额外码簿存 储为代价来增加编码效率。
在如图9中所展示的高带编码器A200的一实施方案中,合成滤波器A220经布置 以从分析模块A210接收滤波器系数。高带编码器A202的一替代性实施方案包括经配 置以解码来自高带滤波器参数S60a的滤波器系数的逆量化器及逆变换,且在此情况下, 替代地,合成滤波器A220经布置以接收经解码的滤波器系数。此替代性布置可支持高 带增益计算器A230对增益包络进行更准确的计算。
在一特定实例中,分析模块A210及高带增益计算器A230分别输出每帧一组六个 LSF与一组五个增益值,以使得仅以每帧十一个额外值即可实现窄带信号S20的宽带延 伸。在另一实例中,针对每一帧添加另一增益值以仅以每帧十二个额外值提供宽带延伸。 耳朵倾向于对高频率下的频率误差较不敏感,使得较低LPC阶处的高带编码可产生具有 可与较高LPC阶处的窄带编码相比的感知质量的信号。高带编码器A200的典型实施方 案可经配置以输出每帧8到12位用于频谱包络的高质量重构,且输出每帧另外8到12 位用于临时包络的高质量重构。在另一特定实例中,分析模块A210输出每帧一组八个 LSF。
高带编码器A200的某些实施方案经配置以通过产生具有高带频率分量的随机噪声 信号并根据窄带信号S20、窄带激发信号S80或高带信号S30的时域包络来振幅调制所 述噪声信号而产生高带激发信号S120。在此情况下,可能需要噪声产生器的状态为经编 码语音信号中的其它信息(例如,同一帧中的信息,例如窄带滤波器参数S40或其一部 分,及/或经编码窄带激发信号S50或其一部分)的确定性函数,使得经编码的及解码器 的高带激发产生器中的对应噪声产生器可具有相同状态。虽然基于噪声的方法可针对无 声声音产生适当结果,然而,对于有声声音来说可能为不合需要的,其残余通常为谐波 的目.因此具有某周期结构。
高带激发产生器A300经配置以获得窄带激发信号S80 (例如,通过去量化经编码 窄带激发信号S50)及基于窄带激发信号S80产生高带激发信号S120。举例来说,高带
18激发产生器A300可经实施以使用窄带激发信号S80的非线性处理来执行一种或一种以 上技术,例如谐波带宽延伸、频谱折叠、频谱平移,及/或谐波合成。在一特定实例中, 高带激发产生器A300经配置以通过与延伸的信号与经调制噪声信号的自适应混合相结 合的窄带激发信号S80的非线性带宽延伸来产生高带激发信号S120。高带激发产生器 A300还可经配置以执行延伸及/或混合信号的抗稀疏(anti-sparseness)滤波。
可在于2006年4月3日申请的标题为"用于高带激发产生的系统、方法和设备 (SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND EXCITATION GENERATION)"的美国专利申请案第11/397,870号(沃斯(Vos)等人)中,在图11 到图20及所附文本(包括段落


)处找到关于高带激发产 生器A300及高带激发信号S120的产生的额外描述及图,目.出于提供关于高带激发产生 器A300及/或关于从用于另一子带的编码激发信号产生用于一个子带的激发信号的额外 揭示内容的目的,此材料于此在允许以引用的方式并入的美国及任何其它管辖区中以引 用的方式并入。
图10展示编码具有窄带部分及高带部分的语音信号的高带部分的方法M10的流程 图。任务X100计算表现高带部分的频谱包络的特征的一组滤波器参数。任务X200通 过将非线性函数应用于从窄带部分导出的信号来计算频谱延伸信号。任务X300根据(A) 所述组滤波器参数及(B)基于频谱延伸信号的高带激发信号来产生经合成高带信号。 任务X400基于(C)高带部分的能量与(D)从窄带部分导出的信号的能量之间的关系 来计算增益包络。
通常将需要经解码的信号的临时特征来使得其表示的原始信号的那些类似。此外, 对于单独编码不同子带的系统来说,可能需要经解码的信号中的相对临时特征来使得原 始信号中的那些子带的相对临时特征类似。对于经编码语音信号的准确再现来说,可能 需要经合成宽带语音信号S100的高带部分与窄带部分的电平之间的比率类似于原始宽 带语音信号S10中的比率。高带编码器A200可经配置以包括经编码语音信3中的描述 或另外基于原始高带信号的临时包络的信息。对于其中高带激发信号基于来自另一子带 的信息的情况(例如,经编码窄带激发信号S50),可能尤其需要经编码参数包括描述经 合成高带信号与原始高带信号的临时包络之间的差值的信息。
除了关于高带信号S30的频谱包络的信息(g卩,如由LPC系数或类似参数值所描述)
之外,可能需要宽带信号的经编码参数包括高带信号S30的临时信息。除了如由高带编
码参数S60a表示的频谱包络以外,例如,高带编码器A200可经配置以通过指定临时或
增益包络来表现高带信号S30的特征。如图9所示,高带编码器A202包括高带增益因子计算器A230,所述高带增益因子计算器A230经配置和布置以根据高带信号S30与经 合成高带信号S130之间的关系(例如在一帧或其某部分上两个信号的能量之间的差值 或比率)来计算一个或一个以上增益因子。在高带编码器A202的其它实施方案中,高 带增益计算器A230可经同样配置但经替代地布置以根据高带信号S30与窄带激发信号 S80或高带激发信号S120之间的此时间变化关系来计算增益包络。
窄带激发信号S80与高带信号S30的临时包络很可能为类似的。因此,基于高带信 号S30与窄带激发信号S80 (或从其导出的信号,例如高带激发信号S120或经合成高 带信号S130)之间的关系的增益包络一般将比仅基于高带信号S30的增益包络更适于编 码。
高带编码器A202包括经配置以针对高带信号S30的每一帧计算一个或一个以上增 益因子的高带增益因子计算器A230,其中每一增益因子基于经合成高带信号S130与高 带信号S30的对应部分的临时包络之间的关系。举例来说,高带增益因子计算器A230 可经配置以计算每一增益因子作为信号的振幅包络之间的比率或作为信号的能量包络 之间的比率。在一典型实施方案中,高带编码器A202经配置以输出针对每一帧指定五 个增益因子(例如, 一个用于五个连续子帧中的每一者)的八到十二个位的经量化索弓L 在另一实施方案中,高带编码器A202经配置以输出针对每一帧指定一帧级增益因子的 额外经量化索引。
可将增益因子计算为规范化因子,例如原始信号的能量的测量与经合成信号的能量 的测量之间的比率R。可将所述比率R表达为线性值或为对数值(例如,以一分贝尺度)。 高带增益因子计算器A230可经配置以针对每一帧计算此规范化因子。替代地或另外, 高带增益因子计算器A230可经配置以针对每一帧的若干个子帧中的每一者计算一系列 增益因子。在一实例中,高带增益因子计算器A230经配置以将每一帧(及/或子帧)的 能量计算为平方的和的平方根。
高带增益因子计算器A230可经配置以将增益因子计算执行为包括一个或一个以上 系列的子任务的任务。图U展示此任务的实例T200的流程图,其根据高带信号S30及 经合成高带信号S130的对应部分的相对能量来计算经编码高带信号的对应部分(例如, 一帧或子帧)的增益值。任务220a及220b计算相应信号的对应部分的能量。举例来说, 任务220a及220b可经配置以将所述能量计算为相应部分的样本的平方的和。任务T230 将增益因子计算为那些能量的比率的平方根。在此实例中,任务T230将部分的增益因 子计算为所述部分上的高带信号S30的能量与所述部分上的经合成高带信号S130的能 量的比率的平方根。
20可能需要高带增益因子计算器A230经配置以根据一开窗函数来计算能量。图12展 示增益因子计算任务T200的此实施方案T210的流程图。任务T215a将开窗函数应用于 高带信号S30,目.任务T215b将同一开窗函数应用于经合成高带信号S130。任务220a 及220b的实施方案222a及222b计算相应窗口的能量,目.任务T230将部分的增益因子 计算为能量比率的平方根。
在针对帧计算增益因子的过程中,可能需要应用重叠相邻帧的开窗函数。在针对子 帧计算增益因子的过程中,可能需要应用重叠相邻子帧的开窗函数。举例来说,产生可 以重叠相加方式应用的增益因子的开窗函数可帮助减小或避免子帧之间的不连续性。在 一实例中,高带增益因子计算器A230经配置以应用如图13a所示的梯形开窗函数,其 中窗口重叠两个相邻子帧中的每一者达一毫秒。图13b展示将此开窗函数应用于一 20 毫秒帧的五个子帧中的每一者。高带增益因子计算器A230的其它实施方案可经配置以 应用具有不同重叠周期及/或可为对称或非对称的不问窗口形状(例如,矩形、汉明)的 开窗函数。高带增益因子计算器A230的一实施方案还可能经配置以将不同开窗函数应 用于一帧内的不同子帧,及/或一帧也可能包括具有不同长度的子帧。在一特定实施方案 中,高带增益因子计算器A230经配置以使用如图13a及图13b中所展示的梯形开窗函 数计算子帧增益因子目.还经配置以在不使用开窗函数的情况下计算帧级增益因子。
在无限制的情况下,将下列值呈现为特定实施方案的实例。假设这些情况使用一20 毫秒帧,但可使用任何其它持续时间。对于以7kHz取样的高带信号来说,每一帧具有 140个样本。如果将此帧分成具有相等长度的五个子帧,则每一子帧将具有28个样本, 且如图13a中所示的窗口将为42个样本宽。对于以8kHz取样的高带信号来说,每一帧 具有160个样本。如果将此帧分成具有相等长度的五个子帧,则每一子帧将具有32个 样本,且如图13a所示的窗口将为48个样本宽。在其它实施方案中,可使用具有任何 宽度的子帧,目.高带增益计算器A230的实施方案甚至可能经配置以针对帧的每一样本 产生一不同增益因子。
如上所述,高带编码器A202可包括高带增益因子计算器A230,所述高带增益因子 计算器A230经配置以根据高带信号S30与基于窄带信号S20的信号(例如窄带激发信 号S80、高带激发信号S120或经合成高带信号S130)之间的时间变化关系来计算一系 列增益因子。图14a展示高带增益因子计算器A230的实施方案A232的框图。高带增益 因子计算器A232包括包络计算器G10的实施方案G10a,其经布置以计算第一信号的 包络;及包络计算器G10的实施方案G10b,其经布置以计算第二信号的包络。包络计
算器G10a及G10b可为等同的或可为包络计算器G10的不同实施方案的实例。在某些
21情况下,可将包络计算器G10a及G10b实施为经配置以在不同时间处理不同信号的相同
结构(例如,门阵列)及/或指令集合(例如,若干行码)。
包络计算器G10a及G10b可各经配置以计算振幅包络(例如,根据绝对值函数)或 能量包络(例如,根据平方函数)。通常,每一包络计算器G10a、 G10b经配置以计算相 对于输入信号而子取样的包络(例如,针对输入信号的每一帧或子帧具有一值的包络)。 如以上参看(例如)图11到图13b所述,包络计算器G10a及/或G10b可经配置以根据 开窗函数(其可经布置以重叠相邻帧及/或子帧)来计算包络。
因子计算器G20经配置以根据随时间的两个包络之间的时间变化关系来计算一系 列增益因子。在上文所述的一实例中,因子计算器G20将每一增益因子计算为对应子帧 上的包络的比率的平方根。或者,因子计算器G20可经配置以基于包络之间的距离(例 如在对应子帧期间包络之间的差值或有正负号的平方差值)来计算每一增益因子。可能 需要配置因子计算器G20,从而以分贝或其它以对数方式按比例縮放形式来输出增益因 子的经计算值。举例来说,因子计算器G20可经配置以将两个能量值的比率的对数计算 为能量值的对数的差值。
图14b展示包括高带增益因子计算器A232的一般化布置的框图,其中包络计算器 G10a经布置以基于窄带信号S20计算信号的包络,包络计算器G10b经布置以计算高带 信号S30的包络,且因子计算器G20经配置以输出高带增益因子S60b (例如,到量化 器430)。在此实例中,包络计算器G10a经布置以计算从中间处理Pl所接收的信号的 包络,其可包括如本文所述的经配置以执行窄带激发信号S80的计算、高带激发信号 S120的产生,及/或高带信号S130的合成的结构及/或指令。为方便起见,假设包络计 算器G10a经布置以计算经合成高带信号S130的包络,但其中包络计算器G10a经布置 以计算窄带激发信号S80或高带激发信号S120的包络的实施方案替代地被明确地涵盖 并在此被揭示。
如上所述,可能需要以两个或两个以上不同时间分辨率获得增益因子。举例来说, 可能需要高带增益因子计算器A230经配置以针对待编码的高带信号S30的每一帧计算 帧级增益因子及一系列子帧增益因子两者。图15展示高带增益因子计算器A232的实施 方案A234的框图,其包括包络计算器G10的实施方案G10af、 G10as,实施方案G10af、 G10as经配置以分别计算第一信号(例如,经合成高带信号S130,虽然其中包络计算器 G10af、 G10as经布置以计算窄带激发信号S80或高带激发信号S120的包络的实施方案 被明确地涵盖并在此被揭示)的帧级包络及子帧级包络。高带增益因子计算器A234还 包括包络计算器G10b的实施方案G10bf、 G10bs,实施方案G10bf、 G10bs经配置以分别计算第二信号(例如,高带信号S30)的帧级包络及子帧级包络。
包络计算器G10af及G10bf可为等同的或可为包络计算器G10的不同实施方案的实 例。在某些情况下,可将包络计算器G10af及G10bf实施为经配置以在不同时间处理不 同信号的相同结构(例如,门阵列)及/或指令集合(例如,若干行码)。同样,包络计 算器G10as及G10bs可为等同的,可为包络计算器G10的不同实施方案的实例,或可被 实施为相同结构及/或指令集合。甚至可能在不同时间将所有四个包络产生器G10af、 G10as、 G10bf及G10bs实施为相同可配置结构及/或指令集合。
如本文所描述的因子计算器G20的实施方案G20f、 G20s经布置以基于相应包络计 算帧级增益因子S60bf及子帧级增益因子S60bs。可被实施为乘法器或除法器以适合特 定设计的规范化器N10经布置以根据对应帧级增益因子S60bf (例如,在量化子帧增益 因子之前)规范化每-一组子帧增益因子S60bs。在某些情况下,可能需要通过量化帧级 增益因子S60bf及接着使用对应去量化值来规范化子帧增益因子S60bs来获得可能更精 确的结果。
图16展示高带增益因子计算器A232的另一实施方案A236的框图。在此实施方案 中,如图15中所展示的各种包络及增益计算器经重新布置,使得在计算包络之前对第 一信号执行规范化。可将规范化器N20实施为乘法器或除法器以适合特定设计。在某些 情况下,可能需要通过量化帧级增益因子S60bf及接着使用对应去量化值来规范化第一 信号来获得可能更精确的结果。
量化器430可根据任何已知技术来实施或经开发以执行被认为适用于特定设计的标 量及/或向量量化的一个或一个以上方法。量化器430可经配置以从子帧增益因子分别量 化帧级增益因子。在一实例中,使用四位查找表量化器量化每一帧级增益因子S60bf, 且使用四个位向量量化每一帧的所述组子帧增益因子S60bs。此方案用于有声语音帧的 EVRC-WR编码器中(如在3GPP2文件C.S0014-C版本0.2的节4.18.4中所述,在 www.3gpp2.org处可得)。在另一实例中,使用七位标量量化器来量化每一帧级增益因子 S60bf,目.使用每级具有四个位的多级向量量化器来向量量化每一帧的所述组子帧增益 因子S60bs。此方案用于无声语音帧的EVRC-WB编码器中(如在上文所引用的3GPP2 文件C.S0014-C版本0.2的节4.18.4中所述)。在其它方案中,还可能将每一帧级增益因 子与用于所述帧的子帧增益因子一起量化。
量化器通常经配置以将输入值映射到一组离散输出值中的一者。有限数目的输出值 可用,使得一范围的输入值被映射到单一输出值。量化增加了编码效率,因为指示对应 输出值的索引可以少于原始输入值的位而被传输。图17展示可由标量量化器执行的一
23维映射的一实例,其中(2nD-l) /2与(2nD+l) /2之间的输入值被映射到输出值nD (对 于整数n)。
还可将量化器实施为向量量化器。举例来说,通常使用向量量化器来量化每一帧的 所述组子帧增益因子。图18展示由向量量化器执行的多维映射的一简单实例。在此实 例中,输入空间被分成若干个沃罗诺伊(Voronoi)区域(例如,根据最邻近准则)。量 化将每一输入值映射到表示对应沃罗诺伊(Voronoi)区域(通常为质心)(此处展示为 一点)的值。在此实例中,输入空间分成六个区域,以使得任何输入值可由仅具有六个 不同状态的索引来表示。
图19a展示如可由标量量化器执行的一维映射的另一实例。在此实例中,将从某初 始值a (例如,0dB)延伸到某终点值b (例如,6dB)的输入空间划分为n个区域。n 个区域中的每一者中的值由n个量化值q
到q[n-l]中的对应值表示。在一典型应用中, 所述组n个量化值可用于编码器及解码器,使得量化索引(0到n-l)的传输足以将量化 值从编码器传递到解码器。举例来说,可将所述组量化值存储于每一装置内的有序列表、 表或码簿中。
尽管图19a展示划分为n个有相等大小的区域的输入空间,但可能需要替代地使用 不同大小的区域来划分输入空间。可通过根据输入数据的预期分布来分配量化值来获得 更精确的平均结果是可能的。举例来说,可能需要获得输入空间的预期被更频繁观测的 区域中的较高分辨率(即,较小量化区域),及其它区域处的较低分辨率。图19b展示 此映射的一实例。在另一实例中,量化区域的大小随振幅从a增长到b (例如,以对数 方式)而增加。不同大小的量化区域还可用于向量量化中(例如,如图18中所展示)。 在量化帧级增益因子S60bf的过程中,量化器430可经配置以按需要应用一均匀或不均 匀的映射。同样,在量化子帧增益因子S60bs的过程中,量化器430可经配置以按需要 应用一均匀或不均匀的映射。量化器430可经实施以包括用于因子S60bf及S60bs的单 独量化器及/或可经实施以使用相同可配置结构及/或指令集合来在不同时间量化不同的 增益因子流。
如上文所述,高带增益因子S60b编码原始高带信号S30的包络与基于窄带激发信 号S80的信号(例如,经合成高带信号S130)的包络之间的时间变化关系。此关系可在 解码器处经重构,使得经解码的窄带及高带信号的相对电平近似原始宽带语音信号S10 的窄带及高带分量的相对电平。
如果经解码的语音信号中的各种子带的相对电平不准确,可出现可听假象。举例来 说,当经解码的高带信号相对于对应的经解码窄带信号具有比在原始语音信号中更高的
24电平(例如,更高能量)时,可出现显著假象。可听假象可能有损于用户的体验且降低 编码器的感觉质量。为了获得感知上良好的结果,可能需要子带编码器(例如,高带编 码器A200)在将能量分配给经合成信号的过程中为守恒的。举例来说,可能需要使用 一守恒量化方法来编码经合成信号的增益因子值。
由电平不平衡引起的假象对于其中从另一子带导出对经放大子带的激发的情形可 能尤其有害。此假象可发生于(例如)高带增益因子S60b被量化成大于其原始值的值 时。图19c说明增益因子值R的经量化的值大于原始值的一实例。所述经量化的值在本 文中表示为q[iR],其中iR指示与值R相关联的量化索引且q卜]指示获得由给定索引识别 的量化值的运算。
图20a展示根据一一般实施方案的增益因子限制的方法M100的流程图。任务TQ10 针对子带信3的一部分(例如, 一帧或子帧)的增益因子计算值R。举例来说,任务TQIO 可经配置以将所述值R计算为原始子带帧的能量与经合成子带帧的能量的比率。或者, 增益因子值R可为此比率的对数(例如,以10为底)。任务TQ10可由如上文所描述的 高带增益因子计算器A230的实施方案来执行。
任务TQ20量化增益因子值R。此量化可由标量量化(例如,如本文所描述)的任 何方法或被认为适用于特定编码器设计的任何其它方法(例如,向量量化方法)来执行。 在一典型应用中,任务TQ20经配置以识别对应于输入值R的量化索引iR。举例来说, 任务TQ20可经配置以通过根据所要的搜索策略(例如,最小误差算法)将R的值与量 化列表、表或码簿中的条目进行比较来选择索引。在此实例中,假设量化表或列表是以 搜索策略的下降次序(即,使得q[i-l]《q[i])布置的。
任务TQ30评估经量化增益值与原始值之间的关系。在此实例中,任务TQ30将经 量化增益值与原始值进行比较。如果任务TQ30发现R的经量化值不大于R的输入值, 则方法M100结束。然而,如果任务TQ30发现R的量化值超过R的输入值,则任务TQ50 执行为R选择一不同的量化索弓l。举例来说,任务TQ50可经配置以选择一指示小于q[iR] 的量化值的索引。
在一典型实施方案中,任务TQ50选择量化列表、表或码簿中的下一最低值。图20b 展示包括任务TQ50的此实施方案TQ52的方法M100的一实施方案M110的流程图,其 中任务TQ52经配置以递减量化索引。
在某些情况下,可能需要允许R的经量化值超过R的值某一标称量。举例来说,可 能需要允许R的经量化值超过R的值预期对感知质量具有可接受的较低影响的某一量或 比例。图20c展示用于方法M100的此实施方案M120的流程图。方法M120包括将R
25的经量化值与大于R的上限进行比较的任务TQ30的一实施方案TQ32。在此实例中, 任务TQ32将q[iR]与R与阈值T!的乘积进行比较,其中T,具有大于但接近一 (例如, 1.1或1.2)的值。如果任务TQ32发现经量化值小于(或者,不大于)乘积,则任务TQ50 的实施方案执行。任务TQ30的其它实施方案可经配置以确定R的值与R的经量化值之 间的差值是否符合及/或超过 一 阈值。
在某些情况下,与原始量化值相比,针对R选择一较低量化值将引起经解码的信号 之间的较大差异为可能的。举例来说,此情形可发生于q[^-l]远小于R的值时。方法 M100的其它实施方案包括任务TQ50的执行或配置是视候选量化值(例如,q[iR-l])的 测试而定的方法。
图20d展示方法M100的此实施方案M130的流程图。方法M130包括将候选量化 值(例如,q[iR-l])与小于R的下限进行比较的任务TQ40。在此实例中,任务TQ40 将q[W与R与阈值T2的乘积进行比较,其中T2具有小于但接近一 (例如,0.8或0.9) 的值。如果任务TQ40发现候选量化值不大于(或者,小于)乘积,则方法M130结束。 如果任务TQ40发现经量化值大于(或者,不小于)乘积,则任务TQ50的实施方案执 行。任务TQ40的其它实施方案可经配置以确定候选量化值与R的值之间的差值是否符 合及/或超过一阈值。
可将方法M100的一实施方案应用于帧级增益因子S60bf及/或子帧增益因子S60bs。 在一典型应用中,仅将此方法应用于帧级增益因子。在方法针对帧级增益因子选择新量 化索引的情况下,可能需要基于帧级增益因子的新的经量化值来重新计算对应子帧增益 因子S60bs。或者,子帧增益因子S60bs的计算可经布置以在已对对应帧级增益因子执 行增益因子限制的方法之后发生。
图21展示高带编码器A202的实施方案A203的框图。编码器A203包括增益因子 限制器L10,所述增益因子限制器L10经布置以接收经量化的增益因子值及其原始(即, 预量化)值。限制器L10经配置以根据那些值之间的关系输出高带增益因子S60b。举 例来说,限制器L10可经配置以执行如本文所描述的方法M100的实施方案来将高带增 益因子S60b输出为一个或一个以上量化索引流。图22展示高带编码器A203的实施方 案A204的框图,其经配置以输出如由量化器430所产生的子帧增益因子S60bs及经由 限制器L10输出帧级增益因子S60bf。
图23a展示限制器L10的实施方案L12的操作图。限制器L12将R的预量化值与
后量化值进行比较以确定q[W是否大于R。如果此表达为真,则限制器L12通过将索引
iK的值递减一来选择另一量化索引以产生R的新量化值。否则,不改变索引iR的值。图23b展示限制器L10的另一实施方案L14的操作图。在此实例中,将经量化值与 R的值与阈值T,的乘积进行比较,其中T,具有大于但接近一 (例如,1.1或1.2)的值。 如果q[iR]大于(或者,不小于)T,R,则限制器L14递减索引iR的值。
图23c展示限制器L10的另一实施方案L16的操作图,其经配置以确定提议替代当 前量化值的量化值是否足够接近R的原始值。举例来说,限制器L16可经配置以执行一 额外比较以确定下一最低索引量化值(例如,q[iR-l])是否在距R的预量化值的指定距 离内,或在R的预量化值的指定比例内。在此特定实例中,将候选量化值与R的值与阈 值T2的乘积进行比较,其中T2具有小于但接近一 (例如,0.8或0.9)的值。如果q[iR-l] 小于(或者,不大于)T2R,则比较失败。如果对q[W及q[iK-l]执行的比较中的任一者 失败,则不改变索引k的值。
增益因子之中的变化可能产生经解码的信号的假象,且可能需要配置高带编码器 A200来执行增益因子平滑的方法(例如,通过应用例如一分接头IIR滤波器(one-tap IIR filter)的平滑滤波器)。可将此平滑应用于帧级增益因子S60bf及/或应用于子帧增益因 子S60bs。在此情况下,如本文所描述的限制器L10及/或M100的实施方案可经布置以 将经量化值iR与R的经预平滑值进行比较。可在于2006年4月21申请的标题为"用于 增益因子平滑的系统、方法和设备(SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR SMOOTHING)"的美国专利申请案第11/408,390号(沃斯(Vos)等人) 中的图48到图55b及所附文本(包括段落

)处找到关于此增益因子 平滑的额外描述及图,且出于提供关于增益因子平滑的额外揭示内容的目的,此材料在 此在允许以引用的方式并入的美国及任何其它管辖区中以引用的方式并入。
如果到量化器的输入信号非常平滑,则根据量化的输出空间中的值之间的最小步 长,可能有时经量化的输出要不平滑得多。此效应可导致可听假象,且可能需要为增益 因子减小此效应。在某些情况下,增益因子量化性能可通过实施量化器430以并有临时 噪声成形来改进。可将此成形应用于帧级增益因子S60bf及/或应用于子帧增益因子 S60bs。可在美国专利申请案第11/408,390号中的图48到图55b及所附文本文(包括段 落

)处找到关于使用临时噪声成形量化增益因子的额外描述及图,且 出于提供关于使用临时噪声成形量化增益因子的额外揭示内容的目的,此材料在此在允 许以引用的方式并入的美国及任何其它管辖区中以引用的方式并入。
对于高带激发信号S120是从已被调整的激发信号导出的情况,可能需要根据源激 发信号的时间弯曲来时间弯曲高带信号S30的临时包络。可在沃斯(Vos)等人于2006 年4月3 U申请的标题为"用于高带时间弯曲的系统、方法和设备(SYSTEMS, METHODS,
27AND APPARATUS FOR HIGHBAND TIME WARPING)"的代理人案号050550的美国专 利申请案中的图25到图29及所附文本(包括段落

)处找到关于此时 间弯曲的额外描述及图,且出于提供关于高带信号S30的临时包络的时间弯曲的额外揭 示内容的目的,此材料在此在允许以引用的方式并入的美国及任何其它管辖区中以引用 的方式并入。
高带信号S30与经合成高带信号S130之间的类似程度可指示经解码高带信号S100 与高带信号S30相似的程度。特定来说,高带信号S30的临时包络与经合成高带信号 S130的临时包络之间的类似性可指示可预期经解码高带信号S100具有良好声音质量且 与高带信号S30感知上类似。可将包络之间在时间上的大变化认为是经合成信号非常不 同于原始的指示,且在此情况下,可能需要在量化之前识别及衰减那些增益因子。可在 沃斯(Vos)等人于2006年4月21申请的标题为"用于增益因子衰减的系统、方法和 设备(SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR ATTENUATION)" 的代理人案号050558的美国专利申请案中的图34到图39及所附文本(包括段落
到[000236p处找到关于此增益因子衰减的额外描述及图,且出于提供关于增益因子衰 减的额外揭示内容的目的,此材料在此在允许以引用的方式并入的美国及任何其它管辖 区域中以引用的方式并入。
图24展示高带解码器B200的实施方案B202的框图。高带解码器B202包括高带 激发产生器B300,所述高带激发产生器B300经配置以基于窄带激发信号S80而产生高 带激发信号S120。视特定系统设计选择而定,高带激发产生器B300可根据如本文所提 及的高带激发产生器A300的实施方案中的任一者而被实施。通常需要实施高带激发产 生器B300以与特定编码系统的高带编码器的高带激发产生器具有相同响应。然而,因 为窄带解码器B110通常将执行经编码窄带激发信号S50的去量化,所以在大多情况下, 高带激发产生器B300可经实施以从窄带解码器BUO接收窄带激发信号S80,且无需包 括经配置以去量化经编码窄带激发信号S50的逆量化器。窄带解码器B110还可能经实 施以包括反稀疏滤波器600的实例,其经布置以在经去量化的窄带激发信号被输入到窄 带合成滤波器(例如滤波器330)之前对其进行滤波。
逆量化器560经配置以去量化高带滤波器参数S60a (在此实例中,去量化为一组 LSF),且LSF到LP滤波器系数变换570经配置以将LSF变换为一组滤波器系数(例如, 如上文参考窄带编码器A122的逆量化器240及变换250所述)。如上所提及,在其它实 施方案中,可使用不同系数组(例如,倒频谱系数)及/或系数表示(例如,ISP)。高带 合成滤波器B200经配置以根据高带激发信号S120及所述组滤波器系数而产生经合成高
28带信号。对于高带编码器包括合成滤波器的系统来说(例如,如在上文所述的编码器 A202的实例中),可能需要实施高带合成滤波器B200以与所属合成滤波器具有相同响 应(例如,同一传递函数)。
高带解码器B202还包括逆量化器580,其经配置以去量化高带增益因子S60b; 及增益控制元件590 (例如,乘法器或放大器),其经配置和布置以将所述经去量化的增 益因子应用于经合成高带信号以产生高带信号S100。对于帧的增益包络由一个以上增益 因子指定的情况来说,增益控制元件590可包括经配置以可能根据与由对应高带编码器 的增益计算器(例如,高带增益计算器A230)所应用的开窗函数相同或不同的开窗函 数而将增益因子应用于相应子帧的逻辑。在高带解码器B202的其它实施方案中,增益 控制元件590经类似配置但经布置以将所述经去量化的增益因子应用于窄带激发信号 S80或高带激发信号S120。增益控制元件590还可经实施而以一个以上临时分辨率应用 增益因子(例如,以根据帧级增益因子规范化输入信号,及根据一组子帧增益因子成形 所得信号)。
窄带解码器B110的根据如图8所示的范例的实施方案可经配置以在已恢复长期结 构(音高或谐波结构)之后将窄带激发信号S80输出到高带解码器B200。举例来说, 此解码器可经配置以输出窄带激发信号S80作为经编码窄带激发信号S50的经去量化的 版本。当然,还可能实施窄带解码器BllO,以使得高带解码器B200执行经编码窄带激 发信号S50的去量化以获得窄带激发信号S80。
尽管将本文所揭示的原理主要描述为应用于高带编码,但可将本文所揭示的原理应 用于相对于语音信号的另一子带的语音信号的一子带的任何编码。举例来说,编码器滤 波器组可经配置以将低带信号输出到低带编码器(替代或除一个或一个以上高带信号之 外),且所述低带编码器可经配置以执行所述低带信号的频谱分析、延伸经编码窄带激 发信号,及相对于原始低带信号针对经编码低带信号计算增益包络。对于这些操作中的 每一者来说,明确涵盖及在此揭示低带编码器可经配置以根据如本文所描述的全范围的 变化中的任一者来执行此操作。
提供所描述的配置的前述表达以使得所属领域的技术人员能够进行或使用本文所 揭示的结构及原理。对这些配置的各种修改为可能的,且本文中所呈现的一般原理也可 应用于其它配置。举例来说, 一配置可部分或整体实施为硬连线电路、制造于专用集成 电路中的电路配置、或加载到非易失性存储装置中的固件程序或作为机器可读码从数据 存储媒体加载或加载到数据存储媒体中的软件程序,此码为可由逻辑元件的阵列(例如 微处理器或其它数字信号处理单元)执行的指令。数据存储媒体可为存储元件的阵列,
29例如半导体存储器(其可包括(无限制)动态或静态RAM (随机存取存储器)、ROM (只 读存储器)及/或快闪RAM),或铁电、磁阻、双向、聚合或相变存储器;或盘媒体,例 如磁盘或光盘。术语"软件"应理解为包括源码、汇编语言码、机器码、二进制码、固 件、宏码、微码、可由逻辑元件的阵列执行的指令的任何一个或一个以上集合或序列, 及所述实例的任何组合。
高带增益因子计算器A230、高带编码器A200、高带解码器B200、宽带语音编码器 A100及宽带语音解码器B100的实施方案的各种元件可实施为驻留于(例如)同一芯片 上或芯片组中的两个或两个以上芯片之间的电子及/或光学装置,但还涵盖不具有此限制 的其它布置。此设备的一个或一个以上元件(例如,高带增益因子计算器A230、量化 器430及/或限制器L10)可整体或部分实施为一组或一组以上指令,所述一组或一组以 上指令经布置以执行于逻辑元件(例如,晶体管、门)的一个或一个以上固定或可编程 阵列,例如微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA (现场可编程 门阵列)、ASSP (专用标准产品)及ASIC (专用集成电路)上。 一个或一个以上所述元 件还可能具有共同结构(例如,用于在不同时间执行对应于不同元件的码的部分的处理 器、经执行以在不同时间执行对应于不同元件的任务的一组指令、或在不同时间针对不 同元件执行操作的电子及/或光学装置的布置)。此外, 一个或一个以上所述元件可能用 于执行任务或执行不与所述设备的操作直接相关的其它组指令,例如与设备嵌入于其中 的装置或系统的另一操作相关的任务。
配置还包括如本文明确揭示(例如,通过描述经配置以执行所述方法的结构)的语 音编码、编码及解码的额外方法。这些方法中的每一者还可切实地具体化(例如,在上 文列出的一个或一个以上数据存储媒体中)为可由包括逻辑元件阵列的机器(例如,处 理器、微处理器、微控制器或其它有限状态机器)读取及/或执行的一组或一组以上指令。 因此,本发明不希望限于上文所示的配置,但符合与在本文中以任何方式揭示的原理及 新颖特征一致的最广范围,包括在如所申请的附加权利要求书中,所述权利要求书形成 原始揭示内容的一部分。
权利要求
1.一种语音处理方法,所述方法包含基于(A)基于语音信号的第一子带的第一信号的时间的一部分与(B)基于从所述语音信号的第二子带导出的分量的第二信号的时间的对应部分之间的关系,计算增益因子值;根据所述增益因子值,将第一索引选择到量化值的有序集合中;评估所述增益因子值与所述第一索引所指示的量化值之间的关系;以及根据所述评估的结果,将第二索引选择到量化值的所述有序集合中。
2. 根据权利要求1所述的语音处理方法,其中所述第一信号的时间的所述部分为所述 第一信g的帧,目.其中所述第二信号的时间的所述对应部分为所述第二信号的帧。
3. 根据权利要求1所述的语音处理方法,其中所述第一子带为高带信号,目.其中所述第二子带为窄带信s-。
4. 根据权利要求l所述的语音处理方法,其屮所述第一子带为高带信号,且其中所述第二信号为所述高带信号的经合成版本。
5. 根据权利要求1所述的语音处理方法,其中所述第二信号基于从所述第一子带导出 的分量。
6. 根据权利要求5所述的语音处理方法,其中所述从所述第一子带导出的分量为所述 第一子带的频谱包络。
7. 根据权利要求l所述的语音处理方法,其中所述从所述语音信号的第二子带导出的分量为经编码激发信s-。
8. 根据权利要求7所述的语音处理方法,其中所述第二信号基于所述第一子带的频谱 包络。
9. 根据权利要求1所述的语音处理方法,其中所述第一信号的时间的一部分与所述第二信号的时间的对应部分之间的所述关系为所述第一信号的时间的所述部分的能 量的测量与所述第二信号的时间的所述对应部分的能量的测量之间的关系。
10. 根据权利要求9所述的语音处理方法,其中所述计算增益因子值包含基于所述第一 信3的时间的所述部分的能量的所述测量与所述第二信号的时间的所述对应部分 的能量的所述测量之间的比率来计算所述增益因子值。
11. 根据权利要求1所述的语音处理方法,其中所述选择第一索引包含将所述增益因子 值与多个所述量化值中的每一者进行比较。
12. 根据权利要求1所述的语音处理方法,其中所述第一索引指示所述有序集合之中最 接近所述增益因子值的所述量化值。
13. 根据权利要求1所述的语音处理方法,其中所述评估关系包含确定所述第一索引所指示的所述量化值是否超过所述增益因子值。
14. 根据权利要求1所述的语音处理方法,其中所述评估关系包含以下各项中的至少一 者(C)确定所述第一索引所指示的所述量化值是否超过所述增益因子值一特定 量,及(D)确定所述第一索引所指示的所述量化值是否超过所述增益因子值所述 增益因子值的一特定比例。
15. 根据权利要求1所述的语音处理方法,其中所述选择第二索引包含递减所述第一索 引。
16. 根据权利要求1所述的语音处理方法,其中所述第二索引指示小于所述第一索引所 指示的所述量化值的量化值。
17. 根据权利要求1所述的语音处理方法,其中所述第二索引指示所述有序集合之中最 接近所述增益因子值而不超过所述增益因子值的所述量化值。
18. 根据权利要求1所述的语音处理方法,其中所述选择第二索引包含评估所述增益因子值与所述第二索引所指示的量化值之间的关系。
19. 根据权利要求18所述的语音处理方法,其中所述评估所述增益因子值与所述第二 索引所指示的量化值之间的关系包含确定所述第二索引所指示的所述量化值是否 在所述增益因子值的一特定比例内。
20. —种计算机程序产品,其包含计算机可读媒体,所述计算机可读媒体包含用于致使至少一个计算机基于(A)基于语音信^的第一子带的第一信号的时 间的一部分与(B)基于从所述语音信号的第二子带导出的分量的第二信号的时 间的对应部分之间的关系来计算增益因子值的码;用于致使至少一个计算机根据所述增益因子值将第一索引选择到量化值的有 序集合中的码;用于致使至少一个计算机评估所述增益因子值与所述第一索引所指示的量化 值之间的关系的码;以及用于致使至少一个计算机根据所述评估的结果将第二索引选择到量化值的所 述有序集合中的码。
21. —种用于语音处理的设备,所述设备包含计算器,其经配置以基于(A)基于语音信号的第一子带的第一信号的时间的一 部分与(B)基于从所述语音信号的第二子带导出的分量的第二信号的时间的对应 部分之间的关系来计算增益因子值;量化器,其经配置以根据所述增益因子值将第一索引选择到量化值的有序集合中;以及限制器,其经配置(A)以评估所述增益因子值与所述第一索引所指示的量化 值之间的关系,及(B)以根据所述评估的结果来将第二索引选择到量化值的所述 有序集合中。
22. 根据权利要求21所述的设备,其中所述第一信号的时间的所述部分为所述第一信 弓-的帧,且其中所述第二信号的时间的所述对应部分为所述第二信号的帧。
23. 根据权利要求21所述的设备,其中所述第一子带为高带信号,且其中所述第二子带为窄带信号。
24. 根据权利要求21所述的设备,其中所述从所述语音信号的第二子带导出的分量为 经编码激发信号。
25. 根据权利要求24所述的设备,其中所述第二信号基于所述第一子带的频谱包络。
26. 根据权利要求21所述的设备,其中所述计算器经配置以基于所述第一信号的时间 的所述部分的能量的测量与所述第二信号的时间的所述对应部分的能量的测量之 间的比率来计算所述增益因子值。
27. 根据权利要求21所述的设备,其中所述限制器经配置以通过确定所述第一索引所 指示的量化值是否超过所述增益因子值来评估所述增益因子值与所述第一索引所 指示的所述量化值之间的关系。
28. 根据权利要求21所述的设备,其中所述限制器经配置以通过以下各项中的至少一 者来评估所述增益因子值与所述第一索引所指示的量化值之间的关系(C)确定 所述第一索引所指示的所述量化值是否超过所述增益因子值一特定量,及(D)确 定所述第一索引所指示的所述量化值是否超过所述增益因子值所述增益因子值的 一特定比例。
29. 根据权利要求21所述的设备,其中所述第二索引指示所述有序集合之中最接近所 述增益因子值而不超过所述增益因子值的所述量化值。
30. 根据权利要求21所述的设备,其中所述限制器经配置以确定所述第二索引所指示 的所述量化值是否在所述增益因子值的一特定比例内。
31. 根据权利要求21所述的设备,所述设备包含具有编码器的蜂窝电话,所述编码器 包括所述计算器、所述量化器及所述限制器。
32. 根据权利要求21所述的设备,所述设备包含经配置以传输具有符合因特网协议的 版本的格式的多个包的装置,其中所述多个包包括编码所述第一子带的参数、编码 所述第二子带的参数及所述第二索引。
33. —种用于语音处理的设备,所述设备包含用于基于(A)基于语音信号的第一子带的第一信号的时间的一部分与(B)基 于从所述语音信号的第二子带导出的分量的第二信号的时间的对应部分之间的关 系计算增益因子值的装置;用于根据所述增益因子值将第一索引选择到量化值的有序集合中的装置;以及 用于评估所述增益因子值与所述第一索引所指示的量化值之间的关系及用于根 据所述评估的结果将第二索引选择到量化值的所述有序集合中的装置。
34. 根据权利要求33所述的设备,其中所述从所述语音信号的第二子带导出的分量为 经编码激发信号。
35. 根据权利要求34所述的设备,其中所述第二信号基于所述第一子带的频谱包络。
36. 根据权利要求33所述的设备,其中所述用于计算的装置经配置以基于所述第一信 号的时间的所述部分的能量的测量与所述第二信号的时间的所述对应部分的能量 的测量之间的比率来计算所述增益因子值。
37. 根据权利要求33所述的设备,其中所述第二索引指示所述有序集合之中最接近所 述增益因子值而不超过所述增益因子值的所述量化值。
全文摘要
所揭示的配置的范围包括单独编码语音信号的子带的方法,其中第一子带的激发是从第二子带导出。增益因子经计算以指示原始第一子带的包络与经合成第一子带的包络之间的时间变化关系。所述增益因子经量化,且超过预量化值的经量化值被重新编码。
文档编号G10L21/02GK101496101SQ200780028037
公开日2009年7月29日 申请日期2007年7月31日 优先权日2006年7月31日
发明者文卡特什·克里希南, 阿南塔帕德马那伯罕·A·坎达哈达伊 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1