用于在与语音信号相关联的包中包含识别符的系统及方法

文档序号:2830518阅读:336来源:国知局
专利名称:用于在与语音信号相关联的包中包含识别符的系统及方法
技术领域
本系统及方法大体上涉及语音处理技术。更明确地说,本系统及方法涉及在与语音 信号相关联的包中包含识别符。
背景技术
通过数字技术的声音传输变得普遍,尤其是在长距离及数字无线电电话应用中变得 普遍。此又产生了对确定在维持重构语音的被感知质量的同时可经由信道发送的信息的 最小量的兴趣。用于压縮语音的装置可用于电信的许多领域中。电信的实例为无线通信。 无线通信的领域具有许多应用,其包括(例如)无绳电话、寻呼机、无线局域环路、例 如蜂窝式及便携式通信系统(PCS)电话系统的无线电话、移动因特网协议(IP)电话 及卫星通信系统。尤其重要的应用为用于移动订户的无线电话。

发明内容



图la展示根据一配置的宽带语音编码器A100的框图lb展示宽带语音编码器AIOO的一实施方案A102的框图2a展示根据一配置的宽带语音解码器B100的框图2b展示宽带语音解码器B100的一实施方案B102的框图3a展示滤波器组A110的一实施方案A112的框6图3b展示滤波器组B120的一实施方案B122的框图4a展示滤波器组A110的一实例的低带及高带的带宽覆盖;
图4b展示滤波器组A110的另一实例的低带及高带的带宽覆盖;
图4c展示滤波器组A112的一实施方案A114的框图4d展示滤波器组B122的一实施方案B124的框图5a展示语音信号的频率与对数振幅的曲线的一实例;
图5b展示基本线性预测编码系统的框图6展示窄带编码器A120的一实施方案A122的框图7展示窄带解码器B110的一实施方案B112的框图8a展示有声语音的残余信号的频率与对数振幅的曲线的一实例;
图8b展示有声语音的残余信号的时间与对数振幅的曲线的一实例;
图9展示还执行长期预测的基本线性预测编码系统的框图10展示高带编码器A200的一实施方案A202的框图11展示高带激励产生器A300的一实施方案A302的框图12展示频谱扩展器A400的一实施方案A402的框图12a展示在频谱扩展操作的一实例中多个点处的信号频谱的曲线;
图12b展示在频谱扩展操作的另一实例中多个点处的信号频谱的曲线;
图13展示高带激励产生器A302的一实施方案A304的框图14展示高带激励产生器A302的一实施方案A306的框图15展示用于包络计算任务T100的流程图16展示组合器4卯的一实施方案492的框图17说明计算高带信号S30的周期性的量度的方法;
图18展示高带激励产生器A302的一实施方案A312的框图19展示高带激励产生器A302的一实施方案A314的框图20展示高带激励产生器A302的一实施方案A316的框图21展示用于增益计算任务T200的流程图22展示用于增益计算任务T200的一实施方案T210的流程图23a展示开窗函数的图23b展示如图23a中所示的开窗函数对语音信号的子帧的应用;
图24展示高带解码器B200的一实施方案B202的框图25展示宽带语音编码器A100的一实施方案AD10的框图;图26a展示延迟线D120的一实施方案D122的示意图26b展示延迟线D120的一实施方案D124的示意图27展示延迟线D120的一实施方案D130的示意图28展示宽带语音编码器AD10的一实施方案AD12的框图29展示根据一配置的信号处理方法MD100的流程图30展示用于根据一配置的方法M100的流程图31a展示用于根据一配置的方法M200的流程图31b展示用于方法M200的一实施方案M2I0的流程图32展示用于根据一配置的方法M300的流程图33说明无线通信系统的一配置;
图34为说明信号传输环境的一配置的框图35为说明用于在与语音信号相关联的包中包括识别符的方法的一配置的流程图; 图36为说明解码包的方法的一配置的流程图37为说明与多模式解码器进行通信的多模式编码器的一配置的框图38为说明可变速率语音编码方法的一配置的流程图39为说明规则窄带半速率包及宽带半速率包的一配置的框图40为说明分配到各种类型的包的位的数目的表;及
图41为在通信装置的一配置中的某些组件的框图。
具体实施例方式
本发明描述一种用于在与语音信号相关联的包中包含识别符的方法。接收信号。将 所述信号分割为多个帧。将所述信号的帧编码到包中。确定将所述包编码为宽带包还是
窄带包。基于所述确定,在包中封装识别符。传输所述包。从N位参数提供至少两个非 法值,其中来自所述N位参数的至少一个位用于载送信息。用于载送信息的来自所述N 位参数的位的数目等于1og2(X),其中X为从所述N位参数提供的非法值的数目。
还描述一种用于在与语音信号相关联的包中包含识别符的设备。所述设备包括处理 器及与所述处理器进行电子通信的存储器。指令存储于所述存储器中。所述指令可执行 以接收信号;将所述信号分割为多个帧;将所述信号的帧编码到包中;确定将所述包 编码为宽带包还是窄带包;基于所述确定,在所述包中封装识别符;及传输所述包。
还描述一种经配置以在与语音信号相关联的包中包含识别符的系统。所述系统包括用于处理的装置及用于接收信号的装置。描述用于将所述信号分割为多个帧的装置,及 用于将所述信号的帧编码到包中的装置。描述用于确定将所述包编码为宽带包还是窄带 包的装置。描述用于基于所述确定而在所述包中封装识别符的装置,及用于传输所述包 的装置。
还描述一种计算机可读媒体。所述媒体经配置以存储一组指令,所述指令可执行以 接收信号;将所述信号分割为多个帧;将所述信号的帧编码到包中;确定将所述包编码 为宽带包还是窄带包;基于所述确定,在所述包中封装识别符;及传输所述包。
还描述一种用于解码包的方法。接收包。分析在所述包中所包括的识别符。确定所 述包是由宽带编码器还是由窄带编码器编码。基于所述确定,选择用于所述包的解码模 式。
还描述一种用于解码包的设备。所述设备包括处理器及与所述处理器进行电子通信 的存储器。指令存储于所述存储器中。所述指令可执行以接收包;分析在所述包中所 包括的识别符;确定所述包是由宽带编码器还是由窄带编码器编码;及基于所述确定, 选择用于所述包的解码模式。
还描述一种经配置以解码包的系统。所述系统包括用于处理的装置及用于接收包的 装置。描述用于分析包括于所述包中的识别符的装置,及用于确定所述包是由宽带编码 器还是由窄带编码器编码的装置。描述用于基于所述确定而选择用于所述包的解码模式 的装置。
还描述一种计算机可读媒体。所述媒体经配置以存储一组指令,所述指令可执行以 接收包;分析在所述包中所包括的识别符;确定所述包是由宽带编码器还是由窄带编码 器编码;及基于所述确定,选择用于所述包的解码模式。
现参看附图来描述所述系统及所述方法的各种配置,其中相同参考标号指示相同或 功能类似的元件。如大致在本文中的各图中所描述及说明,可以广泛的多种不同配置来 布置及设计本系统及方法的特征。因此,下文的详细描述并不希望限制如所主张的系统 及方法的范围,而是仅表示所述系统及所述方法的配置。
可将本文中所揭示的配置的许多特征实施为计算机软件、电子硬件或两者的组合。
为清楚地说明硬件与软件的此互换性,将大致就各种组件的功能性来描述所述组件。将 此功能性实施为硬件还是软件视特定应用及强加于整个系统的设计约束而定。所属领域 的技术人员可以针对每一特定应用的变化的方式来实施所描述的功能性,但不应将所述 实施方案决策解释为导致脱离本系统及方法的范围。
在将所描述的功能性实施为计算机软件的情况下,此软件可包括任何类型的位于存
9储器装置内及/或作为电子信号而经由系统总线或网络传输的计算机指令或计算机可执 行码。实施与本文中所描述的组件相关联的功能性的软件可包含单个指令或许多指令, 且可分布在若干不同码段、分布于不同程序中及分布为跨越若干存储器装置。
如本文中所使用,术语"一配置"、"配置"、"若干配置"、"所述配置"、"所述若干 配置"、"一个或一个以上配置"、"一些配置"、"某些配置"、"一个配置"、"另一配置" 及其类似物意味着"所揭示的系统及方法的一个或一个以上(但未必全部)配置",除 非另外明确规定。
术语"确定"(及其语法变体)是以极为广泛的意义来使用。术语"确定"包含广 泛的多种动作且因此"确定"可包括核算、计算、处理、导出、调查、査找(例如,在 表格、数据库或另一数据结构中进行查找)、查明及其类似物。并且,"确定"可包括接 收(例如,接收信息)、存取(例如,存取存储器中的数据)及其类似物。并且,"确定" 可包括解析、选择、挑选、建立及其类似物。
短语"基于"并不意味着"仅基于",除非另外明确规定。换句话说,短语"基于" 描述"仅基于"与"至少基于"两者。
蜂窝式网络可包括由许多小区(每一小区由固定传输器服务)构成的无线电网络。 可将所述多个传输器称为小区站点或基站。通过经由通信信道将语音信号传输到基站, 小区可与网络中的其它小区通信。小区可将语音信号划分为多个帧(例如,20毫秒(ms) 的语音信号)。可将每一帧编码到包中。包可包括某一数量的位,所述位接着在通信信 道上被传输到接收基站或接收小区。接收基站或接收小区可将包拆包且解码各种帧以重 构信号。
可将包编码为全速率包(171位)、半速率包(80位)、四分之一速率包(40位)或 八分之一速率包(16位)。此外,可利用窄带编码器或宽带编码器来编码包。由宽带编 码器编码的包可被编码为全速率包、半速率包或八分之一速率包。由窄带编码器编码的 包可被编码为全速率包、半速率包、四分之一速率包或八分之一速率包。可针对各种类 型的包实施宽带编码器,包括编码激励线性预测(CELP)包及噪声激励线性预测(NELP) 包。可对CELP包、原型音高周期(PPP)包及NELP包实施窄带编码器。
在编码包之后,在包中可包括识别符以便对解码器指示所述包是由宽带编码器还是 由窄带编码器所编码。在识别符中所包括的信息可对解码器指示所述包是应使用宽带解 码器还是窄带解码器予以解码。举例来说,第四代声码器(4GV)宽带(WB)编码器 可编码半速率(80位)包。所述包可不具有用以识别更多类型的包的显式位。因而,包 括7位音高滞后的无效位模式可用于识别包括73位(或73位以下)的一个或一个以上包。然而,4GV-WB半速率包可需要74位,且因而,可能无法针对4GV-WB半速率包 利用7位音高滞后识别符(因为在此实例中,可用于半速率的位的总数目为80)。在一 方面中,7位音高滞后识别符的两个无效样式(彼此相差一个位)可用于识别4GV-WB 半速率包。(七个位中的)六个位可用作识别符,因此除了73位之外,释放了一个不同 位以由4GV-WB半速率包使用,其产生用于4GV-WB半速率包的74位。
本文中所描述的配置包括可经配置以对窄带语音编码器提供扩展从而支持以约800 bps到1000 bps (位每秒)的带宽增量来传输及/或存储宽带语音信号的系统、方法及设 备。所述实施方案的潜在优势包括用以支持与窄带系统的兼容性的嵌入式编码、在窄 带编码信道与高带编码信道之间的相对容易的位分配及再分配、避免了计算密集型宽带 合成运算及维持待由计算密集型波形编码例行程序处理的信号的低取样速率。
除非上下文明确限制,否则术语"计算"在本文中用于指示其一般意义中的任一意 义,例如演算、产生一列值及从一列值进行选择。在本描述及权利要求书中使用术语"包 含"时,其并不排除其它元件或操作。术语"A基于B"用于指示其一般意义中的任一 意义,包括(i) "A等同于B"及(ii) "A至少基于B"的情况。术语"因特网协议" 包括版本4 (如IETF (因特网工程任务组)RFC (请求评论)791中所描述)及随后版 本(例如版本6)图la展示根据一配置的宽带语音编码器A100的框图。滤波器组A110经配置以对 宽带语音信号S10进行滤波,以产生窄带信号S20及高带信号S30。窄带编码器A120 经配置以编码窄带信号S20,以产生窄带(NB)滤波器参数S40及窄带残余信号S50。 如本文中进一步详细描述,窄带编码器A120通常经配置以产生作为码簿索引或以另一 经量化形式的窄带滤波器参数S40及经编码窄带激励信号S50。高带编码器A200经配 置以根据在经编码窄带激励信号S50中的信息而编码高带信号S30,以产生高带编码参 数S60。如本文中进一步详细描述,高带编码器A200通常经配置以产生作为码簿索引 或以另一量化形式的高带编码参数S60。宽带语音编码器A100的一特定实例经配置而 以约8.55 kbps (千位每秒)的速率来编码宽带语音信号S10,其中约7.55 kbps用于窄 带滤波器参数S40及经编码窄带激励信号S50,且约lkbps用于高带编码参数S60。
可能需要将经编码窄带与高带信号组合为单一位流。举例来说,可能需要将经编码 信号多路复用在一起以作为经编码宽带语音信号而(例如,经由有线、光学或无线传输 信道)传输或存储。图lb展示宽带语音编码器A100的一实施方案A102的框图,其包 括多路复用器A130,所述多路复用器A130经配置以将窄带滤波器参数S40、经编码窄 带激励信号S50及高带滤波器参数S60组合为经多路复用信号S70。包括编码器A102的设备还可包括电路,所述电路经配置以将经多路复用信号S70 传输到例如有线、光学或无线信道的传输信道中。所述设备还可经配置以执行对信号的 一个或一个以上信道编码操作,例如误差校正编码(例如,速率兼容巻积编码)及/或误 差检测编码(例如,循环冗余编码)及/或一个或一个以上层的网络协议编码(例如,以 太网、TCP/IP、 cdma2000)。
可能需要配置多路复用器A130以将经编码窄带信号(包括窄带滤波器参数S40及 经编码窄带激励信号S50)作为经多路复用信号S70的可分子流而嵌入,使得经编码窄 带信号可独立于经多路复用信号S70的另一部分(例如高带及/或低带信号)而被恢复及 解码。举例来说,经多路复用信号S70可经布置以使得经编码窄带信号可通过去除高带 滤波器参数S60而得以恢复。所述特征的一潜在优势为避免了在将经编码宽带信号传 递到支持窄带信号的解码但不支持高带部分的解码的系统之前,将经编码宽带信号进行 码变换的需要。
图2a为根据一配置的宽带语音解码器B100的框图。窄带解码器B110经配置以解 码窄带滤波器参数S40及经编码窄带激励信号S50,以产生窄带信号S90。高带解码器 B200经配置以根据窄带激励信号S80基于经编码窄带激励信号S50来解码高带编码参 数S60,以产生高带信号SIOO。在此实例中,窄带解码器B110经配置以将窄带激励信 号S80提供到高带解码器B200。滤波器组B120经配置以将窄带信号S90与高带信号 S100组合,以产生宽带语音信号SllO。
图2b为宽带语音解码器B100的一实施方案B102的框图,其包括解多路复用器 B130,所述解多路复用器B130经配置以从经多路复用信号S70产生经编码信号S40、 S50及S60。包括解码器B102的设备可包括电路,所述电路经配置以从例如有线、光学 或无线信道的传输信道接收经多路复用信号S70。所述设备还可经配置以执行对信号的 一个或一个以上信道解码操作,例如误差校正解码(例如,速率兼容巻积解码)及/或误 差检测解码(例如,循环冗余解码)及/或一个或一个以上层的网络协议解码(例如,以 太网络、TCP/IP、 cdma2000)。
滤波器组A110经配置以根据带分割方案来对输入信号进行滤波,以产生低频率子 带及高频率子带。视针对特定应用的设计标准而定,输出子带可具有相等或不等带宽且 可重叠或不重叠。产生两个以上子带的滤波器组A110的配置也是可能的。举例来说, 所述滤波器组可经配置以产生一个或一个以上低带信号,所述信号包括在低于窄带信号 S20的频率范围的频率范围(例如50Hz到300Hz的范围)内的分量。所述滤波器组还 可能经配置以产生一个或一个以上额外高带信号,所述信号包括在高于高带信号S30的
12频率范围的频率范围(例如14 kHz到20 kHz、 16 kHz到20 kHz或16 kHz到32 kHz的
范围)内的分量。在所述情况下,宽带语音编码器A100可经实施以单独编码所述信号, 且多路复用器A130可经配置以将额外经编码信号包括于经多路复用信号S70中(例如, 作为可分部分)。
图3a展示滤波器组A110的一实施方案A112的框图,其经配置以产生具有降低取 样速率的两个子带信号。滤波器组A110经布置以接收具有高频率(或高带)部分及低 频率(或低带)部分的宽带语音信号SIO。滤波器组A112包括低带处理路径,其经 配置以接收宽带语音信号S10且产生窄带语音信号S20;及高带处理路径,其经配置以 接收宽带语音信号SIO且产生高带语音信号S30。低通滤波器110对宽带语音信号SIO 进行滤波以使选定低频率子带通过,且高通滤波器130对宽带语音信号S10进行滤波以 使选定高频率子带通过。因为两个子带信号均具有比宽带语音信号S10更窄的带宽,所 以其取样速率可降低到某一程度而不会损失信息。降取样器(downsampler) 120根据所 要抽取因子来降低低通信号的取样速率(例如,通过移除信号的样本及/或以平均值替代 样本),且降取样器140同样根据另一所要抽取因子来降低高通信号的取样速率。
图3b展示滤波器组B120的一对应实施方案B122的框图。升取样器(upsampler) 150增加窄带信号S90的取样速率(例如,通过零塞入及/或通过复制样本),且低通滤 波器160对经升取样信号进行滤波以使低带部分通过(例如,以避免假信号)。同样, 升取样器170增加高带信号S100的取样速率,且高通滤波器180对经升取样信号进行 滤波以使高带部分通过。接着将所述两个通带信号求和以形成宽带语音信号SllO。在解 码器B100的一些实施方案中,滤波器组B120经配置以根据由高带解码器B200接收及 /或计算的一个或一个以上权重来产生两个通带信号的加权和。还涵盖组合两个以上通带 信号的滤波器组B120的配置。
滤波器110、 130、 160、 180中的每一者均可实施为有限脉冲响应(FIR)滤波器或 无限脉冲响应(IIR)滤波器。编码器滤波器IIO及130的频率响应可在阻带与通带之间 具有对称或不同形状的过渡区域。同样,解码器滤波器160及180的频率响应可在阻带 与通带之间具有对称或不同形状的过渡区域。低通滤波器110可能需要具有与低通滤波 器160相同的响应,且高通滤波器130可能需要具有与高通滤波器180相同的响应。在 一实例中,两个滤波器对110、 130及160、 180为正交镜像滤波器(QMF)组,其中滤 波器对110、 130具有与滤波器对160、 180相同的系数。
在一典型实例中,低通滤波器110具有包括300 Hz到3400 Hz的有限PSTN范围的 通带(例如,从0kHz妾IJ4kHz的带)。图4a及图4b展示在两个不同实施性实例中的宽带语音信号SIO、窄带信号S20及髙带信号S30的相对带宽。在所述两个特定实例中, 宽带语音信号S10具有16 kHz的取样速率(表示频率分量在0 kHz到8 kHz的范围内), 且窄带信号S20具有8 kHz的取样速率(表示频率分量在0 kHz到4 kHz的范围内)。
在图4a的实例中,在两个子带之间不存在显著重叠。可使用具有4 kHz到8 kHz 的通带的高通滤波器130获得此实例中所示的高带信号S30。在所述情况下,可需要通 过以因子2将经滤波信号降取样来将取样速率降低到8 kHz。所述操作(可预期其将显 著降低对信号的进一步处理操作的计算复杂度)将使通带能量下降到0 kHz到4 kHz的 范围内而不会损失信息。
在图4b的替代实例中,上子带与下子带具有可观的重叠,使得两个子带信号均描 述3.5 kHz到4 kHz的区域。可使用具有3.5 kHz到7 kHz的通带的高通滤波器130获得 在此实例中的高带信号S30。在所述情况下,可需要通过以16/7的因子将滤波信号降取 样来将取样速率降低到7 kHz。所述操作(可预期其将显著降低对信号的进一步处理操 作的计算复杂度)将使通带能量下降到OkHz到3.5 kHz的范围内而不会损失信息。
在用于电话通信的典型手持机中,转换器(即,麦克风及耳机或扬声器)中的一者 或一者以上缺乏在7kHz到8 kHz的频率范围内的明显响应。在图4b的实例中,在经编 码信号中不包括宽带语音信号S10在7kHz与8kHz之间的部分。高通滤波器130的其 它特定实例具有3.5 kHz到7.5 kHz及3.5 kHz到8 kHz的通带。
在一些实施方案中,提供在子带之间的重叠(如在图4b的实例中)允许使用在重 叠区域上具有平滑滚落(rolloff)的低通及/或高通滤波器。所述滤波器通常较容易设计、 计算复杂度较低及/或比具有更急剧或"砖墙"响应的滤波器引入较少延迟。具有急剧过 渡区域的滤波器倾向于比具有平滑滚落的类似阶数的滤波器具有更高旁瓣(旁瓣可导致 假信号)。具有急剧过渡区域的滤波器还可具有可导致振铃伪影(ringing artifact)的长 脉冲响应。对于具有一个或一个以上IIR滤波器的滤波器组实施方案来说,允许在重叠 区域上的平滑滚落可能够使用极点远离单位圆的滤波器,此对于确保稳定的固定点实施 方案可为重要的。
子带的重叠允许低带与高带的平滑掺合,此可导致较少可听伪影、减少的假信号及 /或从一个带到另一带的较不明显的过渡。此外,窄带编码器A120 (例如,波形编码器) 的编码效率可随着频率增加而下降。举例来说,窄带编码器的编码质量可在低位速率处 降低(尤其在存在背景噪声的情况下)。在所述情况下,提供子带的重叠可增加在重叠 区域中的再生频率分量的质量。
此外,子带的重叠允许低带与高带的平滑掺合,此可导致较少可听伪影、减少的假
14信号、及/或从一个带到另一带的较不明显的过渡。所述特征可尤其合乎其中窄带编码器 A120及高带编码器A200根据不同编码方法操作的实施方案的需要。举例来说,不同编 码技术可产生听起来非常不同的信号。编码以码簿索引形式的频谱包络的编码器可产生 一信号,其具有与编码振幅频谱的编码器产生的信号不同的声音。时域编码器(例如, 脉冲码调制或PCM编码器)可产生一信号,其具有与频域编码器所产生的信号不同的 声音。利用频谱包络及对应残余信号的表示来编码信号的编码器可产生一信号,其具有 与利用频谱包络的表示来编码信号的编码器所产生的信号不同的声音。将信号编码为其 波形的表示的编码器可产生一输出,其具有不同于来自正弦编码器的输出的声音。在所 述情况下,使用具有急剧过渡区域的滤波器来界定非重叠子带可导致在经合成的宽带信 号中的子带之间的突然且明显可感知的过渡。
虽然具有互补重叠频率响应的QMF滤波器组通常用于子带技术中,但所述滤波器 不适于本文中所描述的宽带编码实施方案中的至少一些实施方案。在编码器处的QMF 滤波器组经配置以产生显著程度的假信号,所述假信号在解码器处的对应QMF滤波器 组中被消去。所述布置可能不适用于其中信号在滤波器组之间发生显著量的失真的应用 中,因为失真可降低假信号消去性质的有效性。举例来说,本文中所描述的应用包括经 配置而以极低位速率操作的编码实施方案。由于所述极低位速率,所以与原始信号相比, 经解码信号可能表现出显著失真,使得使用QMF滤波器组可导致未消去的假信号。使 用QMF滤波器组的应用通常具有较高位速率(例如,对AMR来说超过12 kbps,对于 G.722来说超过64 kbps)。
另外,编码器可经配置以产生感知上类似于原始信号但实际上显著不同于原始信号 的经合成信号。举例来说,如本文中所描述的从窄带残余得出高带激励的编码器可产生 所述信号,因为实际高带残余可完全不存在于经解码信号中。QMF滤波器组在所述应用 中的使用可导致由未消去的假信号引起的显著程度的失真。
由于假信号的影响限于等于子带宽度的带宽,因此如果受影响的子带较窄,则可降 低由QMF假信号引起的失真量。然而,对于本文中所描述的每一子带包括宽带带宽的 约一半的实例来说,由未消去的假信号引起的失真可影响信号的显著部分。信号的质量 还可受其上出现未消去的假信号的频带的位置的影响。举例来说,在宽带语音信号的中 心附近(例如,在3kHz与4kHz之间)产生的失真可比出现于信号的边缘附近(例如, 超过6kHz)的失真有害得多。
虽然QMF滤波器组的滤波器的响应严格地彼此相关,但滤波器组A110及B120的 低带路径及高带路径可经配置以具有完全不相关的频谱(除两个子带的重叠以外)。我们将两个子带的重叠定义为从高带滤波器的频率响应下降到-20 dB的点直到低带滤波器 的频率响应下降到-20 dB的点的距离。在滤波器组A110及/或B120的各种实例中,此 重叠在从约200 Hz到约1 kHz的范围内。约400 Hz到约600 Hz的范围可表示在编码效 率与感知平滑度之间的所要折衷。在上文所提及的一特定实例中,重叠为约500Hz。
可能需要实施滤波器组A112及/或B122以在若干阶段中执行图4a及图4b中所说 明的操作。举例来说,图4c展示滤波器组A112的一实施方案A114的框图,其使用一 系列内插、重取样、抽取及其它操作来执行高通滤波及降取样操作的功能等同操作。所 述实施方案可较易于设计及/或可允许再使用逻辑及/或编码的功能块。举例来说,相同 功能块可用于执行对14 kHz的抽取及对7 kHz的抽取的操作(如图4c中所示)。通过将
信号与函数^^或序列(-l)"(其值在+l与-1之间交替)相乘,可实施频谱反转操作。可 将频谱成形操作实施为经配置以成形信号以获得所要整体滤波器响应的低通滤波器。
应注意到,由于频谱反转操作,高带信号S30的频谱被反转。可相应地配置在编码 器及对应解码器中的随后操作。举例来说,如本文所描述的高带激励产生器A300可经 配置以产生也具有频谱反转形态的高带激励信号S120。
图4d展示滤波器组B122的一实施方案B124的框图,其使用一系列内插、重取样 及其它操作来执行升取样及高通滤波操作的功能等同操作。滤波器组B124包括在高带 中的频谱反转操作,其反转与(例如)在编码器的滤波器组(例如滤波器组A114)中 执行的操作类似的操作。在此特定实例中,滤波器组B124还包括在低带及高带中衰减 信号在7100Hz处的分量的陷波滤波器,但所述陷波滤波器是任选的且无需被包括。
窄带编码器A120根据源-滤波器模型而实施,其将输入语音信号编码为(A)描述 滤波器的一组参数;及(B)驱动所描述滤波器产生输入语音信号的经合成再现信号的 激励信号。图5a展示语音信号的频谱包络的一实例。表现此频谱包络的特征的峰值表 示声道的共振且被称为共振峰。大多数语音编码器至少将此粗略频谱结构编码为例如滤 波器系数的一组参数。
图5b展示如应用于窄带信号S20的频谱包络的编码的基本源-滤波器布置的一实 例。分析模块计算表现对应于一时间周期(通常20毫秒)内的语音的滤波器的特征的 一组参数。根据所述滤波器参数而配置的白化滤波器(还称为分析或预测误差滤波器) 移除频谱包络,以在频谱上平化所述信号。所得经白化信号(还称为残余)具有较少能 量,且因此具有较小方差,且比原始语音信号更易于编码。由编码残余信号产生的误差 还可更均匀地散布于频谱上。滤波器参数及残余通常经量化以经由信道有效传输。在解码器处,根据滤波器参数所配置的合成滤波器由基于残余的信号而激励,以产生原始语 音的经合成版本。合成滤波器通常经配置以具有传递函数,其为白化滤波器的传递函数 的倒数。
图6展示窄带编码器A120的一基本实施方案A122的框图。在此实例中,线性预 测编码(LPC)分析模块210将窄带信号S20的频谱包络编码为一组线性预测(LP)系 数(例如,全极滤波器1/A (z)的系数)。分析模块通常将输入信号处理为一系列非重 叠帧,其中针对每一帧计算一组新系数。帧周期通常为可预期信号在其内局部不变的周 期; 一实例为20毫秒(等于8kHz的取样速率时的160个样本)。在一实例中,LPC分 析模块210经配置以计算一组十个LP滤波器系数,以表现每20毫秒帧的共振峰结构的 特征。还可能实施分析模块以将输入信号处理为一系列重叠帧。
分析模块可经配置以直接分析每一帧的样本,或样本可根据开窗函数(例如汉明窗 口)而被首先加权。还可在大于帧的窗口 (例如30毫秒的窗口)内执行分析。此窗口 可为对称的(例如5-20-5,使得紧接在20毫秒帧之前及之后,其包括5毫秒)或非对 称的(例如10-20,使得其包括前一帧的最后IO毫秒)。LPC分析模块通常经配置以使 用理文森杜宾(Levinson-Durbin)递归或莱罗克斯古伊古恩(Leroux-Gueguen)算法 来计算LP滤波器系数。在另一实施方案中,分析模块可经配置以针对每一帧计算一组 倒频谱系数而并非一组LP滤波器系数。
通过量化滤波器参数,编码器A120的输出速率可显著降低,同时对再现质量具有 相对较少影响。线性预测滤波器系数难以有效量化且通常映射为用于量化及/或熵编码的 另一表示,例如线频谱对(LSP)或线频谱频率(LSF)。在图6的实例中,LP滤波器系 数到LSF变换220将所述组LP滤波器系数变换为一组对应的LSF。 LP滤波器系数的其 它一对一表示包括部分自相关系数;对数面积比(log-area-ratio)值;导抗频谱对(ISP); 及导抗频谱频率(ISF),以上均用于GSM (全球移动通信系统)AMR-WB (自适应多 速率宽带)编解码器。通常, 一组LP滤波器系数与一组对应的LSF之间的变换为可逆 的,但是配置还包括编码器A120的实施方案,其中变换不能无误差地可逆。
量化器230经配置以量化所述组窄带LSF (或其它系数表示),且窄带编码器A122 经配置以将此量化结果作为窄带滤波器参数S40输出。所述量化器通常包括向量量化器,
其将输入向量编码为表或码簿中的对应向量条目的索引。
如图6中所见,窄带编码器A122还通过使窄带信号S20通过白化滤波器260 (还 称为分析或预测误差滤波器)来产生残余信号,所述白化滤波器260根据所述组滤波器 系数而配置。在此特定实例中,虽然还可使用IIR实施方案,但白化滤波器260被实施
17为FIR滤波器。此残余信号通常将含有语音帧的感知上重要的信息(例如关于音髙的长 期结构),其未表示在窄带滤波器参数S40中。量化器270经配置以计算此残余信号的 经量化表示以作为经编码窄带激励信号S50而输出。所述量化器通常包括向量量化器, 其将输入向量编码为表或码簿中的对应向量条目的索引。或者,所述量化器可经配置以 发送一个或一个以上参数,可在解码器处从所述参数动态产生向量,而并非如稀疏码簿 方法中那样从存储装置检索。所述方法用于例如代数CELP (码簿激励线性预测)的编 码方案中及例如3GPP2 (第三代合作伙伴2) EVRC (增强型可变速率编解码器)的编 解码器中。
需要窄带编码器A120根据将可用于对应窄带解码器的相同滤波器参数值来产生经 编码窄带激励信号。以此方式,所得经编码窄带激励信号可已在某种程度上计及在所述 参数值中的非理想性,例如量化误差。因此,需要使用将可用于解码器处的相同系数值 来配置白化滤波器。在如图6中所示的编码器A122的基本实例中,逆量化器240将窄 带编码参数S40去量化,LSF到LP滤波器系数变换250将所得值映射回一组对应的LP 滤波器系数,且将此组系数用于配置白化滤波器260以产生由量化器270量化的残余信 号。
窄带编码器A120的一些实施方案经配置以通过识别一组码簿向量中的最匹配残余 信号的向量来计算经编码窄带激励信号S50。然而,注意到,窄带编码器A120还可经 实施以计算残余信号的经量化表示,而实际上并不产生残余信号。举例来说,窄带编码 器A120可经配置以使用许多码簿向量来产生对应的经合成信号(例如,根据一组当前 滤波器参数),且在感知加权域中选择最匹配原始窄带信号S20的与所产生信号相关联 的码簿向量。
图7展示窄带解码器B110的一实施方案B112的框图。逆量化器310将窄带滤波器 参数S40去量化(在此情况下,去量化为一组LSF),且LSF到LP滤波器系数变换320 将LSF变换为一组滤波器系数(例如,如上文参看窄带编码器A122的逆量化器240及 变换250所描述)。逆量化器340将窄带残余信号S40去量化以产生窄带激励信号S80。 基于滤波器系数及窄带激励信号S80,窄带合成滤波器330合成窄带信号S90。换句话 说,窄带合成滤波器330经配置以根据所述经去量化的滤波器系数来频谱成形窄带激励 信号S80,以产生窄带信号S90。窄带解码器B112还将窄带激励信号S80提供到高带编 码器A200,所述高带编码器A200使用激励信号S80而得出如本文中所述的高带激励信 号S120。在如下文所描述的一些实施方案中,窄带解码器B110可经配置以将与窄带信 号相关的额外信息(例如频谱倾斜、音高增益及滞后及语音模式)提供到高带解码器
18B200。
窄带编码器A122及窄带解码器B112的系统为分析合成语音编解码器 (analysis-by-synthesis speech codec)的一基本实例。码簿激励线性预测(CELP)编码为 一系列普遍的分析合成编码,且所述编码器的实施方案可执行残余的波形编码,包括例 如从固定及自适应码簿选择条目,误差最小化操作及/或感知加权操作的所述操作。分析 合成编码的其它实施方案包括混合激励线性预测(MELP)、代数CELP (ACELP)、松 弛CELP (RCELP)、规则脉冲激励(RPE)、多脉冲CELP (MPE)及向量和激励线性预 测(VSELP)编码。相关编码方法包括多带激励(MBE)及原型波形内插(PWI)编码。 标准化分析合成语音编解码器的实例包括ETSI (欧洲电信标准协会)-GSM全速率编 解码器(GSM 06.10),其使用残余激励线性预测(RELP); GSM增强型全速率编解码 器(ETSI-GSM 06.60); ITU (国际电信联合会)标准11.8 kb/s G.729附件E编码器;用 于IS-136 (时分多址方案)的IS (临时标准)-641编解码器;GSM自适应多速率 (GSM-AMR)编解码器及4GVTM(第四代声码器 )编解码器(高通公司(QUALCOMM Incorporated),加利福尼亚,圣地亚哥(San Diego, CA))。可根据所述技术中的任一技 术,或将语音信号表示为(A)描述滤波器的一组参数及(B)用于驱动所描述滤波器再 现语音信号的激励信号的任何其它语音编码技术(无论已知的还是待研发的)来实施窄 带编码器A120及对应解码器B110。
即使在白化滤波器己从窄带信号S20移除粗略频谱包络之后,仍可保留相当量的精 细谐波结构(尤其对有声语音来说)。图8a展示例如元音的有声信号的残余信号(如可 由白化滤波器产生)的一实例的频谱曲线。在此实例中可见的周期性结构与音高相关, 且由相同说话者所说的不同有声声音可具有不同共振峰结构但具有类似音高结构。图8b 展示所述残余信号的一实例的时域曲线,其按时间展示音高脉冲的序列。
可通过使用一个或一个以上参数值来编码音高结构的特征而增加编码效率及/或语 音质量。音高结构的一重要特征为第一谐波的频率(还称为基础频率),其通常在60Hz 到400Hz的范围内。通常将此特征编码为基础频率的倒数(还称为音高滞后)。音髙滞 后指示在一音高周期中的样本数目且可被编码为一个或一个以上码簿索引。来自男性说 话者的语音信号倾向于比来自女性说话者的语音信号具有更大音高滞后。
关于音高结构的另一信号特征为周期性,其指示谐波结构的强度,或换句话说,信 号为谐波或非谐波的程度。周期性的两个典型标志为零交叉及规范化自相关函数 (NACF)。周期性还可由音高增益来指示,音高增益被编码为码簿增益(例如,经量化 的自适应码簿增益)。
19窄带编码器A120可包括经配置以编码窄带信号S20的长期谐波结构的一个或一个 以上模块。如图9中所示,可使用的一典型CELP范例包括开环LPC分析模块,其编码 短期特征或粗略频谱包络,接着为闭环长期预测分析阶段,其编码精细音高或谐波结构。 短期特征被编码为滤波器系数,且长期特征被编码为例如音高滞后及音高增益的参数 值。举例来说,窄带编码器A120可经配置而以包括一个或一个以上码簿索引(例如, 固定码簿索引及自适应码簿索引)及对应增益值的形式输出经编码窄带激励信号S50。 对窄带残余信号的此经量化表示的计算(例如,由量化器270进行)可包括选择所述索 引及计算所述值。对音高结构的编码还可包括内插音高原型波形,此操作可包括计算在 连续音高脉冲之间的差。针对对应于无声语音(其通常像噪声且未结构化)的帧,可停 用对长期结构的模型化。
根据如图9中所示的范例的窄带解码器B110的实施方案可经配置以在己恢复长期 结构(音高或谐波结构)之后,将窄带激励信号S80输出到高带解码器B200。举例来 说,所述解码器可经配置以将窄带激励信号S80输出为经编码窄带激励信号S50的经去 量化版本。当然,还可能实施窄带解码器BllO,使得高带解码器B200执行经编码窄带 激励信号S50的去量化,以获得窄带激励信号S80。
在根据如图9中所示的一范例的宽带语音编码器A100的实施方案中,高带编码器 A200可经配置以接收由短期分析或白化滤波器所产生的窄带激励信号。换句话说,窄 带编码器A120可经配置以在编码长期结构之前,将窄带激励信号输出到高带编码器 A200。然而,需要高带编码器A200从窄带信道接收将由高带解码器B200接收的相同 的编码信息,使得由高带编码器A200所产生的编码参数可以在某种程度上计及所述信 息中的非理想性。因此,使高带编码器A200从待由宽带语音编码器A100输出的同样 经参数化及/或经量化的所编码窄带激励信号S50重构窄带激励信号S80可能为优选的。 此方法的一潜在优势在于可更准确地计算下文描述的高带增益因子S60b。
除表现窄带信号S20的短期及/或长期结构的特征的参数之外,窄带编码器A120可 产生关于窄带信号S20的其它特征的参数值。这些值(可经适当量化以由宽带语音编码 器A100输出)可包括于窄带滤波器参数S40中或被单独输出。高带编码器A200还可 经配置以根据这些额外参数中的一者或一者以上来计算高带编码参数S60 (例如,在去 量化之后)。在宽带语音解码器B100处,高带解码器B200可经配置以经由窄带解码器 B110接收参数值(例如,在去量化之后)。或者,高带解码器B200可经配置以直接接 收(或可能去量化)参数值。
在额外窄带编码参数的一实例中,窄带编码器A120产生频谱倾斜值及每一帧的语音模式参数。频谱倾斜与通带上的频谱包络的形状相关,且通常由经量化的第一反射系 数表示。对大多数有声声音来说,频谱能量随频率增加而降低,使得第一反射系数为负 且可接近-1。大多数无声声音具有为平坦(使得第一反射系数接近零)或在高频率处具 有更多能量(使得第一反射系数为正且可接近+ l)的频谱。
语音模式(还称为发声模式)指示当前帧表示有声语音还是无声语音。此参数可具 有二进制值,所述值基于帧的周期性(例如零交叉、NACF、音高增益)及/或语音有效 性的一个或一个以上量度,例如所述量度与阈值之间的关系。在其它实施方案中,语音 模式参数具有一个或一个以上其它状态,以指示例如静默或背景噪声,或静默与有声语 音之间的过渡的模式。
高带编码器A200经配置以根据源-滤波器模型来编码高带信号S30,其中用于此滤 波器的激励是基于经编码窄带激励信号。图10展示高带编码器A200的一实施方案A202 的框图,其经配置以产生高带编码参数S60的流,所述参数包括高带滤波器参数S60a 及高带增益因子S60b。高带激励产生器A300从经编码窄带激励信号S50得出高带激励 信号S120。分析模块A210产生表现高带信号S30的频谱包络的特征的一组参数值。在 此特定实例中,分析模块A210经配置以执行LPC分析,以针对高带信号S30的每一帧 产生一组LP滤波器系数。线性预测滤波器系数到LSF变换410将所述组LP滤波器系 数变换为一组对应的LSF。如上文参看分析模块210及变换220所所述,分析模块A210 及/或变换410可经配置以使用其它系数组(例如,倒频谱系数)及/或系数表示(例如, ISP)。
量化器420经配置以量化所述组高带LSF (或其它系数表示,例如ISP),且高带编 码器A202经配置以将此量化结果输出为高带滤波器参数S60a。所述量化器通常包括将 输入向量编码为表或码簿中的对应向量条目的索引的向量量化器。
高带编码器A202还包括合成滤波器A220,其经配置以根据高带激励信号S120及 由分析模块A210产生的编码频谱包络(例如,所述组LP滤波器系数)来产生经合成高 带信号S130。虽然还可使用FIR实施,但合成滤波器A220通常被实施为IIR滤波器。 在一特定实例中,合成滤波器A220被实施为六阶线性自回归滤波器。
高带增益因子计算器A230计算在原始高带信号S30的电平与经合成高带信号S130 的电平之间的一个或一个以上差,以指定用于帧的增益包络。量化器430 (其可实施为 将输入向量编码为表或码簿中的对应向量条目的索引的向量量化器)量化指定增益包络 的值,且高带编码器A202经配置以将此量化结果输出为高带增益因子S60b。
在图10中所示的一实施方案中,合成滤波器A220经布置以接收来自分析模块A210
21的滤波器系数。高带编码器A202的替代实施方案包括经配置以从高带滤波器参数S60a 解码滤波器系数的逆量化器及逆变换,且在此情况下,替代地,合成滤波器A220经布 置以接收经解码的滤波器系数。所述替代布置可支持高带增益计算器A230对增益包络 进行更准确的计算。
在一特定实例中,分析模块A210及高带增益计算器A230分别输出每帧一组六个 LSF与一组五个增益值,使得利用每帧11个额外值可实现窄带信号S20的宽带扩展。 人耳倾向于对在高频率处的频率误差较不敏感,使得在较低LPC阶处的高带编码可产生 具有可与在较高LPC阶处的窄带编码相当的感知质量的信号。高带编码器A200的一典 型实施方案可经配置以输出每帧8到12位以用于频谱包络的高质量重构,且输出每帧 另外8到12位以用于时间包络的高质量重构。在另一特定实例中,分析模块A210输出 每帧一组8个LSF。
高带编码器A200的一些实施方案经配置以通过产生具有高带频率分量的随机噪声 信号且根据窄带信号S20、窄带激励信号S80或高带信号S30的时域包络来振幅调制噪 声信号而产生高带激励信号S120。虽然所述基于噪声的方法可对于无声声音产生适当结 果,然而,其对于有声声音可并不合乎需要,所述有声声音的残余通常为谐波的且因此 具有一些周期结构。
高带激励产生器A300经配置以通过将窄带激励信号S80的频谱扩展到高带频率范 围内来产生高带激励信号S120。图11展示高带激励产生器A300的一实施方案A302的 框图。逆量化器450经配置以将经编码窄带激励信号S50去量化以产生窄带激励信号 S80。频谱扩展器A400经配置以基于窄带激励信号S80而产生谐波扩展信号S160。组 合器470经配置以组合由噪声产生器480所产生的随机噪声信号及由包络计算器460所 计算的时域包络,以产生经调制噪声信号S170。组合器490经配置以混合谐波扩展信号 S60与经调制噪声信号SI70以产生高带激励信号S120。
在一实例中,频谱扩展器A400经配置以对窄带激励信号S80执行频谱折叠操作(还 称为镜射),以产生谐波扩展信号S160。频谱折叠可通过零塞入激励信号S80且接着应 用高通滤波器以保留假信号来执行。在另一实例中,频谱扩展器A400经配置以通过将 窄带激励信号S80频谱转化为高带(例如,经由升取样,接着与恒定频率余弦信号相乘) 来产生谐波扩展信号S160。
频谱折叠及转化方法可产生频谱扩展信号,其谐波结构与窄带激励信号S80的原始 谐波结构在相位及/或频率方面不连续。举例来说,所述方法可产生峰值通常不位于基础 频率倍数处的信号,此可在经重构的语音信号中导致金属音(tinny-sounding)伪影。所述方法还倾向于产生具有非自然强音调特征的高频率谐波。此外,因为PSTN信号可以 8 kHz取样但频带限制于不超过3400 Hz,所以窄带激励信号S80的上部频谱可含有少 量能量或无能量,使得根据频谱折叠或频谱转化操作而产生的经扩展信号可具有在3400 Hz之上的频谱空洞。
产生谐波扩展信号S160的其它方法包括识别窄带激励信号S80的一个或一个以上 基础频率及根据所述信息产生谐波音调。举例来说,激励信号的谐波结构的特征可为基 础频率连同振幅及相位信息。高带激励产生器A300的另一实施方案基于基础频率及振 幅(如例如由音高滞后及音高增益来指示)来产生谐波扩展信号S160。然而,除非谐波 扩展信号与窄带激励信号S80相位相干,否则所得经解码语音的质量可能为不可接受的。
非线性函数可用于产生与窄带激励相位相干且保留谐波结构而无相位不连续性的 高带激励信号。非线性函数还可在高频率谐波之间提供增加的噪声电平,其倾向于比由 例如频谱折叠及频谱转化的方法产生的高频率音调谐波听起来更自然。可由频谱扩展器 A400的各种实施方案应用的典型无记忆非线性函数包括绝对值函数(还称为全波整流)、 半波整流、平方、立方及截割。频谱扩展器A400的其它实施方案可经配置以应用具有 记忆的非线性函数。
图12为频谱扩展器A400的一实施方案A402的框图,其经配置以应用非线性函数 以扩展窄带激励信号S80的频谱。升取样器510经配置以升取样窄带激励信号S80。可 能需要充分升取样所述信号以最小化在应用非线性函数时的假信号。在一特定实例中, 升取样器510以因子8来升取样信号。升取样器510可经配置以通过对输入信号零塞入 及低通滤波所述结果来执行升取样操作。非线性函数计算器520经配置以将非线性函数 应用于经升取样的信号。绝对值函数相比于用于频谱扩展的其它非线性函数(例如平方) 的潜在优势为其不需要能量规范化。在一些实施方案中,通过除去或清除每一样本的符 号位,可有效应用绝对值函数。非线性函数计算器520还可经配置以对经升取样或频谱 扩展的信号执行振幅弯曲(amplitude warping)。
降取样器530经配置以降取样应用非线性函数的频谱扩展结果。可能需要降取样器 530在降低取样速率之前执行带通滤波操作以选择频谱扩展信号的所要频带(例如,以 减小或避免由不当图像造成的假信号或恶化)。还可能需要降取样器530在一个以上阶 段中降低取样速率。
图12a为展示在频谱扩展操作的一实例中各点处的信号频谱的图,其中频率比例在 各个曲线上相同。曲线(a)展示窄带激励信号S80的一实例的频谱。曲线(b)展示信 号S80在以因子8升取样之后的频谱。曲线(c)展示在应用非线性函数之后的扩展频谱的一实例。曲线(d)展示在低通滤波之后的频谱。在此实例中,通带扩展到高带信 号S30的频率上限(例如,7kHz或8kHz)。
曲线(e)展示在降取样的第一阶段之后的频谱,其中以因子4降低取样速率以获 得宽带信号。曲线(f)展示在进行高通滤波操作以选择经扩展信号的高带部分之后的频 谱,且曲线(g)展示在降取样的第二阶段之后的频谱,其中以因子2降低取样速率。 在一特定实例中,降取样器530通过使宽带信号通滤波波器组A112的高通滤波器130 及降取样器140 (或具有相同响应的其它结构或例行程序)来执行高通滤波及降取样的 第二阶段,以产生具有高带信号S30的频率范围及取样速率的频谱扩展信号。
如在曲线(g)中所见,在曲线(f)中展示的高通信号的降取样引起其频谱反转。 在此实例中,降取样器530还经配置以对信号执行频谱翻转(spectral flipping)操作。
曲线(h)展示应用频谱翻转操作的结果,所述频谱翻转操作可通过使信号与函数^""或 序列(-l)n (其值在+l与-1之间交替)相乘而执行。所述操作等同于在频域中将信号的数 字频谱移位兀的距离。注意到,相同结果还可通过以不同顺序应用降取样操作及频谱翻 转操作而获得。升取样及/或降取样的操作还可经配置以包括重取样,以获得具有高带信 号S30的取样速率(例如,7 kHz)的频谱扩展信号。
如上文所述,滤波器组A110及B120可经实施以使得窄带信号S20及高带信号S30 中的一或两者在滤波器组A110的输出处具有频谱反转形式,以频谱反转形式被编码及 解码,且在宽带语音信号S110中输出之前再次在滤波器组B120处被频谱反转。当然, 在所述情况下,因为将需要高带激励信号S120同样具有频谱反转形式,所以可不实施 如图12a中所示的频谱翻转操作。
由频谱扩展器A402执行的频谱扩展操作的升取样及降取样的各种任务可以许多不 同方式加以配置及布置。举例来说,图12b为展示频谱扩展操作的另一实例中各个点处 的信号频谱的图,其中频率比例在各个曲线上相同。曲线(a)展示窄带激励信号S80 的一实例的频谱。曲线(b)展示信号S80在以因子2升取样之后的频谱。曲线(c)展 示在应用非线性函数之后的经扩展频谱的一实例。在此情况下,接受可能出现在较高频 率中的假信号。
曲线(d)展示在频谱反转操作之后的频谱。曲线(e)展示在单阶段降取样之后的 频谱,其中以因子2降低取样速率以获得所要频谱扩展信号。在此实例中,信号为频谱 反转形式且可用于以所述形式处理高带信号S30的高带编码器A200的一实施方案中。
由非线性函数计算器520产生的频谱扩展信号的振幅可能会随着频率增加而明显下
24降。频谱扩展器A402包括频谱平化器540,其经配置以对经降取样信号执行白化操作。 频谱平化器540可经配置以执行固定白化操作或执行自适应白化操作。在自适应白化的 一特定实例中,频谱平化器540包括LPC分析模块,其经配置以从经降取样信号计算 一组四个滤波器系数;及四阶分析滤波器,其经配置以根据所述系数来白化所述信号。 频谱扩展器A400的其它实施方案包括其中频谱平化器540在降取样器530之前对频谱 扩展信号进行操作的配置。
高带激励产生器A300可经实施以将谐波扩展信号S160输出为高带激励信号S120。 然而,在一些情况下,将谐波扩展信号用作高带激励可导致可听伪影。语音的谐波结构 在高带中通常没有在低带中明显,且在高带激励信号中使用过多谐波结构可导致嗡嗡 声。此伪影可在来自女性说话者的语音信号中尤为明显。
配置包括经配置以将谐波扩展信号S160与噪声信号混合的高带激励产生器A300 的实施方案。如图ll中所示,高带激励产生器A302包括噪声产生器480,其经配置以 产生随机噪声信号。在一实例中,噪声产生器480经配置以产生单位方差白伪随机噪声 信号,但在其它实施中噪声信号无需白化且可具有随频率变化的功率密度。可能需要噪 声产生器480经配置以将噪声信号输出为确定性函数,使得其状态可在解码器处被复制。 举例来说,噪声产生器480可经配置以将噪声信号输出为相同帧内较早编码的信息(例 如窄带滤波器参数S40及/或经编码窄带激励信号S50)的确定性函数。
在与谐波扩展信号S160混合之前,由噪声产生器480产生的随机噪声信号可经振 幅调制以具有时域包络,所述时域包络近似于窄带信号S20、高带信号S30、窄带激励 信号S80或谐波扩展信号S160的时间上的能量分布。如图ll中所示,高带激励产生器 A302包括组合器470,其经配置以根据由包络计算器460计算出的时域包络来振幅调制 由噪声产生器480产生的噪声信号。举例来说,组合器470可被实施为乘法器,其经布 置以根据由包络计算器460计算出的时域包络来按比例调整噪声产生器480的输出,以 产生经调制噪声信号S170。
在高带激励产生器A302的一实施方案A304中(如图13的框图中所示),包络计 算器460经布置以计算谐波扩展信号S160的包络。在高带激励产生器A302的实施方案 A306中(如图14的框图中所示),包络计算器460经布置以计算窄带激励信号S80的 包络。高带激励产生器A302的另一实施方案可另外经配置以根据窄带音高脉冲在时间 上的位置将噪声添加到谐波扩展信号S160。
包络计算器460可经配置以将包络计算执行为包括一系列子任务的任务。图15展 示所述任务的一实例T100的流程图。子任务T110计算其包络待模型化的信号(例如,窄带激励信号S80或谐波扩展信号S160)的帧的每一样本的平方,以产生平方值的序列。 子任务T120对所述平方值序列执行平滑操作。在一实例中,子任务T120根据以下表达 式将一阶IIR低通滤波器应用于所述序列
;y(w) = ax( ) + (l_a);y(w — l) , (1)
其中x为滤波器输入,y为滤波器输出,n为时域索引,且a为具有在0.5与l之间 的值的平滑系数。平滑系数的值可为固定的,或在一替代实施方案中,所述值根据输入 信号中噪声的指示可为自适应的,使得a在不存在噪声时较接近1且在存在噪声时较接 近0.5。子任务T130将平方根函数应用于平滑化序列的每一样本以产生时域包络。
包络计算器460的此实施方案可经配置而以串行及/或并行方式来执行任务T100的 各个子任务。在任务T100的另外实施方案中,子任务T110可在经配置以选择其包络待 模型化的信号的所要频率部分(例如3kHz到4kHz的范围)的带通操作之后进行。
组合器490经配置以混合谐波扩展信号S160与经调制噪声信号S170以产生高带激 励信号S120。组合器490的实施方案可经配置以(例如)将高带激励信号S120计算为 谐波扩展信号S160与经调制噪声信号S170的和。组合器490的所述实施方案可经配置 以在求和之前通过将加权因子施加于谐波扩展信号S160及/或经调制噪声信号S170来 将高带激励信号S120计算为经加权和。每一所述加权因子可根据一个或一个以上准则 加以计算且可为固定值或者替代地为以逐帧或逐子帧而计算出的自适应值。
图16展示组合器490的一实施方案492的框图,其经配置以将高带激励信号S120 计算为谐波扩展信号S160与调制噪声信号S170的经加权和。组合器492经配置以根据 谐波加权因子S180来对谐波扩展信号S160加权,根据噪声加权因子S190来对调制噪 声信号S170加权,及将高带激励信号S120输出为经加权信号的和。在此实例中,组合 器492包括加权因子计算器550,其经配置以计算谐波加权因子S180及噪声加权因子 S190。
加权因子计算器550可经配置以根据高带激励信号S120中谐波含量与噪声含量的 所要比率来计算加权因子S180及S190。举例来说,可能需要组合器492产生具有类似 于高带信号S30的谐波能量与噪声能量的比率的谐波能量与噪声能量的比率的高带激励 信号S120。在加权因子计算器550的一些实施方案中,加权因子S180、 S190根据关于 窄带信号S20或窄带残余信号的周期性的一个或一个以上参数(例如音高增益及/或语音 模式)而进行计算。加权因子计算器550的所述实施方案可经配置以对(例如)谐波加
26权因子S180指派与音高增益成比例的值,及/或对用于无声语音信号的噪声加权因子 S190指派一值,所述值高于用于有声语音信号的噪声加权因子的值。
在其它实施方案中,加权因子计算器550经配置以根据高带信号S30的周期性量度 来计算谐波加权因子S180及/或噪声加权因子S190的值。在一个所述实例中,加权因 子计算器550将谐波加权因子S180计算为用于当前帧或子帧的高带信号S30的自相关 系数的最大值,其中自相关在包括一个音高滞后的延迟但不包括零样本的延迟的搜索范 围内执行。图17展示具有n个样本的长度的此搜索范围的一实例,所述搜索范围以一 个音高滞后的延迟为中心且具有不大于一个音高滞后的宽度。
图17还展示另一方法的实例,其中加权因子计算器550在若干阶段中计算高带信 号S30的周期性量度。在第一阶段中,当前帧被分成许多子帧,且针对每一子帧单独识 别自相关系数为最大值的延迟。如上所提及,自相关在包括一个音高滞后的延迟但不包 括零样本的延迟的搜索范围内执行。
在第二阶段中,延迟帧通过将对应的所识别的延迟应用于每一子帧,级联所得子帧 以构造最佳延迟帧,且将谐波加权因子S180计算为在原始帧与最佳延迟帧之间的相关 系数而构造。在另一替代例中,加权因子计算器550将谐波加权因子S180计算为在第 一阶段中针对每一子帧获得的最大自相关系数的平均值。加权因子计算器550的实施方 案还可经配置以按比例调整相关系数及/或将其与另一值组合以计算谐波加权因子S180 的值。
在以其它方式指示在帧中存在周期性的情况下,可能需要加权因子计算器550来计 算高带信号S30的周期性量度。举例来说,加权因子计算器550可经配置以根据在当前 帧的周期性的另一指示(例如音高增益)与阈值之间的关系来计算高带信号S30的周期 性量度。在一实例中,加权因子计算器550经配置以在帧的音高增益(例如,窄带残余 的自适应码簿增益)具有大于0.5 (或至少为0.5)的值的情况下对高带信号S30执行自 相关操作。在另一实例中,加权因子计算器550经配置以针对具有语音模式的特定状态 的帧(例如,有声信号)而对高带信号S30执行自相关操作。在所述情形下,加权因子 计算器550可经配置以对具有语音模式的其它状态及/或较低的音高增益值的帧指派默 认加权因子。
配置包括经配置以根据不同于周期性的特征或除周期性之外的特征来计算加权因 子的加权因子计算器550的其它实施方案。举例来说,所述实施方案可经配置以对具有 较大音高滞后的语音信号的噪声增益因子S190指派一值,所述值高于对具有较小音高 滞后的语音信号的噪声增益因子指派的值。加权因子计算器550的另一此实施方案经配置以根据在基础频率的倍数处的信号能量相对于在其它频率分量处的信号能量的量度 来确定宽带语音信号S10或高带信号S30的谐波性量度。
宽带语音编码器A100的一些实施方案经配置以基于本文中所描述的音高增益及/或 另一周期性或谐波性量度来输出周期性或谐波性的指示(例如,指示帧为谐波还是非谐 波的一位旗标)。在一实例中,对应宽带语音解码器B100使用此指示以配置例如加权因 子计算的操作。在另一实例中,所述指示在编码器及/或解码器处用于计算语音模式参数 值。
可能需要高带激励产生器A302产生高带激励信号S120,使得激励信号的能量大体 上不受加权因子S180及S190的特定值的影响。在所述情形下,加权因子计算器550可 经配置以计算谐波加权因子S180或噪声加权因子S190的值(或接收来自高带编码器 A200的存储装置或另一元件的所述值),且根据如下表达式得出另一加权因子值-
(W谐J+(W噪声M, (2)
其中^ *表示谐波加权因子S180,且^*,表示噪声加权因子S190。或者,加权因 子计算器550可经配置以根据当前帧或子帧的周期性量度的值来选择在多对加权因子 S180、 S190中的一对应对,其中所述对经预先计算以满足例如表达式(2)的恒定能量 比。对于其中观察到表达式(2)的加权因子计算器550的一实施方案来说,谐波加权 因子S180的典型值在约0.7到约1.0的范围内,且噪声加权因子S190的典型值在约0.1 到约0.7的范围内。加权因子计算器550的其它实施方案可经配置以根据表达式(2)的 一版本而操作,所述版本是根据在谐波扩展信号S160与调制噪声信号S170之间的所要 基线加权而修改得出。
当将稀疏码簿(其条目大多为零值)用于计算残余的经量化表示时,在经合成语音 信号中可能出现伪影。码簿稀疏尤其会在以低位速率编码窄带信号时发生。由码簿稀疏 引起的伪影通常在时间上为类周期性的,且大多发生在3kHz以上。因为人耳在较高频 率时具有较佳时间分辨率,所以这些伪影在高带中可能更显著。
配置包括经配置以执行反稀疏滤波的高带激励产生器A300的实施方案。图18展示 高带激励产生器A302的一实施方案A312的框图,其包括反稀疏滤波器600,所述反稀 疏滤波器600经布置以滤波由逆量化器450产生的经去量化窄带激励信号。图19展示 高带激励产生器A302的一实施方案A314的框图,其包括反稀疏滤波器600,所述反稀疏滤波器600经布置以滤波由频谱扩展器A400产生的频谱扩展信号。图20展示高带激 励产生器A302的一实施方案A316的框图,其包括反稀疏滤波器600,所述反稀疏滤波 器600经布置以滤波组合器490的输出以产生高带激励信号S120。当然,还涵盖且在本 文中明确揭示将实施方案A304及A306中的任一者的特征与实施方案A312、 A314及 A316中的任一者的特征组合在一起的高带激励产生器A300的实施方案。反稀疏滤波器 600还可布置于频谱扩展器A400内举例来说,在频谱扩展器A402中的元件510、 520、 530及540的任一者之后。明确注意到,反稀疏滤波器600还可与执行频谱折叠、频谱 转化或谐波扩展的频谱扩展器A400的实施方案一起使用。
反稀疏滤波器600可经配置以改变其输入信号的相位。举例来说,可能需要反稀疏 滤波器600经配置及布置以使得高带激励信号S120的相位在时间上被随机化,或者被 更平均地分布。还可能需要反稀疏滤波器600的响应是频谱上平坦的,使得经滤波的信 号的量值频谱并未明显改变。在一实例中,反稀疏滤波器600被实施为具有根据以下表 达式的传递函数的全通滤波器
<formula>formula see original document page 29</formula>(3)
此滤波器的一作用在于可展开输入信号的能量,使得其不再集中于较少样本中。
由码簿稀疏性引起的伪影通常对于类噪声信号更显著,其中残余包括较少音高信 息,且对于背景噪声中的语音也如此。在激励具有长期结构的情况下,稀疏通常引起较 少伪影,且实际上相位修改可引起在有声信号中的噪声。因此,可能需要配置反稀疏滤 波器600以滤波无声信号且使至少一些有声信号在不发生改变的情况下通过。无声信号 的特征在于低音高增益(例如,经量化的窄带自适应码簿增益)及接近零或为正的频谱 倾斜(例如,经量化的第一反射系数),所述频谱倾斜指示频谱包络随频率增加为平坦 或向上倾斜的。反稀疏滤波器600的典型实施方案经配置以滤波无声声音(例如,如由 频谱倾斜的值所指示),在音高增益低于阈值(或不大于阈值)时滤波有声声音,且否 则使信号在不发生改变的情况下通过。
反稀疏滤波器600的其它实施方案包括两个或两个以上滤波器,所述滤波器经配置 以具有不同的最大相位修改角(例如,高达180度)。在所述情况下,反稀疏滤波器600 可经配置以根据音高增益(例如,经量化自适应码簿或LTP增益)的值而在所述组成滤 波器中进行选择,使得将较大的最大相位修改角用于具有较低音高增益值的帧。反稀疏滤波器600的一实施方案还包括不'同的组成滤波器,其经配置以在频谱的或多或少的范 围内修改相位,使得将经配置以在输入信号的较宽频率范围内修改相位的滤波器用于具 有较低音高增益值的帧。
对于经编码语音信号的准确再现来说,可能需要在经合成宽带语音信号S100的高 带部分的电平与窄带部分的电平之间的比率类似于在原始宽带语音信号S10中的比率。 除了由高带编码参数S60a表示的频谱包络以外,高带编码器A200可经配置以通过指定 时间或增益包络来表现高带信号S30的特征。如图IO中所示,高带编码器A202包括高 带增益因子计算器A230,其经配置及布置以根据在高带信号S30与经合成高带信号S130 之间的关系(例如两个信号在一帧或其某部分内的能量之间的差或比率)来计算一个或 一个以上增益因子。在高带编码器A202的其它实施方案中,高带增益计算器A230可 经同样配置但经替代布置以根据在高带信号S30与窄带激励信号S80或高带激励信号 S120之间的所述时变关系来计算增益包络。
窄带激励信号S80的时间包络与高带信号S30的时间包络可能为类似的。因此,编 码基于高带信号S30与窄带激励信号S80 (或自其得出的信号,例如高带激励信号S120 或经合成高带信号S130)之间的关系的增益包络通常比编码基于高带信号S30的增益包 络更有效。在一典型实施方案中,高带编码器A202经配置以输出对于每一帧指定五个 增益因子的具有8到12位的经量化索引。
高带增益因子计算器A230可经配置以将增益因子计算执行为包括一个或一个以上 系列的子任务的任务。图21展示所述任务的一实例T200的流程图,所述任务根据高带 信号S30与经合成高带信号S130的相对能量来计算对应子帧的增益值。任务220a及 220b计算相应信号的对应子帧的能量。举例来说,任务220a及220b可经配置以将所述 能量计算为相应子帧的样本的平方的和。任务T230将子帧的增益因子计算为所述能量 的比率的平方根。在此实例中,任务T230将增益因子计算为在子帧内高带信号S30的 能量与经合成高带信号S130的能量的比率的平方根。
可能需要高带增益因子计算器A230经配置以根据开窗函数来计算子帧能量。图22 展示增益因子计算任务T200的所述实施方案T210的流程图。任务T215a将开窗函数应 用于高带信号S30,且任务T215b将相同开窗函数应用于经合成高带信号S130。任务 220a及220b的实施方案222a及222b计算相应窗口的能量,且任务T230将子帧的增益 因子计算为能量比率的平方根。
可能需要应用覆盖相邻子帧的开窗函数。举例来说,产生可以覆盖相加方式应用的 增益因子的开窗函数可有助于减少或避免子帧之间的不连续性。在一实例中,高带增益
30因子计算器A230经配置以应用如图23a中所示的梯形开窗函数,其中所述窗口重叠两 个相邻子帧的中每一者达1毫秒。图23b展示将此开窗函数应用到20毫秒帧的五个子 帧中的每一者。高带增益因子计算器A230的其它实施方案可经配置以应用具有不同重 叠周期及/或可为对称或不对称的不同窗口形状(例如矩形、汉明)的开窗函数。高带增 益因子计算器A230的一实施方案还可能经配置以将不同开窗函数应用于一帧内的不同 子帧,及/或一帧也可能包括具有不同长度的子帧。
在无限制的情况下,将以下值表示为特定实施方案的实例。虽然可使用任何其它持 续时间,但对于这些情况釆用20毫秒的帧。对以7 kHz取样的高带信号来说,每一帧 均具有140个样本。如果将所述帧划分为长度相等的五个子帧,则每一子帧将具有28 个样本,且如图23a中所示的窗口将为42个样本宽。对于以8kHz取样的高带信号来说, 每一帧均具有160个样本。如果将所述帧划分为长度相等的五个子帧,则每一子帧将具 有32个样本,且如图23a中所示的窗口将为48个样本宽。在其它实施方案中,可使用 任何宽度的子帧,且高带增益计算器A230的一实施方案甚至可能经配置以针对一帧的 每一样本产生不同的增益因子。
图24展示高带解码器B200的一实施方案B202的框图。高带解码器B202包括高 带激励产生器B300,其经配置以基于窄带激励信号S80产生高带激励信号S120。视特 定系统设计选择而定,高带激励产生器B300可根据如本文中所描述的高带激励产生器 A300的任一实施方案而加以实施。通常需要将高带激励产生器B300实施为与特定编码 系统的高带编码器的高带激励产生器具有相同的响应。然而,因窄带解码器B110通常 将执行经编码窄带激励信号S50的去量化,所以在大多数情况下,高带激励产生器B300 可经实施以接收来自窄带解码器B110的窄带激励信号S80,且无需包括经配置以去量 化经编码窄带激励信号S50的逆量化器。窄带解码器B110还可能经实施以包括反稀疏 滤波器600的一实例,所述反稀疏滤波器600经布置以在经去量化窄带激励信号被输入 到窄带合成滤波器(例如滤波器330)之前对其进行滤波。
逆量化器560经配置以对高带滤波器参数S60a进行去量化(在此实例中,去量化 为一组LSF),且LSF到LP滤波器系数变换570经配置以将LSF变换为一组滤波器系 数(例如,如上文参看窄带编码器A122的逆量化器240及变换250所描述)。如上文所 提及,在其它实施方案中,可使用不同系数组(例如,倒频谱系数)及/或系数表示(例 如,ISP)。高带合成滤波器B200经配置以根据高带激励信号S120及所述组滤波器系数 来产生经合成高带信号。对于其中高带编码器包括合成滤波器的系统来说(例如,如在 上文所描述的编码器A202的实例中),可能需要将高带合成滤波器B200实施为与所述
31合成滤波器具有相同响应(例如,相同传递函数)。
高带解码器B202还包括逆量化器580,其经配置以去量化高带增益因子S60b; 及增益控制元件590 (例如,乘法器或放大器),其经配置及布置以将经去量化增益因子 应用于经合成高带信号,以产生高带信号SIOO。对其中帧的增益包络由一个以上增益因 子指定的情况来说,增益控制元件590可包括逻辑,所述逻辑经配置以可能根据与由对 应高带编码器的增益计算器(例如,高带增益计算器A230)所应用的开窗函数相同或 不同的开窗函数将增益因子应用于相应子帧。在高带解码器B202的其它实施方案中, 增益控制元件590经类似配置但经替代布置以将经经去量化增益因子应用于窄带激励信 号S80或高带激励信号S120。
如上文所提及,可能需要在高带编码器及高带解码器中获得相同状态(例如,通过 在编码期间使用经去量化值)。因此,在根据所述实施方案的编码系统中,可能需要确 保在高带激励产生器A300及B300中的对应噪声产生器的状态相同。举例来说,所述实 施方案的高带激励产生器A300及B300可经配置以使得噪声产生器的状态为已在相同帧 内编码的信息(例如,窄带滤波器参数S40或其一部分及/或经编码窄带激励信号S50 或其一部分)的确定性函数。
本文中所描述的元件的量化器中的一者或一者以上(例如,量化器230、 420或430) 可经配置以执行经分类向量量化。举例来说,所述量化器可经配置以基于已在窄带信道 及/或高带信道中的相同帧内编码的信息来选择一组码簿中的一者。所述技术通常以牺牲 额外码簿存储为代价来提供增加的编码效率。
如上文参看(例如)图8及图9所论述,在将粗略频谱包络从窄带语音信号S20移 除之后,相当数量的周期结构可仍保留于残余信号中。举例来说,残余信号可含有时间 上的约略周期脉冲或峰值的序列。所述结构(其通常与音高相关)尤其可能出现于有声 语音信号中。对窄带残余信号的经量化表示的计算可包括根据由(例如) 一个或一个以 上码簿表示的长期周期性模型来编码此音高结构。
实际残余信号的音高结构可并非与周期性模型完全匹配。举例来说,残余信号可在 音高脉冲的位置的规则性中包括小抖动,使得在帧中的连续音高脉冲之间的距离不完全 相等且所述结构并不非常规则。所述不规则性倾向于降低编码效率。
窄带编码器A120的-一些实施方案可经配置以通过在量化之前或量化期间将自适应 时间弯曲应用于残余,或通过另外在经编码激励信号中包括自适应时间弯曲来执行音高 结构的规则化。举例来说,所述编码器可经配置以选择或另外计算时间中弯曲的程度(例 如,根据一个或一个以上感知加权及/或误差最小化准则),使得所得激励信号最佳符合
32长期周期性模型。音高结构的规则化由称为松弛码激励线性预测(RCELP)编码器的一 子组CELP编码器而执行。
RCELP编码器通常经配置以将时间弯曲执行为自适应时间移位。此时间移位可为从 负的若干毫秒到正的若干毫秒范围内的延迟,且其通常平滑地变化以避免可听不连续 性。在一些实施方案中,所述编码器经配置以用分段形式来应用所述规则化,其中每一 帧或子帧由对应固定时间移位而弯曲。在其它实施方案中,编码器经配置以将规则化应 用为连续弯曲函数,使得帧或子帧根据音高周线(还称为音高轨线)而被弯曲。在一些 情况下,编码器经配置以通过将移位应用于用于计算经编码激励信号的感知加权输入信 号而在经编码激励信号中包括时间弯曲。
编码器计算经规则化及量化的经编码激励信号,且解码器对经编码激励信号去量化
以获得用于合成经解码语音信号的激励信号。因此,经解码输出信号展现与通过规则化 而包括于经编码激励信号中的变化的延迟相同的变化的延迟。通常,并无指定规则化量 的信息被传输到解码器。
规则化倾向于使残余信号更易于编码,此改进来自长期预测器的编码增益,且因此 提高整体编码效率,而通常不产生伪影。可能需要对有声帧执行规则化。举例来说,窄 带编码器A124可经配置以移位具有长期结构的那些帧或子帧(例如有声信号)。甚至可 能需要对包括音高脉冲能量的子帧执行规则化。RCELP编码器的现有实施方案包括如电 信行业协会(TIA) IS-127中所描述的增强型可变速率编解码器(EVRC),及第三代合 作伙伴项目2 (3GPP2)可选模式声码器(SMV)。
不幸的是,规则化可对其中髙带激励是从经编码窄带激励信号得到的宽带语音编码 器造成问题(例如包括宽带语音编码器A100及宽带语音解码器B100的系统)。由于其 从经时间弯曲的信号得到,所以高带激励信号通常将具有不同于原始高带语音信号的时 间轮廓的时间轮廓。换句话说,高带激励信号将不再与原始高带语音信号同步。
在经弯曲高带激励信号与原始高带语音信号之间的时间未对准可引起若干问题。举 例来说,经弯曲的高带激励信号可不再为根据从原始高带语音信号提取的滤波器参数而 配置的合成滤波器提供合适源激励。结果,经合成高带信号可含有降低经解码宽带语音 信号的感知质量的可听伪影。
时间未对准还可引起增益包络编码的无效率。如上文所提及,在窄带激励信号S80 的时间包络与高带信号S30的时间包络之间可能存在相关性。通过根据在所述两个时间 包络之间的关系来编码高带信号的增益包络,与直接编码增益包络相比,可实现编码效 率的增加。然而,当经编码窄带激励信号经规则化时,可减弱此相关性。在窄带激励信
33号S80与高带信号S30之间的时间未对准可导致在高带增益因子S60b中出现波动,且 编码效率可下降。
配置包括宽带语音编码方法,其根据包括于对应经编码窄带激励信号中的时间弯曲 来执行高带语音信号的时间弯曲。所述方法的潜在优势包括改进经解码宽带语音信号的 质量及/或改进编码高带增益包络的效率。
图25展示宽带语音编码器A100的一实施方案AD10的框图。编码器AD10包括窄 带编码器A120的一实施方案A124,其经配置以在计算经编码窄带激励信号S50期间执 行规则化。举例来说,窄带编码器A124可根据上文论述的RCELP实施方案中的一者或 一者以上而被配置。
窄带编码器A124还经配置以输出指定所应用的时间弯曲程度的规则化数据信号 SDIO。对其中窄带编码器A124经配置以将固定时间移位应用于每一帧或子帧的各种情 况来说,规则化数据信号SD10可包括一系列值,所述值将每一时间移位量指示为整数 或非整数值(在样本、毫秒或一些其它时间增量方面)。对其中窄带编码器A124经配置 以用其它方式修改帧或样本的其它序列的时间比例(例如,通过压縮一部分且扩展另一 部分)的情况来说,规则化信息信号SD10可包括所述修改的对应描述,例如一组函数 参数。在一特定实例中,窄带编码器A124经配置以将一帧划分为三个子帧且计算每一 子帧的固定时间移位,使得规则化数据信号SD10指示经编码窄带信号的每一规则化帧 的三个时间移位量。
宽带语音编码器AD10包括延迟线D120,其经配置以根据由输入信号指示的延迟量 来推进或阻滞高带语音信号S30的部分,以产生经时间弯曲的高带语音信号S30a。在图 25中所示的实例中,延迟线D120经配置以根据由规则化数据信号SDIO指示的弯曲来 对高带语音信号S30进行时间弯曲。以此方式,包括于经编码窄带激励信号S50中的相 同量的时间弯曲也在分析之前被应用于高带语音信号S30的对应部分。虽然此实例将延 迟线D120展示为与高带编码器A200分离的元件,但在其它实施方案中,延迟线D120 经布置为高带编码器的部分。
高带编码器A200的另外实施方案可经配置以执行未弯曲高带语音信号S30的频谱 分析(例如,LPC分析),且在计算高带增益参数S60b之前执行高带语音信号S30的时 间弯曲。所述编码器可包括(例如)经布置以执行时间弯曲的延迟线D120的实施方案。 然而,在所述情况下,基于未弯曲信号S30的分析的高带滤波器参数S60a可描述与高 带激励信号S120在时间上未对准的频谱包络。
可根据适于将所要时间弯曲操作应用于高带语音信号S30的逻辑元件与存储元件的任何组合来配置延迟线D120。举例来说,延迟线D120可经配置以根据所要时间移位从 缓冲器读取高带语音信号S30。图26a展示包括移位寄存器SR1的延迟线D120的所述 实施方案D122的示意图。移位寄存器SR1为具有某长度m的缓冲器,其经配置以接收 且存储高带语音信号S30的m个最近样本。值m至少等于所支持的最大正(或"推进") 与负(或"阻滞")时间移位的和。使值m等于高带信号S30的帧或子帧的长度可为方 便的。
延迟线D122经配置以从移位寄存器SR1的偏移位置OL输出经时间弯曲的高带信 号S30a。偏移位置OL的定位根据由(例如)规则化数据信号SD10所指示的当前时间 移位而围绕参考定位(零时间移位)变化。延迟线D122可经配置以支持相等推进及阻 滞限制,或者另一选择为一限制大于另一限制以使得可在一方向上执行的移位大于在另 一方向上执行的移位。图26a展示所支持的正时间移位大于负时间移位的特定实例。延 迟线D122可经配置以一次输出一个或一个以上样本(例如,视输出总线宽度而定)。
具有多于若干毫秒的量值的规则化时间移位可在经解码信号中导致可听伪影。通 常,由窄带编码器A124执行的规则化时间移位的量值将不超过若干毫秒,使得由规则 化数据信号SD10指示的时间移位将受限制。然而,在所述情况下,可能需要配置延迟 线D122以对正及/或负方向上的时间移位施加最大限制(例如,以遵守比由窄带编码器 所施加的限制更苛刻的限制)。
图26b展示包括移位窗口 SW的延迟线D122的一实施方案D124的示意图。在此 实例中,偏移位置OL的定位由移位窗口 SW所限制。虽然图26b展示其中缓冲器长度 m大于移位窗口 SW的宽度的情况,但还可实施延迟线D124以使得移位窗口 SW的宽 度等于m。
在其它实施方案中,延迟线D120可经配置以根据所要时间移位将高带语音信号S30 写入到缓冲器。图27展示延迟线D120的所述实施方案D130的示意图,其包括经配置 以接收及存储高带语音信号S30的两个移位寄存器SR2及SR3。延迟线D130经配置以 根据如由(例如)规则化数据信号SD10指示的时间移位,将帧或子帧从移位寄存器SR2 写入到移位寄存器SR3。移位寄存器SR3经配置为经布置以输出经时间弯曲高带信号 S30的FIFO缓冲器。
在图27中展示的特定实例中,移位寄存器SR2包括帧缓冲器部分FBI及延迟缓冲 器部分DB,且移位寄存器SR3包括帧缓冲器部分FB2、推进缓冲器部分AB及阻滞缓 冲器部分RB。推进缓冲器AB与阻滞缓冲器RB的长度可相等,或一者可大于另一者,
使得在一方向上所支持的位移大于另一方向上所支持的移位。延迟缓冲器DB及阻滞缓冲器部分RB可经配置以具有相同长度。或者,延迟缓冲器DB可比阻滞缓冲器RB更 短,以计及用于将样本从帧缓冲器FBI传送到移位寄存器SR3的时间间隔,其可包括 其它处理操作(例如在将样本存储到移位寄存器SR3之前,弯曲所述样本)。
在图27的实例中,帧缓冲器FB1经配置以具有与高带信号S30的一帧的长度相等 的长度。在另一实例中,帧缓冲器FB1经配置以具有与高带信号S30的一子帧的长度相 等的长度。在所述情况下,延迟线D130可经配置以包括将相同(例如,平均)延迟应 用于待移位的帧的子帧的逻辑。延迟线D130还可包括对来自帧缓冲器FBI的值与待覆 写于阻滞缓冲器RB或推进缓冲器AB中的值求平均的逻辑。在另一实例中,移位寄存 器SR3可经配置以仅经由帧缓冲器FBI接收高带信号S30的值,且在所述情况下,延 迟线D130可包括在写入到移位寄存器SR3的连续帧或子帧之间的间隙上进行内插的逻 辑。在其它实施方案中,延迟线D130可经配置以在将来自帧缓冲器FB1的样本写入到 移位寄存器SR3之前对其执行弯曲操作(例如,根据由规则化数据信号SD10描述的函 数)。
可能需要延迟线D120应用基于(但并非相同于)由规则化数据信号SD10所指定 的弯曲的时间弯曲。图28展示宽带语音编码器AD10的一实施方案AD12的框图,其包 括延迟值映射器DllO。延迟值映射器D110经配置以将由规则化数据信号SD10所指示 的弯曲映射到经映射延迟值SD10a中。延迟线D120经布置以根据由经映射延迟值SD10a 所指示的弯曲来产生经时间弯曲的高带语音信号S30a。
可预期由窄带编码器应用的时间移位随时间而平滑变化。因此,通常计算在语音帧 期间应用于子帧的平均窄带时间移位,且根据此平均值来移位高带语音信号S30的对应 帧就己足够。在一所述实例中,延迟值映射器D110经配置以计算每一帧的子帧延迟值 的平均值,且延迟线D120经配置以将计算出的平均值应用于高带信号S30的对应帧。 在其它实例中,可计算及应用在较短周期(例如两个子帧或一帧的一半)或较长周期(例 如两个帧)内的平均值。在其中平均值为样本的非整数值的情况下,延迟值映射器DllO 可经配置以在将所述值输出到延迟线D120之前将其四舍五入为整数数目个样本。
窄带编码器A124可经配置以在经编码窄带激励信号中包括非整数数目个样本的规 则化时间移位。在此情况下,可能需要延迟值映射器D110经配置以将窄带时间移位四 舍五入为整数数目个样本,且可能需要延迟线D120将所述四舍五入的时间移位应用于 高带语音信号S30。
在宽带语音编码器AD10的一些实施方案中,窄带语音信号S20的取样速率与高带 语音信号S30的取样速率可不同。在所述情况下,延迟值映射器D110可经配置以调节在规则化数据信号SD10中所指示的时间移位量,以计及在窄带语音信号S20 (或窄带 激励信号S80)的取样速率与高带语音信号S30的取样速率之间的差值。举例来说,延 迟值映射器D110可经配置以根据取样速率的比率来按比例调整时间移位量。在上文提 及的一特定实例中,窄带语音信号S20以8 kHz进行取样,且高带语音信号S30以7 kHz 进行取样。在此情况下,延迟值映射器D110经配置以将每一移位量乘以7/8。延迟值映 射器D110的实施方案还可经配置以执行所述按比例调整操作连同如本文中所描述的整 数四舍五入及/或时间移位平均运算。
在另外的实施方案中,延迟线D120经配置以用其它方式修改帧或样本的其它序列 的时间比例(例如,通过压縮一部分且扩展另一部分)。举例来说,窄带编码器A124可 经配置以根据例如音高周线或轨线的函数来执行规则化。在所述情况下,规则化数据信 号SD10可包括所述函数的对应描述(例如一组参数),且延迟线D120可包括经配置以 根据所述函数来弯曲高带语音信号S30的帧或子帧的逻辑。在其它实施方案中,延迟值 映射器D110经配置以在函数由延迟线D120应用于高带语音信号S30之前对所述函数 求平均值、按比例调整及/或四舍五入。举例来说,延迟值映射器D110可经配置以根据 所述函数计算一个或一个以上延迟值,每一延迟值指示许多样本,所述样本接着由延迟 线D120应用以对高带语音信号S30的一个或一个以上对应帧或子帧进行时间弯曲。
图29展示根据包括于对应编码窄带激励信号中的时间弯曲来对高带语音信号进行 时间弯曲的方法MD100的流程图。任务TD100处理宽带语音信号以获得窄带语音信号 及高带语音信号。举例来说,任务TD100可经配置以使用具有低通滤波器及高通滤波器 的滤波器组(例如滤波器组A110的一实施方案)来滤波宽带语音信号。任务TD200将 窄带语音信号编码为至少一经编码窄带激励信号及多个窄带滤波器参数。经编码窄带激 励信号及/或滤波器参数可被量化,且经编码窄带语音信号还可包括其它参数(例如语音 模式参数)。任务TD200还包括经编码窄带激励信号中的时间弯曲。
任务TD300基于窄带激励信号产生高带激励信号。在此情况下,窄带激励信号基于 经编码窄带激励信号。至少根据高带激励信号,任务TD400将高带语音信号编码为至少 多个高带滤波器参数。举例来说,任务TD400可经配置以将高带语音信号编码为多个经 量化LSF。任务TD500将时间移位应用于高带语音信号,所述时间移位基于关于包括于 编码窄带激励信号中的时间弯曲的信息。
任务TD400可经配置以对高带语音信号执行频谱分析(例如LPC分析),及/或计 算高带语音信号的增益包络。在所述情况下,任务TD500可经配置以在分析及/或增益 包络计算之前将时间移位应用于高带语音信号。
37宽带语音编码器A100的其它实施方案经配置以反转由包括于经编码窄带激励信号 中的时间弯曲引起的高带激励信号S120的时间弯曲。举例来说,高带激励产生器A300 可经实施以包括延迟线D120的一实施方案,其经配置以接收规则化数据信号SD10或 经映射延迟值SD10a,且将对应的反转时间移位应用于窄带激励信号S80及/或基于其的 后续信号(例如谐波扩展信号S160或高带激励信号S120)。
另外的宽带语音编码器实施方案可经配置以将窄带语音信号S20与高带语音信号 S30彼此独立地编码,使得高带语音信号S30被编码为高带频谱包络及高带激励信号的 表示。此实施方案可经配置以执行对高带残余信号的时间弯曲,或另外根据关于包括于 编码窄带激励信号中的时间弯曲的信息将时间弯曲包括于经编码高带激励信号中。举例 来说,高带编码器可包括如本文中所描述的延迟线D120及/或延迟值映射器D110的一 实施方案,所述延迟线D120及/或所述延迟值映射器D110经配置以将时间弯曲应用于 高带残余信号。所述操作的潜在优势包括更有效编码高带残余信号及使在经合成的窄带 语音信号与高带语音信号之间的匹配更佳。
如上文所提及,如本文中所描述的配置包括可用于执行嵌入式编码、支持与窄带系 统的兼容性且避免需要码变换的实施方案。对高带编码的支持还可用于基于成本而区分 具有带有反向兼容性的宽带支持的芯片、芯片组、装置及/或网络以及区分那些具有窄带 支持的芯片、芯片组、装置及/或网络。如本文中所描述的对高带编码的支持还可结合用 于支持低带编码的技术而使用,且根据所述配置的系统、方法或设备可支持从(例如) 约50 Hz或100 Hz直到约7 kHz或8 kHz的频率分量的编码。
如上文所提及,将高带支持添加到语音编码器可改进清晰度,尤其是关于摩擦音的 区别。虽然此区别通常可由人类收听者从特定上下文得出,但高带支持可充当语音辨识 及其它机器解译应用(例如用于自动声音菜单导航及/或自动呼叫处理的系统)的启用特 征。
可将根据一配置的设备嵌入到用于无线通信的便携式装置(例如蜂窝式电话或个人 数字助理(PDA))中。或者,所述设备可包括于另一通信装置(例如VoIP手持机、经 配置以支持VoIP通信的个人计算机或经配置以路由电话或VoIP通信的网络装置)中。 举例来说,可将根据一配置的设备实施于用于通信装置的芯片或芯片组中。视特定应用 而定,所述装置还可包括以下特征例如语音信号的模拟-数字及/或数字-模拟转换、对 语音信号执行放大及/或其它信号处理操作的电路及/或用于传输及/或接收经编码语音信 号的射频电路。
明确涵盖及揭示的是,配置可包括在美国临时专利申请案第60/667,901号及
3860/673,965号中所揭示的其它特征中的任何一个或一个以上特征及/或与其一起使用。所 述特征包括移除发生于高带中且大体上不存在于窄带中的短持续时间的高能量突发。所 述特征包括例如高带LSF的系数表示的固定或自适应平滑化。所述特征包括与例如LSF 的系数表示的量化相关联的噪声的固定或自适应成形。所述特征还包括增益包络的固定 或自适应平滑化,及增益包络的自适应衰减。
可将高带激励产生器A300及B300、高带编码器A100、高带解码器B200、宽带语 音编码器A100及宽带语音解码器B100的实施方案的各种元件实施为驻留于(例如)相 同芯片上或一芯片组中的两个或两个以上芯片中的电子及/或光学装置,但还涵盖不具有 所述限制的其它布置。可将所述设备的一个或一个以上元件整体或部分地实施为一个或 一个以上组的指令,所述指令经布置以在逻辑元件(例如,晶体管、栅极)的一个或一 个以上固定或可编程阵列上执行,例如,微处理器、嵌入式处理器、IP核心、数字信号 处理器、FPGA (现场可编程门阵列)、ASSP (专用标准产品)及ASIC (专用集成电路)。 一个或一个以上所述元件还可能具有共同结构(例如,用于在不同时间执行对应于不同 元件的码部分的处理器、经执行以在不同时间执行对应于不同元件的任务的一组指令或 在不同时间执行用于不同元件的操作的电子及/或光学装置的布置)。而且, 一个或一个 以上所述元件可能用于执行任务或执行不直接与设备有关的操作的其它组指令,例如与 设备所嵌入于的装置或系统的另一操作有关的任务。
图30展示根据一配置的编码具有窄带部分及高带部分的语音信号的高带部分的方 法M100的流程图。任务X100计算表现高带部分的频谱包络的特征的一组滤波器参数。 任务X200通过将非线性函数应用于从窄带部分得到的信号来计算频谱扩展信号。任务 X300根据(A)所述组滤波器参数及(B)基于频谱扩展信号的高带激励信号来产生经 合成高带信号。任务X400基于(C)在高带部分的能量与(D)从窄带部分得到的信号 的能量之间的关系来计算增益包络。
图31a展示根据一配置产生高带激励信号的方法M200的流程图。任务Y100通过 将非线性函数应用于从语音信号的窄带部分得到的窄带激励信号来计算谐波扩展信号。 任务Y200将所述谐波扩展信号与经调制噪声信号混合以产生高带激励信号。图31b展 示根据包括任务Y300及Y400的另一配置来产生高带激励信号的方法M210的流程图。 任务Y300根据窄带激励信号与谐波扩展信号中的一者随时间变化的能量来计算时域包 络。任务Y400根据所述时域包络来调制噪声信号以产生经调制噪声信号。
图32展示根据一配置的解码具有窄带部分及高带部分的语音信号的高带部分的方 法M300的流程图。任务Z100接收表现高带部分的频谱包络的特征的一组滤波器参数及表现高带部分的时间包络的特征的一组增益因子。任务Z200通过将非线性函数应用 于从窄带部分得到的信号来计算频谱扩展信号。任务Z300根据(A)所述组滤波器参数 及(B)基于频谱扩展信号的高带激励信号来产生经合成高带信号。任务Z400基于所述 组增益因子来调制经合成高带信号的增益包络。举例来说,任务Z400可经配置以通过 将所述组增益因子应用于从窄带部分得到的激励信号、频谱扩展信号、高带激励信号或 经合成高带信号来调制经合成高带信号的增益包络。
图33说明码分多址(CDMA)无线电话系统3300,其可包括多个移动台3302、多 个基站3304、 一基站控制器(BSC) 3306及一移动交换中心(MSC) 3308。 MSC 3308 可经配置以与公共交换电话网络(PSTN)3310介接。MSC 3308还可经配置以与BSC 3306 介接。在系统3300中可存在一个以上BSC 3306。每一基站3304可包括至少一扇区(未 图示),其中每一扇区可具有全向天线或指向径向远离基站3304的特定方向的天线。或 者,每一扇区可包括用于分集接收的两个天线。每一基站3304可经设计以支持多个频 率指派。扇区与频率指派的相交可称为CDMA信道。移动台3302可包括蜂窝式或便携 式通信系统(PCS)电话。
在蜂窝式电话系统3300的操作期间,基站3304可从若干组移动台3302接收若干 组反向链路信号。移动台3302可进行电话呼叫或其它通信。由给定基站3304接收的每 一反向链结信号可在所述基站3304中被处理。可将所得数据转发到BSC 3306。BSC 3306 可提供呼叫资源分配及包括基站3304之间的软越区切换的编配的移动性管理功能性。 BSC 3306还可将所接收数据路由到MSC 3308,其提供用于与PSTN 3310介接的额外路 由服务。相似地,PSTN 3310可介接MSC 3308,且MSC 3308可介接BSC 3306,BSC 3306 又可控制基站3304以将若干组前向链结信号传输到若干组移动台3302。
图34描绘信号传输环境3400,其包括编码器3402、解码器3404及传输媒体3406。 编码器3402可实施于移动台3302内或基站3304中。解码器3404可实施于基站3304 中或移动台3302中。编码器3402可编码语音信号s(n) 3410,从而形成经编码语音信号 senc(n) 3412。经编码语音信号3412可在传输媒体3406上传输到解码器3404。解码器3404 可解码sene(n) 3412,从而产生经合成语音信号§(n) 3416。
如本文中所使用的术语"编码"可通常指涵盖编码及解码两者的方法。通常,编码 系统、方法及设备试图在维持可接受语音再现(即,s(n)3410 ^ §(n)3416)的同时最 小化经由传输媒体3406传输的位数冃(即,最小化Senc(n)3412的带宽)。设备可为移动 电话、个人数字助理(PDA)、膝上型计算机、数码相机、音乐播放器、游戏装置、基 站或具有处理器的任何其它装置。经编码语音信号3412的组成可根据由所述编码器3402
40所利用的特定语音编码模式而改变。下文描述各种编码模式。
可将下文描述的编码器3402及解码器3404的组件实施为电子硬件、计算机软件或 所述两者的组合。在下文中就其功能性而描述所述组件。将功能性实施为硬件或软件可 视特定应用及施加于整个系统的设计约束而定。传输媒体3406可表示许多不同传输媒 体,包括(但不限于)基于陆地通信线、基站与卫星之间的链路、蜂窝式电话与基站 之间,或在蜂窝式电话与卫星之间的无线通信。
通信的每一方可传输数据以及接收数据。每一方可利用编码器3402及解码器3404。 然而,在下文中将信号传输环境3400描述为包括在传输媒体3406的一端处的编码器 3402及在另一端处的解码器3404。
出于此描述的目的,s(ii) 3410可包括在包括不同有声声音及静默周期的典型对话期 间获得的数字语音信号。可将语音信号s(n)3410分割为帧,且可将每一帧进一步分割为 子帧。所述任意选择的帧/子帧边界可在执行一些块处理的情况下得以使用。描述为对帧 执行的操作还可对子帧执行,在此意义上,本文中可将帧与子帧互换使用。然而,如果 实施连续处理而非块处理,则不可将s(n) 3410分割为帧/子帧。因而,可将下文描述的 块技术扩展到连续处理。
可将编码器3402实施为窄带(NB)编码器或宽带(WB)编码器。NB编码器可数 字取样在8 kHz处的信号s(n) 3410及存在于50 Hz到4 kHz的带宽中的编码信号信息。 NB编码器的一实例可包括增强型可变速率编码器(EVRC-B)。 WB编码器可数字取样 在16 kHz处的信号s(n) 3410及存在于NB编码器带宽加上在4 kHz到8 kHz的范围之 间的码信息。WB编码器的一实例可包括EVRC-WB编码器。在一方面中,EVRC-WB 为EVRC-B的宽带扩展。从信号s(n)3410分割的每一帧可包括20毫秒(ms)的数据或 160个样本。每一子帧可包括53个或54个数据样本。虽然这些参数可适合于语音编码, 但其仅为实例,且可使用其它合适替代参数。
如果将编码器3402实施为NB编码器,则可将帧封装为窄带包3418。窄带包3418 可包括窄带识别符3422。识别符3422可对解码器3404指示窄带包3418是使用NB编 码器而编码的。如果将编码器3402实施为WB编码器,则可将帧封装为宽带包3420。 宽带包3420可包括宽带识别符3424。识别符3424可对解码器3404指示宽带包3420是 使用WB编码器而编码的。解码器3404可包括包识别模块3414,其可辨识识别符3422 或3424且确定应实施NB解码器还是WB解码器来解码包3418或3420。
图35为说明用于在与语音信号相关联的包中包括识别符的方法3500的一配置的流 程图。在一方面中,识别符可指示包是由NB编码器还是WB编码器而编码的。可由例
41如编码器3402的编码器实施方法3500。
可由编码器3402接收3502信号。在一方面中,所述信号为一种类型的语音信号。 信号可经分析且分割3504为多个帧。使用特定编码方案(例如,CELP、 PPP、 NELP) 可将信号的经分割帧以半速率进行编码3506。在一方面中,可将包编码为具有80位。 术语"半速率"可用于表示具有80位的包。确定3508帧是否为包括80位的宽带半速 率帧。换句话说,确定3508编码器3402是否用作WB编码器且将帧编码为宽带半速率 (WB-HR)帧。如果帧为WB-HR帧,则可将宽带识别符封装3510到包中。在一方面中, 宽带识别符包括以二进制形式的十进制数字"126"及"127"的前六位。十进制数字"126" 的二进制形式为"1111110",且"127"的二进制形式为"1U1111"。因而,宽带识别符 可包括六个l的串(例如,"llllll")。
如果在3508中确定帧并非WB-HR帧,则可将窄带识别符封装3512到包中。在一 方面中,窄带识别符可与延迟参数相关联。举例来说,用于表示延迟参数的位还可用作 窄带识别符。可传输3514包。在一方面中,将包传输3514到解码器。
图36为说明解码包的方法3600的一配置的流程图。可由解码器3404实施方法3600。 在一方面中,接收3602半速率包。可分析3604包括于半速率包中的识别符。所述识别 符可指示半速率包是由WB编码器还是NB编码器而编码的。在一方面中,所述识别符 为是无效/非法滞后的特殊包识别符(ID)。确定3606包是否为基于对识别符的分析的 WB-HR包。如果包为WB-HR包,则使用宽带解码方案来解码3608所述包。在一配置 中,解码器3404用作WB解码器。然而,如果确定3606所述包并非WB-HR,则可使 用窄带解码方案来解码3610所述包。解码器3404可用作NB解码器。可从一个或一个 以上经解码包重构3612信号。
图37为说明在通信信道3706上与多模式解码器3704进行通信的多模式编码器3702 的一配置的框图。通信信道3706可包括射频(RF)接口。编码器3702可包括相关联解 码器(未图示)。编码器3702及其相关联解码器可形成第一语音编码器。解码器3704 可包括相关联编码器(未图示)。解码器3704及其相关联编码器可形成第二语音编码器。
编码器3702可包括一初始参数计算模块3718、 一速率确定模块3720、 一模式分类 模块3722、多个编码模式3724、 3726、 3728及一包格式化模块3730。包格式化模块3730 可插入包识别符3708。编码模式3724、 3726、 3728的数目被展示为N,其可表示编码 模式3724、 3726、 3728的任何数目。出于简明性目的,展示三个编码模式3724、 3726、 3728,其中虚线指示其它编码模式的存在。
解码器3704可包括一包分解器模块3732、多个解码模式3734、 3736、 3738及一后滤波器3740。包分解器模块3732可包括包识别模块3714。解码模式3734、 3736、 3738 的数目被展示为N,其可表示解码模式3734、 3736、 3738的任何数目。出于简明性目 的,展示三个解码模式3734、 3736、 3738,其中虚线指示其它解码模式的存在。
可将语音信号s(n) 3710提供到初始参数计算模块3718。可将语音信号3710划分为 称为帧的样本块。值n可表示帧数目,或值n可表示一帧中的样本数目。在一替代配置 中,可替代语音信号3710使用线性预测(LP)残余误差信号。LP残余误差信号可由例 如码激励线性预测(CELP)编码器等语音编码器使用。
初始参数计算模块3718可基于当前帧得出各种参数。在一方面中,这些参数包括 以下参数中的至少一者线性预测编码(LPC)滤波器系数、线频谱对(LSP)系数、 规范化自相关函数(NACF)、开环滞后、零交叉速率、带能量及共振峰残余信号。
初始参数计算模块3718可耦合到模式分类模块3722。模式分类模块3722可在编码 模式3724、 3726、 3728之间动态切换。初始参数计算模块3718可将参数提供到模式分 类模块3722。模式分类模块3722可耦合到速率确定模块3720。速率确定模块3720可 接收速率命令信号。速率命令信号可引导编码器3702以特定速率编码语音信号3710。 在一方面中,特定速率包括可指示将使用一百七十一位来编码语音信号3710的全速率。 在另一实例中,特定速率包括可指示将使用八十位来编码语音信号3710的半速率。在 另一实例中,特定速率包括可指示将使用十六位来编码语音信号3710的八分之一速率。
如先前所陈述,模式分类模块3722可经耦合而以逐帧为基础在编码模式3724、3726、 3728之间动态切换,以便选择用于当前帧的最适合编码模式3724、 3726、 3728。模式 分类模块3722可通过将参数与预定义阈值及/或最高值比较来选择用于当前帧的特定编 码模式3724、 3726、 3728。此外,模式分类模块3722可基于从速率确定模块3720接收 的速率命令信号来选择特定编码模式3724、 3726、 3728。举例来说,编码模式A 3724 可使用一百七十一位来编码语音信号3710,而编码模式B 3726可使用八十位来编码语 音信号3710。
基于帧的能量含量,模式分类模块3722可将帧分类为非语音或无效语音(例如, 静默、背景噪声或言语之间的停顿),或语音。基于帧的周期性,模式分类模块3722可 将语音帧分类为特定类型的语音,例如有声、无声或过渡。
有声语音可包括展现相对高程度的周期性的语音且可包括元音声。音高周期可为可 用于分析且重构帧的内容的语音帧的分量。无声语音可包括辅音声。过渡语音帧可包括 在有声语音与无声语音之间的过渡。可将并非被分类为有声语音或无声语音的帧分类为
过渡语音。
43语音模式(还称为发声模式)指示当前帧表示有声语音还是无声语音。此参数可具 有二进制值,所述值基于帧的周期性(例如零交叉、NACF、音高增益)及/或话音有效 性的一个或一个以上量度,例如所述量度与阈值之间的关系。在其它实施方案中,语音 模式参数具有用以指示例如静默或背景噪声,或静默与有声语音之间的过渡的模式的一 个或一个以上其它状态。
分类语音帧可允许使用不同编码模式3724、 3726、 3728来编码不同类型的语音, 从而导致在共享信道(例如通信信道3706)中更有效使用带宽。举例来说,因为有声语 音为周期的且因此预测性高,所以低位速率、高预测性编码模式3724、 3726、 3728可 用于编码有声语音。
模式分类模块3722可基于帧的分类来选择用于当前帧的编码模式3724、3726、3728。 可并联耦合多种编码模式3724、 3726、 3728。编码模式3724、 3726、 3728中的一个或 一个以上模式可在任何给定时间操作。在一配置中,根据当前帧的分类来选择一个编码 模式3724、 3726、 3728。
不同编码模式3724、 3726、 3728可根据不同编码位速率、不同编码方案或编码位 速率与编码方案的不同组合来操作。如先前所陈述,使用的各种编码率可为全速率、半 速率、四分之一速率及/或八分之一速率。使用的各种编码方案可为CELP编码、原型音 高周期(PPP)编码(或波形内插(WI)编码)及/或噪声激励线性预测(NELP)编码。 因此,举例来说,特定编码模式3724、 3726、 3728可为全速率CELP;另一编码模式 3724、 3726、 3728可为半速率CELP;另一编码模式3724、 3726、 3728可为全速率PPP; 且另一编码模式3724、 3726、 3728可为NELP。
根据CELP编码模式3724、 3726、 3728,可利用经量化版本的LP残余信号来激励 线性预测声道模型。在CELP编码模式中,可量化整个当前帧。CELP编码模式3724、 3726、 3728可提供相对准确的语音再现,但是以相对高编码位速率为代价。CELP编码 模式3724、 3726、 3728可用于编码分类为过渡语音的帧。
根据NELP编码模式3724、 3726、 3728,经滤波的伪随机噪声信号可用于模型化 LP残余信号。NELP编码模式3724、 3726、 3728可为实现低位速率的相对简单的技术。 NELP编码模式3724、 3726、 3728可用于编码分类为无声语音的帧。
根据PPP编码模式3724、 3726、 3728,可编码每一帧内的一子组音高周期。可通 过在所述原型周期之间内插而重构语音信号的剩余周期。在PPP编码的时域实施方案 中,可计算描述如何修改先前原型周期以近似于当前原型周期的第一组参数。可选择一 个或一个以上码向量,所述码向量在相加时近似于在当前原型周期与经修改先前原型周
44期之间的差。第二组参数描述所述经选择码向量。在PPP编码的频域实施方案中, 一组 参数可经计算以描述原型的振幅及相位频谱。根据PPP编码的实施方案,解码器3704 可通过基于描述振幅及相位的所述组参数而重构当前原型来合成输出语音信号3716。过 去的原型周期可用作当前原型周期的振幅及/或相位的预测。可在当前重构原型周期与先 前重构原型周期之间的区域内内插语音信号。原型可包括当前帧的一部分,利用来自先 前帧的类似定位于帧内的原型而对所述部分线性内插,以便在解码器3704处重构语音 信号3710或LP残余信号。
编码原型周期而非整个语音帧可降低编码位速率。可利用PPP编码模式3724、3726、 3728来编码分类为有声语音的帧。通过采用有声语音的周期性,PPP编码模式3724、 3726、 3728可实现低于CELP编码模式3724、 3726、 3728的位速率。
经选择编码模式3724、 3726、 3728可耦合到包格式化模块3730。经选择编码模式 3724、 3726、 3728可编码或量化当前帧且将经量化帧参数3712提供到包格式化模块 3730。包格式化模块3730可将经量化帧参数3712汇编到经格式化包3713中。包格式 化模块3730可将包格式化为宽带包或窄带包。包识别符3708可包括于所述包中。如先 前所解释,包识别符3708可对解码器3704指示包为宽带包还是为窄带包。包格式化模 块3730可经由通信信道3706将经格式化包3713提供到接收器(未图示)。接收器可接 收、解调制及数字化经格式化包3713,且将包3713提供到解码器3704。
在解码器3704中,包分解器模块3732接收来自接收器的包3713。包分解器模块 3732可将包3713拆包,且包识别模块3714可辨识包括于包3713中的包识别符3708。 包识别模块3714可发现包3713为WB-HR包或窄带半速率包。包分解器模块3732还可 经配置而以逐包为基础在解码模式3734、 3736、 3738之间动态切换。解码模式3734、 3736、 3738的数目可与编码模式3724、 3726、 3728的数冃相同。每一编号的编码模式 3724、 3726、 3728可与经配置以使用相同编码位速率及编码方案的相应类似编号的解码 模式3734、 3736、 3738相关联。
如果包分解器模块3732检测到包3713,则包3713被分解且提供到相关解码模式 3734、 3736、 3738。相关解码模式3734、 3736、 3738可基于对包识别符3708的分析来 实施宽带或窄带解码技术。如果包分解器模块3732未检测到包,则宣告包丢失,且擦 除解码器(未图示)可执行帧擦除处理。解码模式3734、 3736、 3738的并联阵列可耦 合到后滤波器3740。相关解码模式3734、 3736、 3738可解码(或去量化)包3713且将 信息提供到后滤波器3740。后滤波器3740可重构(或合成)语音帧,从而输出经合成 语音帧§(n) 3716。在一配置中,并不传输经量化参数本身。替代地,传输在解码器3704中指定在各种查找表(LUT)(未图示)中的地址的码簿索引。解码器3704可接收码簿索引且搜索各种码簿LUT以得到合适参数值。因此,可传输参数(例如音高滞后、自适应码簿增益及LSP)的码簿索引,且可由解码器3704搜索三个相关联码簿LUT。
根据CELP编码模式,可传输音高滞后、音高增益、码簿参数及LSP参数。因为可在解码器3704处合成LP残余信号,所以传输LSP码簿索引。此外,可传输当前帧的音高滞后值与前一帧的音高滞后值之间的差。
根据其中将在解码器3704处合成语音信号3710的PPP编码模式,传输音高滞后、振幅及相位参数。由PPP语音编码技术使用的较低位速率可能不允许传输绝对音高滞后信息及相对音高滞后差值两者。
根据一实例,用低位速率PPP编码模式来传输例如有声语音帧的高周期性帧,所述低位速率PPP编码模式量化用于传输的当前帧的音高滞后值与前一帧的音高滞后值之间的差,且不量化用于传输的当前帧的绝对音高滞后值。因为有声帧是高周期性的,所以传输与绝对音高滞后值相对照的差值可允许实现较低编码位速率。在一方面中, 一般化此量化以使得计算出先前帧的参数值的经加权和,其中权重的和为1,且从当前帧的参数值减去所述经加权和。可接着量化所述差。
图38为说明可变速率语音编码方法3800的一实例的流程图。在一方面中,由单个移动台3302来实施方法3800,所述单个移动台3302可能够将包编码为宽带包或窄带包。在其它方面中,可由一个以上移动台3302来实施方法3800。换句话说, 一移动台3302可包括用以编码宽带包或窄带包的编码器,而单独的移动台3302可包括用以使用宽带或窄带解码技术来解码包的解码器。可计算3802当前帧的初始参数。在一配置中,初始参数计算模块3718计算3802所述参数。参数可包括以下参数中的一者或一者以上线性预测编码(LPC)滤波器系数、线频谱对(LSP)系数、规范化自相关函数(NACF)、开环滞后、带能量、零交叉速率及共振峰残余信号。
可将当前帧分类3804为有效或无效。在一配置中,分类模块3722将当前帧分类为包括"有效"语音或"无效"语音。如上文所描述,s(n)3710可包括语音周期及静默周期。有效语音可包括有声话语,而无效语音可包括背景噪声、静默、停顿等。
确定3806将当前帧分类为有效的或是无效的。如果将当前帧分类为有效的,则进一步将有效语音分类3808为有声、无声或过渡帧。可以许多不同方式分类人类语音。语音的两种分类可包括有声声音及无声声音。可将并非有声或无声的语音分类为过渡语
音基于在步骤3806及3808中进行的帧分类,可选择3810编码器/解码器模式。如图37中所示,可并联连接多种编码器/解码器模式。不同编码器/解码器模式根据不同编码方案来操作。某些模式可在语音信号s(n) 3710的展现某些特性的编码部分处更为有效。
如先前所解释,CELP模式可经选择以编码分类为过渡语音的帧。PPP模式可经选择以编码分类为有声语音的帧。NELP模式可经选择以编码分类为无声语音的帧。相同编码技术可频繁地以不同位速率操作,并具有不同性能水平。在图37中的不同编码器/解码器模式可表示不同编码技术,或以不同位速率操作的相同编码技术,或以上的组合。
所选择的编码模式可编码3812当前帧且根据位速率将经编码帧格式化3814到包中。包识别符可包括3816于所述包中。包识别符可指示所述包被编码为宽带包还是窄带包。可将包发送3818到解码器。
图39为说明规则窄带半速率包3902及宽带半速率包3904的一配置的框图。在一方面中,每一包可包括包识别符,例如包识别符A 3906及包识别符B 3907。包识别符A3906可包括合法滞后值3908,且包识别符B 3907可包括非法滞后值3914。非法滞后值3914可为对解码器指示某包为宽带半速率包3904或特殊窄带半速率包的值。合法滞后值可对解码器指示某包是否为规则(非特殊)窄带半速率CELP包3902。在其它配置中,合法滞后值可对解码器指示某包是否为包括范围
内的音高滞后值的任何其它半速率包。范围
内的音高滞后值仅用作实例。本系统及方法可应用于具有一组有效值(与特定编码方案相关联)及另一组非法/无效值的给定N位字段。
在一配置中,规则窄带半速率包3902利用包括于包3902中的80个位中的每一位。因而,延迟参数可用于存储合法滞后值3908,其可对解码器指示传入包为规则(非特殊)窄带半速率CELP。在一方面中,延迟参数包括7个位。延迟参数可并非十进制数字"101"与"127"之间的值3910。在此7位字段中的合法(有效)滞后值可为十进制数字"0"与"100"之间的值3910。 "0"与"100"之间的值3910可以其二进制形式(例如,7位二进制数)包括于规则(非特殊)窄带半速率CELP包3902中。
在一方面中,宽带编码器实施NELP编码方案以编码无声声音。可将无声声音的信号在宽带半速率包3904中封装为具有80个位的包。然而,具有无声声音的包可不包括延迟。在一配置中,因为可能在无延迟的情况下实现无声声音的信号的可接受再现,所以编码器可不分析无声声音的延迟。宽带半速率包3904可利用80个位中的74个位,留下6个位未使用。与宽带半速率包3904相关联的包识别符B 3907可包括六个1的串3912 (即,"111111")。在一配置中,此可映射为十进制数字"126"及"127"(以7位),且可被保留作为宽带半速率包3904的识别符。在一配置中,可利用来自N位参数的至少两个非法值。如果使用两个非法值,则一来自N位参数的位可经释放以载送信息。在另一配置中,来自N位参数的可经释放以载送信息的位的数目可等于log2(X),其中X为从N位参数提供的非法值数目。举例来说,八个非法值可释放三个位以载送其它信息。
图40为说明分配到各种类型的包的位的数目的表4000。表4000包括多个参数4002。在所述多个参数4002中的每一参数可利用某一数目的位。在表4000中说明的各种包类型可已利用先前论述的各种编码模式中的一者加以编码。包类型可包括全速率CELP(FCELP) 4004、半速率CELP (HCELP) 4006、特殊半速率CELP (SPLHCELP) 4008、全速率PPP(FPPP)4010、特殊半速率PPP(SPLHPPP)4012、四分之一速率PPP(QPPP)4014、特殊半速率NELP (SPLHNELP) 4016、四分之一速率NELP (QNELP) 4018及静默编码器4020。
FCELP 4004及FPPP 4010可为具有总计171个位的包。FCELP 4004包可转换为SPLHCELP 4008包。在一方面中,FCELP4004包针对例如固定码簿索引(FCB索引)及固定码簿增益(FCB增益)的参数分配位。如图所示,当FCELP 4004包转换为SPLHCELP 4008包时,针对例如FCB索引、FCB增益及△滞后的参数分配零位。换句话说,在无所述位的情况下将SPLHCELP 4008包传输到解码器。SPLHCELP 4008包包括针对例如线频谱对(LSP)、自适应码簿(ACB)增益、特殊半速率识别(ID)、特殊包ID、音高滞后及模式位信息的参数分配的位。传输到解码器的位的总数可从171减少到80。
类似地,FPPP 4010包可转换为SPLHPPP 4012包。如图所示,FPPP4010包将位分配到带对准参数。FPPP4010包可转换为SPLHPPP4012包。可废弃分配到带对准的位。换句话说,在无所述位的情况下将SPLHPPP4012包传输到解码器。传输到解码器的位的总数可从171减少到80。在一配置中,分配到振幅及全域对准参数的位包括于SPLHPPP4012包中。振幅参数可指示信号s(n)3710的频谱的振幅和全域对准参数,且可表示可确保最大程度对准的线性相移。
此外,各种类型的包可包括分配到滞后/特殊包ID参数的位。滞后/特殊包ID参数
可表示使解码器辨识出特定包是使用窄带编码技术还是宽带编码技术而编码的包识别符。
本文中的各种配置被说明为具有用于不同参数及包的不同数目的位。与每一参数相关联的特定数目的位在本文中是以实例说明的,且并非意味着限制性的。参数可包括比本文中所使用的实例更多或更少的位。图41说明可在根据一配置的通信装置4108中利用的各种组件。通信装置4108可包括处理器4102,其控制装置4108的操作。处理器4102还可称为CPU。可包括只读存储器(ROM)及随机存取存储器(RAM)两者的存储器4104将指令及数据提供到处理器4102。存储器4104的一部分还可包括非易失性随机存取存储器(NVRAM)。
通信装置4108还可包括外壳4122,其含有传输器4110及接收器4112,以允许数据在接入终端4108与远程地点之间的传输及接收。可将传输器4110及接收器4112组合为收发器4120。天线4118附接到外壳4122且电耦合到收发器4120。
通信装置4108还包括信号检测器4106,其用于检测且量化由收发器4120接收的信号电平。信号检测器4106检测例如总能量、每伪噪声(PN)码片的导频能量、功率谱密度的信号及其它信号。
通信装置4108的状态改变器4114基于当前状态及由收发器4120所接收且由信号检测器4106所检测的额外信号来控制通信装置4108的状态。装置4108可能能够以许多状态中的任一状态操作。
通信装置4108还包括系统确定器4124,所述系统确定器4124用于控制装置4108,且在其确定当前服务提供者系统不合适时确定装置4108应转移到的服务提供者系统。
由总线系统4118将通信装置4108的各种组件耦合在一起,所述总线系统4118除数据总线之外还可包括电源总线、控制信号总线及状态信号总线。然而,为了清晰起见,所述各种总线在图41中被说明为总线系统4118。通信装置4108还可包括数字信号处理器(DSP) 4116以用于处理信号。
可使用多种不同技术中的任何技术来表示信息及信号。举例来说,在以上描述中可参考的数据、指令、命令、信息、信号、位、符号及码片可由电压、电流、电磁波、磁场或磁粒子、光场或光学粒子或其任何组合来表示。
可将结合本文中所揭示的配置而描述的各种说明性逻辑块、模块、电路及算法步骤实施为电子硬件、计算机软件或所述两者的组合。为清楚说明硬件与软件的所述互换性,已就其功能性在上文中大体描述了各种说明性组件、块、模块、电路及步骤。将所述功能性实施为硬件还是软件视特定应用及施加于整个系统的设计约束而定。所属领域的技术人员可针对每一特定应用以不同方式实施所描述功能性,但不应将所述实施方案决策解释为导致脱离本系统和方法的范围。
结合本文中所揭示的配置描述的各种说明性逻辑块、模块及电路可用通用处理器、
数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其经设计以执行本文中所描述
49的功能的任何组合来实施或执行。通用处理器可为微处理器,但在替代例中,所述处理器可为任何处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器的组合、 一个或一个以上微处理器与DSP核心的联合,或任何其它所述配置。
结合本文中所揭示的配置描述的方法或算法的步骤可以硬件、由处理器执行的软件模块或所述两者的组合直接体现。软件模块可驻留于RAM存储器、快闪存储器、ROM存储器、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可拆卸盘、紧密光盘只读存储器(CD-ROM)或在此项技术中已知的任何其它形式的存储媒体中。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息且将信息写入到存储媒体。或者,存储媒体可与处理器成一体。处理器与存储媒体可驻留于ASIC中。ASIC可驻存于用户终端中。在替代例中,处理器与存储媒体可作为离散组件驻留于用户终端中。
本文中所揭示的方法包含用于实现所描述的方法的一个或一个以上步骤或动作。方法步骤及/或动作可彼此互换,而不脱离本系统及方法的范围。换句话说,除非针对配置的适当操作指定特定顺序的步骤或动作,否则可修改特定步骤及/或动作的顺序及/或使用,而不脱离本系统及方法的范围。可以硬件、软件或两者实施本文中所揭示的方法。硬件及存储器的实例可包括RAM、 ROM、 EPROM、 EEPROM、快闪存储器、光盘、寄存器、硬盘、可拆卸盘、CD-ROM或任何其它类型的硬件及存储器。
虽然已说明且描述本系统及方法的特定配置及应用,但应了解,所述系统及方法并不限于本文中所揭示的精确配置及组件。可在本文中所揭示的方法及系统的布置、操作及细节中进行对于所属领域的技术人员来说为显而易见的各种修改、变化及改变,而不脱离所主张的系统及方法的精神及范围。
权利要求
1.一种用于在与语音信号相关联的包中包含识别符的方法,所述方法包含接收信号;将所述信号分割为多个帧;将所述信号的一帧编码到包中;确定将所述包编码为宽带包还是窄带包;基于所述确定在所述包中封装识别符;以及传输所述包。
2. 根据权利要求l所述的方法,其中将所述包编码为宽带半速率包。
3. 根据权利要求2所述的方法,其中所述宽带半速率包包括80个位。
4. 根据权利要求2所述的方法,其中所述宽带半速率包包括宽带识别符。
5. 根据权利要求4所述的方法,其中所述宽带识别符包含二进制形式的十进制数一百 二十六。
6. 根据权利要求4所述的方法,其中所述宽带识别符包含二进制形式的十进制数一百 二十七。
7. 根据权利要求4所述的方法,其中所述宽带识别符包含六个一。
8. 根据权利要求2所述的方法,其中使用噪声激励线性预测(NELP)编码方案来编 码所述宽带半速率包。
9. 根据权利要求1所述的方法,其中由移动台上的宽带编码器来编码所述帧。
10. 根据权利要求1所述的方法,其进一步包含由移动台上的宽带解码器来解码所述 帧。
11. 根据权利要求1所述的方法,其进一步包含将所述包从第一移动台传输到第二移动台。
12. 根据权利要求1所述的方法,其进一步包含从N位参数提供至少两个非法值,其 中来自所述N位参数的至少一个位用于载送信息。
13. 根据权利要求12所述的方法,其中来自所述N位参数的用于载送信息的位的数目 等于log2(X),其中X为从所述N位参数提供的非法值的数目。
14. 一种用于在与语音信号相关联的包中包含识别符的设备,其包含处理器;存储器,其与所述处理器进行电子通信; 指令,其存储于所述存储器中,所述指令可执行以 接收信号;将所述信号分割为多个帧; 将所述信号的一帧编码到包中; 确定将所述包编码为宽带包还是窄带包; 基于所述确定在所述包中封装识别符;以及 传输所述包。
15. 根据权利要求14所述的设备,其中将所述包编码为宽带半速率包。
16. 根据权利要求15所述的设备,其中所述宽带半速率包包括80个位。
17. 根据权利要求15所述的设备,其中所述宽带半速率包包括宽带识别符。
18. 根据权利要求17所述的设备,其中所述宽带识别符包含二进制形式的十进制数一百二十六。
19. 根据权利要求17所述的设备,其中所述宽带识别符包含二进制形式的十进制数一 百二十七。
20. 根据权利要求n所述的设备,其中所述宽带识别符包含六个一。
21. —种经配置以在与语音信号相关眹的包中包含识别符的系统,其包含:用于处理的装置;用于接收信号的装置;用于将所述信号分割为多个帧的装置;用于将所述信号的一帧编码到包中的装置;用于确定将所述包编码为宽带包还是窄带包的装置;用于基于所述确定在所述包中封装识别符的装置;以及用于传输所述包的装置。
22. —种计算机可读媒体,其经配置以存储一组指令,所述指令可执行以:接收信号;将所述信号分割为多个帧; 将所述信号的一帧编码到包中; 确定将所述包编码为宽带包还是窄带包; 基于所述确定在所述包中封装识别符;以及 传输所述包。
23. —种用于解码包的方法,所述方法包含-接收包;分析包括于所述包中的识别符;确定所述包是由宽带编码器还是由窄带编码器编码;以及 基于所述确定选择用于所述包的解码模式。
24. —种用于解码包的设备,其包含处理器;存储器,其与所述处理器进行电子通信; 指令,其存储于所述存储器中,所述指令可执行以.-接收包;分析包括于所述包中的识别符;确定所述包是由宽带编码器还是由窄带编码器编码;以及 基于所述确定选择用于所述包的解码模式。
25. —种经配置以解码包的系统,其包含用于处理的装置;用于接收包的装置;用于分析包括于所述包中的识别符的装置;用于确定所述包是由宽带编码器还是由窄带编码器所编码的装置;以及 用于基于所述确定选择用于所述包的解码模式的装置。
26. —种计算机可读媒体,其经配置以存储一组指令,所述指令可执行以接收包;分析包括于所述包中的识别符;确定所述包是由宽带编码器还是由窄带编码器编码;以及 基于所述确定选择用于所述包的解码模式。
全文摘要
本发明描述一种用于在与语音信号相关联的包中包含识别符的方法。接收信号。将所述信号分割为多个帧。将所述信号的一帧编码到包中。确定将所述包编码为宽带包还是窄带包。基于所述确定在所述包中封装识别符。传输所述包。从N位参数提供至少两个非法值,其中将来自所述N位参数的至少一个位用于载送信息。来自所述N位参数的用于载送信息的位的数目等于log<sub>2</sub>(X),其中X为从所述N位参数提供的非法值的数目。
文档编号G10L19/00GK101496097SQ200780027855
公开日2009年7月29日 申请日期2007年7月31日 优先权日2006年7月31日
发明者维韦克·拉金德朗, 阿南塔帕德马那伯罕·A·坎达哈达伊 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1