从窄频带信号确定上频带信号的制作方法

文档序号:2824887阅读:271来源:国知局
专利名称:从窄频带信号确定上频带信号的制作方法
技术领域
本发明大体上涉及通信系统。更具体来说,本发明涉及从窄频带信号确定上频带信号。
背景技术
无线通信系统已成为全球许多人进行通信所采用的重要手段。无线通信系统可为许多无线通信装置提供通信,每一无线通信装置可由一基站服务。无线通信装置能够使用多个协议且在多个频率下操作以在多个无线通信系统中通信。为了容纳许多用户,使用不同技术来最大化无线通信系统内的效率。举例来说,常常将语音压缩到窄带宽中以供发射。此允许更多用户接入网络,但还导致接收器处的不良语音质量。因此,可通过用于从窄频带信号确定上频带信号的改进的系统和方法来实现益处。

发明内容
揭示一种用于从窄频带语音信号确定上频带语音信号的方法。从所述窄频带语音信号确定窄频带线频谱频率(LSF)的列表。确定第一对邻近窄频带LSF,所述邻近窄频带 LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。确定为所述第一对邻近窄频带LSF的平均值的第一特征。使用码簿映射基于至少所述第一特征来确定上频带LSF。在一个配置中,可基于窄频带语音信号来确定窄频带激发信号。可基于所述窄频带激发信号来确定上频带激发信号。可基于所述上频带线频谱频率(LSF)来确定上频带线性预测(LP)滤波器系数。可使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号。可确定用于所述合成的上频带语音信号的增益。可将所述增益应用于所述合成的上频带语音信号。如果当前语音帧为有话音帧,则可将窗应用于所述窄频带激发信号。可在所述窗内计算所述窄频带激发信号的窄频带能量。可将所述窄频带能量转换到对数域。可将所述对数窄频带能量线性地映射到对数上频带能量。可将所述对数上频带能量转换到非对数域。如果当前语音帧为无话音帧,则可确定所述窄频带激发信号的窄频带傅立叶变换。可计算所述窄频带傅立叶变换的子频带能量。可将所述子频带能量转换到对数域。可基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量。可将所述对数上频带能量转换到非对数域。 如果所述当前语音帧为静音帧,则可确定比所述窄频带激发信号的能量低20dB的上频带
能量°在另一配置中,可确定N个唯一邻近窄频带LSF对,以使得所述对的元素之间的绝对差呈递增次序。N可为预定数目。可确定为系列中的所述LSF对的平均值的N个特征。 可使用码簿映射基于所述N个特征来确定上频带LSF。为了确定上频带线频谱频率(LSF),可确定窄频带码簿中的最紧密匹配所述第一特征的条目,且可基于当前语音帧被分类为有话音、无话音还是静音来选择所述窄频带码簿。还可将所述窄频带码簿中的所述条目的索引映射到上频带码簿中的索引,且可基于所述当前语音帧被分类为有话音、无话音还是静音来选择所述上频带码簿。还可从所述上频带码簿提取所述上频带码簿中的所述索引处的上频带LSF。所述窄频带码簿可包括从窄频带语音导出的原型特征,且所述上频带码簿可包括原型上频带线频谱频率(LSF)。窄频带线频谱频率(LSF)的所述列表可按升序进行排序。还揭示一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围。所述设备包括处理器,和与所述处理器进行电子通信的存储器。可执行指令存储于所述存储器中。所述指令可执行以基于所述窄频带语音信号使用线性预测编码(LPC)分析来确定窄频带线频谱频率(LSF)的列表。所述指令还可执行以确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。所述指令还可执行以确定为所述第一对邻近窄频带LSF的平均值的第一特征。所述指令还可执行以使用码簿映射基于至少所述第一特征来确定上频带LSF。还揭示一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围。所述设备包括用于基于所述窄频带语音信号使用线性预测编码(LPC)分析来确定窄频带线频谱频率(LSF)的列表的装置。所述设备还包括用于确定第一对邻近窄频带LSF的装置,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。所述设备还包括用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的装置。所述设备还包括用于使用码簿映射基于至少所述第一特征来确定上频带LSF的装置。还揭示一种用于从窄频带语音信号确定上频带语音信号的计算机程序产品,其中所述上频带语音比所述窄频带语音跨越更高的频率范围。所述计算机程序产品包含其上具有指令的计算机可读媒体。所述指令包括用于基于所述窄频带语音信号使用线性预测编码 (LPC)分析来确定窄频带线频谱频率(LSF)的列表的代码。所述指令还包括用于确定第一对邻近窄频带LSF的代码,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。所述指令还包括用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的代码。所述指令还包括用于使用码簿映射基于至少所述第一特征来确定上频带LSF的代码。


图1为说明使用盲带宽扩展的无线通信系统的方框图2为说明语音信号的随频率而变的相对带宽的方框图;图3为说明盲带宽扩展的方框图;图4为说明用于盲带宽扩展的方法的流程图;图5为说明估计上频带频谱包络的上频带线性预测编码(LPC)估计模块的方框图;图6为说明用于从窄频带线频谱频率(LSF)列表提取特征的方法的流程图;图7为说明上频带增益估计模块的方框图;图8为说明上频带增益估计模块的另一方框图;图9为说明非线性处理模块的方框图;图10为说明从窄频带激发信号产生谐波扩展信号的频谱扩展器的方框图;以及图11说明可包括于无线装置内的某些组件。
具体实施例方式收听宽频带语音(50Hz到8000Hz)是合意的(与窄频带语音相对比),因为其质量较高且一般听起来更好。然而,在许多情况下,仅窄频带语音可用,因为经由传统陆线和无线电话系统的语音通信常常限于300Hz到4000Hz的窄频带频率范围。宽频带语音发射和接收系统正变得越来越流行,但将需要对现有基础设施作出重大改变,其将耗费相当多的时间。同时,正在使用盲带宽扩展技术,其充当作用于接收到的窄频带语音的后处理模块以将窄频带语音的带宽扩展到宽频带频率范围而不需要来自编码器的任何旁侧信息。盲估计算法完全从窄频带信号估计上频带(3500Hz到8000Hz的频带)和低音(50Hz到300Hz)的内容。术语“盲”指代未从编码器接收任何旁侧信息的事实。换句话说,最理想的宽频带语音质量解决方案为在发射器处对宽频带信号进行编码,发射所述宽频带信号,和在接收器(即,无线通信装置)处对所述宽频带信号进行解码。然而,目前,基础设施和移动装置仅使用窄频带信号进行通信。因此,改变整个无线通信系统将需要对现有基础设施和移动装置做出代价高的改变。然而,本发明的系统和方法使用现有基础设施和通信协议进行操作。换句话说,本文中所揭示的配置可包括于现有装置中,其仅需微小改变且不需要改变现有基础设施,由此以最小成本增加接收器处的语音质量。具体来说,本发明的系统和方法从窄频带信号估计上频带信号的上频带频谱包络和时间能量轮廓(temporal energy contour)。此外,还使用激发估计和上频带合成技术来产生上频带信号。图1为说明使用盲带宽扩展的无线通信系统100的方框图。无线通信装置102与基站104通信。无线通信装置102的实例包括蜂窝式电话、个人数字助理(PDA)、手持式装置、无线调制解调器、膝上型计算机、个人计算机等。无线通信装置102可或者称为接入终端、移动终端、移动台、远程站、用户终端、终端、订户单元、移动装置、无线装置、订户站、用户设备或某一其它类似术语。基站104可或者称为接入点、节点B、演进型节点B,或某一其它类似术语。基站104与无线电网络控制器106(还称为基站控制器或包控制功能)通信。无线电网络控制器106与移动交换中心(MSC) 110、包数据服务节点(PDSN) 108或网间互连功能(IWF)、公共交换电话网络(PSTN) 114(通常为电话公司)和因特网协议(IP)网络112(通常为因特网)进行通信。移动交换中心110负责管理无线通信装置102与公共交换电话网络114之间的通信,而包数据服务节点108负责在无线通信装置102与IP网络112之间路由包。无线通信装置102包括窄频带语音解码器116,窄频带语音解码器116接收所发射的信号且产生窄频带信号122。然而,对于收听者而言,窄频带语音常常听起来不自然。因此,通过后处理模块118来处理窄频带信号122。后处理模块118使用盲带宽扩展器120以从窄频带信号122估计上频带信号,且将所述上频带信号与窄频带信号122组合以产生宽频带信号124。为了估计上频带信号,盲带宽扩展器120使用来自窄频带信号122的特征来估计上频带频谱包络,且估计上频带时间能量(上频带增益)。无线通信装置102还可包括其它未图示的信号处理模块,即,解调器、解交错器等等。图2为说明语音信号的随频率而变的相对带宽的方框图。如本文中所使用,术语 “宽频带”指代具有50Hz到8000Hz的频率范围的信号,术语“低音”指代具有50Hz到300Hz 的频率范围的信号,术语“窄频带”指代具有300Hz到4000Hz的频率范围的信号,且术语“上频带”或“高频带”指代具有3500Hz到8000Hz的频率范围的信号。因此,宽频带信号2M 为低音信号226、窄频带信号222和上频带信号228的组合。所说明的上频带信号2 和窄频带信号222具有明显的重叠,使得3. 5kHz到4kHz 的区域由所述两种信号描述。提供窄频带信号222与上频带信号2 之间的重叠允许使用在重叠区域上具有平滑下降的低通和/或高通滤波器。此些滤波器较容易设计,具有较低计算复杂度,和/或比具有更急剧或“砖墙型(brick-wall),,响应的滤波器引入更少延迟。具有急剧转变区域的滤波器倾向于比具有平滑下降的类似阶的滤波器具有更高旁瓣(其可引起混叠)。具有急剧转变区域的滤波器还可能具有可引起振铃假象(ringing artifact)的长脉冲响应。在一典型无线通信装置102中,传感器(即,麦克风,和耳机或扬声器)中的一者或一者以上在7kHz到8kHz的频率范围上可能缺少明显的响应。因此,虽然上频带信号228 和宽频带信号2 被展示为具有高达8000Hz的频率范围,但其可实际上具有7000Hz或 7500Hz的最大频率。图3为说明盲带宽扩展的方框图。由窄频带语音解码器316接收并解码所发射的信号330。所述所发射的信号330可能已被压缩到窄频带频率范围中以用于越过物理信道进行发射。窄频带语音解码器316产生窄频带语音信号322。窄频带语音信号322由盲带宽扩展器320接收为输入,盲带宽扩展器320从窄频带语音信号322估计上频带语音信号 328。窄频带线性预测编码(LPC)分析模块332导出(或获得)窄频带语音信号322的频谱包络以作为线性预测(LP)系数333的集合(例如,全极滤波器的系数1/Α (ζ))。窄频带LPC分析模块332将所述窄频带语音信号322处理为一系列非重叠帧,其中针对每一帧计算LP系数333的新的集合。帧周期可为窄频带信号322在其内可预期为局部地固定的周期(例如,20毫秒)(等效于在SkHz的取样率下的160个样本)。在一个配置中,窄频带 LPC分析模块332计算十个LP滤波器系数333的集合以表征每一 20毫秒帧的共振峰结构。 在一替代配置中,窄频带LPC分析模块332将窄频带语音信号322处理为一系列重叠帧。
窄频带LPC分析模块332可经配置以直接分析每一帧的样本,或可首先根据窗化函数(例如,汉明窗)对所述样本进行加权。所述分析还可在大于所述帧的窗(例如, 30毫秒的窗)上执行。此窗可为对称的(例如,5-20-5,使得其包括紧接在20毫秒的帧之前和之后的5毫秒)或不对称的(例如,10-20,使得其包括前一帧的最后10毫秒)。窄频带LPC分析模块332可使用列文逊-杜宾(Levinson-Durbin)递归或雷勒克斯-盖冈 (Leroux-Gueguen)算法来计算LP滤波器系数333。窄频带LPC到LSF转换模块337将LP滤波器系数333的集合变换成窄频带线频谱频率(LSF) 334的对应集合。LP滤波器系数333的集合与LSF 334的对应集合之间的变换可为可逆或不可逆的。除了产生窄频带LP系数333之外,窄频带LPC分析模块332还产生窄频带残余信号;340。音高滞后和音高增益估计器339从窄频带残余信号340产生音高滞后336和音高增益338。音高滞后336为最大化短期预测残余信号340的自相关功能(其受到某些约束)的延迟。此计算在两个估计窗上独立地进行。这些窗中的第一者包括残余信号340的第80个样本到第240个样本,第二个窗包括第160个样本到第320个样本。接着应用规则以将两个估计窗的延迟估计和增益进行组合。话音活动检测器/模式决策模块341基于窄频带语音信号322、窄频带残余信号 340或两者而产生模式决策382。此包括使用速率确定算法(RDA)将有效语音与背景噪声分离,所述RDA针对每一语音帧选择三个速率(速率1、速率1/2,或速率1/8)中的一者。通过使用所述速率信息,语音帧被分类为三个类型中的一者有话音、无话音或静音(背景噪声)。在广义上将语音大致分类为语音和背景噪声之后,话音活动检测器/模式决策模块 341进一步将语音的当前帧分类为有话音或无话音帧。将由RDA分类为速率1/8的帧指定为静音或背景噪声帧。接着由上频带LPC估计模块342使用模式决策382以在估计上频带 LSF 344时选择有话音码簿或无话音码簿。模式决策382还由上频带增益估计模块346使用。由上频带LPC估计模块342使用窄频带LSF 334来产生上频带LSF 344。此包括 从窄频带LSF 334提取一个或一个以上特征;确定适当的窄频带码簿;以及接着将所述窄频带码簿中的索引映射到上频带码簿以产生上频带LSF 344。换句话说,上频带LPC估计模块342将窄频带语音信号322中的频谱峰值(由所提取的特征指示)映射到上频带频谱包络,而非将窄频带频谱包络映射到上频带频谱包络。非线性处理模块348将窄频带残余信号340转换成上频带激发信号350。此包括以谐波方式扩展窄频带残余信号;340,以及将窄频带残余信号340与经调制的噪声信号进行组合。上频带LPC合成模块352使用上频带LSF 344来确定上频带LP滤波器系数,所述上频带LP滤波器系数用以对上频带激发信号350进行滤波以产生上频带合成信号354。另外,上频带增益估计模块346产生上频带增益356,上频带增益356由时间增益模块358使用以按比例放大上频带合成信号354的能量,从而产生增益经调整的上频带信号3 (即,上频带语音信号的估计)。上频带增益外形为控制上频带信号每4毫秒的增益的参数。在跟在有话音帧之后的第一个无话音帧和跟在无话音帧之后的第一个有话音帧期间,将此参数向量(对于20毫秒的帧,5个增益包络参数的集合)设定为不同值。在一个配置中,将所述上频带增益外形设定为0.2。所述增益外形可控制上频带帧的4毫秒的片段(子帧)之间的相对增益。其可能不影响上频带能量,所述上频带能量独立地由上频带增益356参数控制。合成滤波器组360接收增益经调整的上频带信号3 和窄频带语音信号322。合成滤波器组360可上取样每一信号以增加信号的取样率(例如,通过补零和/或通过复制样本)。另外,合成滤波器组360可分别对经上取样的窄频带语音信号322和经上取样的增益经调整的上频带信号3 进行低通滤波和高通滤波。接着对两个经滤波的信号进行求和以形成宽频带语音信号324。图4为说明用于盲带宽扩展的方法400的流程图。换句话说,方法400从窄频带语音信号322估计上频带语音信号328。方法400由盲带宽扩展器320执行。盲带宽扩展器 320接收062)窄频带语音信号322。窄频带语音信号322可已从宽频带语音信号进行压缩以用于在物理媒体上发射。盲带宽扩展器320还基于窄频带语音信号322而确定(464) 上频带激发信号350。此包括使用非线性处理。盲带宽扩展器320还基于窄频带语音信号322而确定066)窄频带线频谱频率 (LSF) 334的列表。此包括从窄频带语音信号322确定窄频带线性预测(LP)滤波器系数; 以及将所述LP滤波器系数映射到窄频带LSF 334中。盲带宽扩展器320还确定(468)第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于列表中的所有其它对邻近窄频带 LSF之间的差异。具体来说,上频带LPC估计模块342在十个窄频带LSF 334(按升序排列) 的列表中找到其间差异最小的两个邻近窄频带LSF 334。盲带宽扩展器320还确定(470) 为第一对窄频带LSF 334的平均值的第一特征。在另一配置中,盲带宽扩展器320还确定类似于第一特征的第二和第三特征,即,第二特征为在将第一对从列表移除之后最接近的下一对窄频带LSF 334的平均值,且第三特征为在将第一对和第二对从列表移除之后最接近的下一对窄频带LSF的平均值。盲带宽扩展器320还使用码簿映射基于至少所述第一特征来确定(47 上频带LSF 344,S卩,使用第一特征(和第二和第三特征(如果已确定))来确定窄频带码簿中的索引,且将所述窄频带码簿的所述索引映射到上频带码簿中的索引。盲带宽扩展器320还基于上频带LSF 344而确定(474)上频带LP滤波器系数。盲带宽扩展器320还使用上频带LP滤波器系数来对上频带激发信号350进行滤波076)以产生合成的上频带语音信号354。盲带宽扩展器320还调整(478)所述合成的上频带语音信号354的增益以产生增益经调整的上频带信号328。此包括应用来自上频带增益估计模块346的上频带增益356。图5为说明估计上频带频谱包络的上频带线性预测编码(LPC)估计模块542的方框图。从窄频带LSF 534估计上频带频谱包络(如由上频带线频谱频率(LSF)596、597参数化)。通过对窄频带语音信号322执行线性预测编码(LPC)分析且将线性预测(LP)滤波器系数转换成线频谱频率而从窄频带语音信号322估计窄频带LSF 534。特征提取模块 580从窄频带LSF 534估计三个特征参数584。为了提取第一特征584,计算连续窄频带 LSF534之间的距离。接着,选择其间距离最小的一对窄频带LSF 534,且选择其间的中点作为第一特征584。在一个配置中,提取一个以上特征584。如果情况如此,则在对其它特征 584的搜索过程中除去所选的窄频带LSF 534对,且对剩余窄频带LSF 534重复所述程序以估计额外特征584(即,向量)。
可基于从窄频带语音信号322中的所接收帧提取到的信息来确定模式决策582, 其指示当前帧是有话音、无话音还是静音的。模式决策582可由码簿选择模块586接收以确定是使用有话音码簿还是无话音码簿。用于估计有话音和无话音帧的上频带LSF 596、 597的码簿可彼此不同。或者,可基于特征584来选择所述码簿。如果模式决策582指示有话音帧,则窄频带有话音码簿匹配器588可将特征584 投射到具有原型特征的窄频带有话音码簿590上,S卩,匹配器588可在窄频带有话音码簿 590中找到最佳地匹配特征584的条目。有话音索引映射程序592可将最佳匹配的索引映射到上频带有话音码簿594。换句话说,窄频带有话音码簿590中的最佳地匹配所述特征 584的条目的索引可用以在包括原型LSF向量的上频带有话音码簿594中查找合适的上频带LSF 596向量。窄频带有话音码簿590可经训练有从窄频带语音导出的原型特征,而上频带有话音码簿594可包括原型上频带LSF向量,即,有话音索引映射程序592可从特征584 映射到上频带有话音LSF 596。类似地,如果模式决策582指示无话音帧,则窄频带无话音码簿匹配器589可将特征584投射到具有原型特征的窄频带无话音码簿591上,S卩,匹配器589可在窄频带无话音码簿591中找到最佳地匹配特征584的条目。无话音索引映射程序593可将最佳匹配的索引映射到上频带无话音码簿595。换句话说,窄频带无话音码簿591中的最佳地匹配特征 584的条目的索引可用以在包括原型LSF向量的上频带无话音码簿595中查找合适的上频带无话音LSF 597向量。窄频带无话音码簿591可经训练有原型特征,而上频带无话音码簿595可包括原型上频带LSF向量,即,无话音索引映射程序593可从特征584映射到上频带无话音LSF 597。图6为说明用于从窄频带线频谱频率(LSF) 534的列表提取特征的方法600的流程图。方法600由特征提取模块580执行。特征提取模块580计算(60 邻近窄频带LSF 534对之间的差异。从窄频带LPC分析模块332接收窄频带LSF 534以作为十个值(按升序组织)的列表。因此,存在九个差异,即,第一与第二窄频带LSF 534之间的差异、第二与第三窄频带LSF 534之间的差异、第三与第四窄频带LSF 534之间的差异等等。特征提取模块580还选择(604)在窄频带LSF 534之间具有最小距离的窄频带LSF 534对。特征提取模块580还确定(606)为所选窄频带LSF 534对的平均值的特征584。在一个配置中,确定三个特征584。在此配置中,特征提取模块580确定(608)是否已识别了三个特征584。如果否,则特征提取模块580还从剩余窄频带LSF移除(61 所选窄频带LSF对,且再次计算 (602)差异以找到至少又一个特征584。如果已识别了三个特征584,则特征提取模块580 按升序对特征584进行排序(610)。在一替代配置中,识别多于或少于三个的特征584,且相应地调适方法600。图7为说明上频带增益估计模块746的方框图。上频带增益估计模块746从窄频带信号能量估计上频带能量756,所述窄频带信号能量取决于语音帧被分类为有话音还是无话音。图7说明估计有话音上频带能量756(即,有话音上频带增益)。对于有话音帧,使用通过对训练数据库使用一阶回归分析而确定的线性变换函数。窗化模块714可将窗应用于窄频带激发信号740。或者,上频带增益估计模块746 可接收窄频带语音信号322以作为输入。能量计算器716可计算经窗化的窄频带激发信号 715的能量。对数变换模块718可(例如)使用函数IOloglO ()来将窄频带能量717转换到对数域。可接着用线性映射程序720将对数窄频带能量719映射到对数上频带能量721。 在一个配置中,可根据等式(1)来执行线性映射gu = α δι+β (1)其中,为对数上频带能量721,gl为对数窄频带能量719,α = 0.84209,且β ="5. 35639。可接着(例如)使用函数10(g/1°)用非对数变换模块722将对数上频带能量 721转换到非对数域以产生有话音上频带能量756。窄频带语音信号当在编码器处经由LPC分析滤波器被滤波时,在所述编码器处, 所述窄频带语音信号可产生窄频带残余信号。在解码器处,窄频带残余信号可再现为窄频带激发信号。在解码器处,经由LPC合成滤波器对所述窄频带激发信号进行滤波。此滤波的结果为经解码的合成的窄频带语音信号。图8为说明上频带增益估计模块846的另一方框图。具体来说,图8说明估计无话音上频带能量856(即,无话音上频带增益)。对于无话音帧,使用涉及子频带增益和频谱倾斜的试探性度量来导出上频带能量856。快速傅立叶变换(FFT)模块拟4可计算窄频带激发信号840的窄频带傅立叶变换 825。或者,上频带增益估计模块846可接收窄频带语音信号322以作为输入。子频带能量计算器拟6可将窄频带傅立叶变换825分为三个不同子频带,且计算这些子频带中的每一者的能量。举例来说,所述频带可为^OHz到875Hz、875Hz到1780Hz,和1780Hz到3600Hz。 对数变换模块818a到818c可(例如)使用函数101呢1(|()将子频带能量827转换为对数子频带能量829。子频带增益关系模块拟8可接着基于对数子频带能量8 相关的方式连同频谱倾斜来确定对数上频带能量831。可由频谱倾斜计算器835基于窄频带线性预测系数 (LPC) 833来确定所述频谱倾斜。在一个配置中,通过将窄频带LPC参数833转换为反射系数的集合且选择第一反射系数作为频谱倾斜来计算频谱倾斜参数。举例来说,为了确定对数上频带能量831,子频带增益关系模块拟8可使用以下伪码
if (spectral_tilt>0)
if (g3> g2 && g2> gi) {
enhfact=(l+ 0.95 * spectral_tilt); if (enhfact>2) {
enhfact=2;
}
gH= g3+(g3 - g2 );
gH=enhfact*gH;
} else {
if (gi<0 Il g2<0 Il g3<0 Il g3< g2)
权利要求
1.一种用于从窄频带语音信号确定上频带语音信号的方法,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述方法包含基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率LSF的列表;确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异;确定为所述第一对邻近窄频带LSF的平均值的第一特征;以及使用码簿映射基于至少所述第一特征来确定上频带LSF。
2.根据权利要求1所述的方法,其进一步包含 基于所述窄频带语音信号来确定窄频带激发信号;以及基于所述窄频带激发信号来确定上频带激发信号。
3.根据权利要求2所述的方法,其进一步包含基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数; 使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号;确定用于所述合成的上频带语音信号的增益;以及将所述增益应用于所述合成的上频带语音信号。
4.根据权利要求3所述的方法,其中所述确定所述增益包含 在当前语音帧为有话音帧的情况下将窗应用于所述窄频带激发信号; 在所述窗内计算所述窄频带激发信号的窄频带能量; 将所述窄频带能量转换到对数域;将所述对数窄频带能量线性地映射到对数上频带能量;以及将所述对数上频带能量转换到非对数域。
5.根据权利要求3所述的方法,其中所述确定所述增益进一步包含 在所述当前语音帧为无话音帧的情况下确定所述窄频带激发信号的窄频带傅立叶变换; 计算所述窄频带傅立叶变换的子频带能量; 将所述子频带能量转换到对数域;基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量;以及将所述对数上频带能量转换到非对数域。
6.根据权利要求3所述的方法,其中所述确定所述增益进一步包含 在所述当前语音帧为静音帧的情况下确定比所述窄频带激发信号的能量低20dB的上频带能量。
7.根据权利要求1所述的方法,其进一步包含确定N个唯一邻近窄频带LSF对以使得所述对的元素之间的绝对差呈递增次序,其中 N为预定数目;确定为系列中的所述LSF对的平均值的N个特征;以及使用码簿映射基于所述N个特征来确定上频带LSF。
8.根据权利要求1所述的方法,其中所述确定上频带线频谱频率LSF包含确定窄频带码簿中的最紧密匹配所述第一特征的条目,其中基于当前语音帧是被分类为有话音、无话音还是静音来选择所述窄频带码簿;将所述窄频带码簿中的所述条目的索引映射到上频带码簿中的索引,其中基于所述当前语音帧是被分类为有话音、无话音还是静音来选择所述上频带码簿;以及从所述上频带码簿提取所述上频带码簿中的所述索引处的上频带LSF。
9.根据权利要求8所述的方法,其中所述窄频带码簿包含从窄频带语音导出的原型特征,且所述上频带码簿包含原型上频带线频谱频率LSF。
10.根据权利要求1所述的方法,其进一步包含按升序对窄频带线频谱频率LSF的所述列表进行排序。
11.一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述设备包含处理器;存储器,其与所述处理器进行电子通信; 存储于所述存储器中的指令,所述指令可由所述处理器执行以 基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率LSF的列表;确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异;确定为所述第一对邻近窄频带LSF的平均值的第一特征;且使用码簿映射基于至少所述第一特征来确定上频带LSF。
12.根据权利要求11所述的设备,其进一步包含可执行以进行以下操作的指令 基于所述窄频带语音信号来确定窄频带激发信号;以及基于所述窄频带激发信号来确定上频带激发信号。
13.根据权利要求12所述的设备,其进一步包含可执行以进行以下操作的指令 基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数;使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号;确定用于所述合成的上频带语音信号的增益;以及将所述增益应用于所述合成的上频带语音信号。
14.根据权利要求13所述的设备,其中所述可执行以确定所述增益的指令包含可执行以进行以下操作的指令在当前语音帧为有话音帧的情况下 将窗应用于所述窄频带激发信号; 在所述窗内计算所述窄频带激发信号的窄频带能量; 将所述窄频带能量转换到对数域;将所述对数窄频带能量线性地映射到对数上频带能量;以及将所述对数上频带能量转换到非对数域。
15.根据权利要求13所述的设备,其中所述可执行以确定所述增益的指令进一步包含可执行以进行以下操作的指令在所述当前语音帧为无话音帧的情况下 确定所述窄频带激发信号的窄频带傅立叶变换; 计算所述窄频带傅立叶变换的子频带能量; 将所述子频带能量转换到对数域;基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量;以及将所述对数上频带能量转换到非对数域。
16.根据权利要求13所述的设备,其中所述可执行以确定所述增益的指令进一步包含可执行以进行以下操作的指令在所述当前语音帧为静音帧的情况下 确定比所述窄频带激发信号的能量低20dB的上频带能量。
17.根据权利要求11所述的设备,其进一步包含可执行以进行以下操作的指令 确定N个唯一邻近窄频带LSF对以使得所述对的元素之间的绝对差呈递增次序,其中N为预定数目;确定为系列中的所述LSF对的平均值的N个特征;以及使用码簿映射基于所述N个特征来确定上频带LSF。
18.根据权利要求11所述的设备,其中所述可执行以确定上频带线频谱频率LSF的指令包含可执行以进行以下操作的指令确定窄频带码簿中的最紧密匹配所述第一特征的条目,其中基于当前语音帧是被分类为有话音、无话音还是静音来选择所述窄频带码簿;将所述窄频带码簿中的所述条目的索引映射到上频带码簿中的索引,其中基于当前语音帧是被分类为有话音、无话音还是静音来选择所述上频带码簿;以及从所述上频带码簿提取所述上频带码簿中的所述索引处的上频带LSF。
19.根据权利要求18所述的设备,其中所述窄频带码簿包含从窄频带语音导出的原型特征,且所述上频带码簿包含原型上频带线频谱频率LSF。
20.根据权利要求11所述的设备,其进一步包含可执行以按升序对窄频带线频谱频率 LSF的所述列表进行排序的指令。
21.一种用于从窄频带语音信号确定上频带语音信号的设备,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述设备包含用于基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率 LSF的列表的装置;用于确定第一对邻近窄频带LSF的装置,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异;用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的装置;以及用于使用码簿映射基于至少所述第一特征来确定上频带LSF的装置。
22.根据权利要求21所述的设备,其进一步包含用于基于所述窄频带语音信号来确定窄频带激发信号的装置;以及用于基于所述窄频带激发信号来确定上频带激发信号的装置。
23.根据权利要求22所述的设备,其进一步包含用于基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数的装置; 用于使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号的装置;用于确定用于所述合成的上频带语音信号的增益的装置;以及用于将所述增益应用于所述合成的上频带语音信号的装置。
24.根据权利要求23所述的设备,其中所述用于确定所述增益的装置包含 在当前语音帧为有话音帧的情况下用于将窗应用于所述窄频带激发信号的装置; 用于在所述窗内计算所述窄频带激发信号的窄频带能量的装置; 用于将所述窄频带能量转换到对数域的装置;用于将所述对数窄频带能量线性地映射到对数上频带能量的装置;以及用于将所述对数上频带能量转换到非对数域的装置。
25.根据权利要求23所述的设备,其中所述用于确定所述增益的装置进一步包含 在所述当前语音帧为无话音帧的情况下用于确定所述窄频带激发信号的窄频带傅立叶变换的装置; 用于计算所述窄频带傅立叶变换的子频带能量的装置; 用于将所述子频带能量转换到对数域的装置;用于基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量的装置;以及用于将所述对数上频带能量转换到非对数域的装置。
26.根据权利要求23所述的设备,其中所述用于确定所述增益的装置进一步包含 在所述当前语音帧为静音帧的情况下用于确定比所述窄频带激发信号的能量低20dB的上频带能量的装置。
27.一种用于从窄频带语音信号确定上频带语音信号的计算机程序产品,其中所述上频带语音比所述窄频带语音跨越更高的频率范围,所述计算机程序产品包含其上具有指令的非暂时性计算机可读媒体,所述指令包含用于基于所述窄频带语音信号使用线性预测编码LPC分析来确定窄频带线频谱频率 LSF的列表的代码;用于确定第一对邻近窄频带LSF的代码,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异; 用于确定为所述第一对邻近窄频带LSF的平均值的第一特征的代码;以及用于使用码簿映射基于至少所述第一特征来确定上频带LSF的代码。
28.根据权利要求27所述的计算机程序产品,其进一步包含 用于基于所述窄频带语音信号来确定窄频带激发信号的代码;以及用于基于所述窄频带激发信号来确定上频带激发信号的代码。
29.根据权利要求观所述的计算机程序产品,其进一步包含用于基于所述上频带线频谱频率LSF来确定上频带线性预测LP滤波器系数的代码;用于使用所述上频带LP滤波器系数来对所述上频带激发信号进行滤波以产生合成的上频带语音信号的代码;用于确定用于所述合成的上频带语音信号的增益的代码;以及用于将所述增益应用于所述合成的上频带语音信号的代码。
30.根据权利要求四所述的计算机程序产品,其中所述用于确定所述增益的代码包含在当前语音帧为有话音帧的情况下 用于将窗应用于所述窄频带激发信号的代码; 用于在所述窗内计算所述窄频带激发信号的窄频带能量的代码; 用于将所述窄频带能量转换到对数域的代码;用于将所述对数窄频带能量线性地映射到对数上频带能量的代码;以及用于将所述对数上频带能量转换到非对数域的代码。
31.根据权利要求四所述的计算机程序产品,其中所述用于确定所述增益的代码进一步包含在所述当前语音帧为无话音帧的情况下 用于确定所述窄频带激发信号的窄频带傅立叶变换的代码; 用于计算所述窄频带傅立叶变换的子频带能量的代码; 用于将所述子频带能量转换到对数域的代码;用于基于所述子频带能量彼此相关的方式和从窄频带线性预测系数计算出的频谱倾斜参数而从所述对数子频带能量确定对数上频带能量的代码;以及用于将所述对数上频带能量转换到非对数域的代码。
32.根据权利要求四所述的计算机程序产品,其中所述用于确定所述增益的代码进一步包含在所述当前语音帧为静音帧的情况下用于确定比所述窄频带激发信号的能量低20dB的上频带能量的代码。
全文摘要
本发明揭示一种用于从窄频带语音信号确定上频带语音信号的方法。从所述窄频带语音信号确定窄频带线频谱频率LSF的列表。确定第一对邻近窄频带LSF,所述邻近窄频带LSF之间的差异低于所述列表中的所有其它对邻近窄频带LSF之间的差异。确定为所述第一对邻近窄频带LSF的平均值的第一特征。使用码簿映射基于至少所述第一特征来确定上频带LSF。
文档编号G10L21/02GK102576542SQ201080047460
公开日2012年7月11日 申请日期2010年10月23日 优先权日2009年10月23日
发明者丹尼尔·J·辛德尔, 文卡特什·克里希南, 阿南塔帕德玛纳班·阿拉桑尼帕莱·坎迪哈代 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1