高频带激励信号生成的制作方法

文档序号:19998756发布日期:2020-02-22 02:59阅读:267来源:国知局
高频带激励信号生成的制作方法

本申请是申请号为201580022785.5、申请日为2015年3月31日、发明名称为“高频带激励信号生成”的中国专利申请的分案申请。

优先权声明

本申请案请求2014年4月30日申请的标题为“highbandexcitationsignalgeneration”的美国申请案第14/265,693号的优先权,所述美国申请案的内容以全文引用的方式合并。

本发明通常涉及高频带激励信号生成。



背景技术:

技术的进步已带来更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线计算装置,例如便携式无线电话、个人数字助理(pda)及传呼装置,其体积小,重量轻,且易于用户携带。更具体地,便携式无线电话(例如,蜂窝式电话及因特网协议(ip)电话)可经由无线网络传达语音及数据报。另外,许多这些无线电话包含合并到其中的其它类型的装置。举例来说,无线电话也可包含数字静物照相机、数字摄影机、数字记录器及音频文件播放器。

由数字技术发射语音是普遍的,尤其在长距离及数字无线电电话应用中。如果通过采样及数字化发射话音,则大约为六十四千位/秒(kbps)的数据速率可用于达成模拟电话的话音质量。压缩技术可用于减小经由信道发送的信息量,同时维持重新构建的话音的感知质量。经由在接收器处使用话音分析,接着译码、发射及重新合成,可达成数据速率的显著减小。

用于压缩话音的装置可用于许多电信领域中。举例来说,无线通信具有许多应用,包含(例如)无绳电话、传呼、无线本地回路、无线电话(例如,蜂窝式及个人通信服务(pcs)电话系统)、移动因特网协议(ip)电话及卫星通信系统。特定应用为用于移动用户的无线电话。

已开发用于无线通信系统的各种空中接口,包含(例如)频分多址(fdma)、时分多址(tdma)、码分多址(cdma)及时分同步cdma(td-scdma)。结合所述空中接口,已建立各种国内及国际标准,包含(例如)先进移动电话服务(amps)、全球移动通信系统(gsm)及临时标准95(is-95)。示范性无线电话通信系统为码分多址(cdma)系统。is-95标准及其衍生标准(is-95a、ansij-std-008及is-95b)(本文中统称作is-95)由电信工业协会(tia)及其它公认标准机构颁布以指定cdma空中接口针对蜂窝式或pcs电话通信系统的使用。

is-95标准随后演进成例如cdma2000及wcdma的“3g”系统,所述“3g”系统提供更大容量及高速度分组数据服务。cdma2000的两个变化由tia发布的文件is-2000(cdma20001xrtt)及is-856(cdma20001xev-do)呈现。cdma20001xrtt通信系统提供153kbps的波峰数据速率,而cdma20001xev-do通信系统定义范围介于38.4kbps至2.4mbps的数据速率集合。wcdma标准体现于第三代合作伙伴计划“3gpp”第3gts25.211号、第3gts25.212号、第3gts25.213号及第3gts25.214号中。先进国际移动电信(先进imt)规范陈述“4g”标准。对于高移动性通信(例如,来自火车及汽车),先进imt规范设定100兆位/秒(mbit/s)的波峰数据速率用于4g服务,且对于低移动性通信(例如,来自行人及静止用户),先进imt规范设定千兆位/秒(gbit/s)的波峰数据速率。

使用通过提取关于人类话音生成模型的参数来压缩话音的技术的装置被称为话音译码器。话音译码器可包括编码器及解码器。编码器将传入话音信号划分成时间块或分析帧。可将每一时间分段(或“帧”)的持续时间选择为足够短的,使得可预期信号的频谱包络保持相对静止。举例来说,帧长度可为二十毫秒,其对应于八千赫兹(khz)采样率下的160个样本,但可使用认为适于特定应用的任何帧长度或采样率。

编码器分析传入话音帧以提取某些相关参数,且随后将参数量化成二进制表示(例如,位集合或二进制数据包)。将数据包经由通信信道(即,有线和/或无线网络连接)发射至接收器及解码器。解码器处理数据包、去量化经处理数据包以产生参数且使用经去量化的参数重新合成话音帧。

话音译码器的功能为通过去除话音中固有的自然冗余而将经数字化话音信号压缩成低位率信号。可通过用参数集合表示输入话音频框及使用量化以通过位集合表示参数来达成数字压缩。如果输入话音帧具有位计数ni,且由话音译码器所产生的数据包具有位计数no,则由话音译码器所达成的压缩因数为cr=ni/no。挑战为在达成目标压缩因数时保留经解码话音的高语音质量。话音译码器的性能取决于:(1)话音模型或上文所描述的分析及合成过程的组合执行得多好,及(2)在no位每帧的目标位率下参数量化过程执行得多好。因此,话音模型的目标为对于每一帧使用较小集合的参数捕获话音信号的本质或目标语音质量。

话音译码器通常利用参数集合(包含向量)来描述话音信号。良好参数集合为感知上准确的话音信号的重新构建理想地提供低系统带宽。音调、信号功率、频谱包络(或共振峰)、振幅及相谱为话音译码参数的实例。

话音译码器可实施为时域译码器,其试图通过使用高时间分辨率处理以一次编码较小话音分段(例如,5毫秒(ms)的子帧)来捕获时域话音波形。对于每一子帧,借助于搜索算法找到来自码簿空间的高精确度代表。替代地,话音译码器可实施为频域译码器,其试图通过参数集合(分析)捕获输入话音帧的短期话音频谱及使用对应的合成过程以从频谱参数重新产生话音波形。参数量化器通过根据已知量化技术用所存储的码向量的表示来表示参数而保持参数。

一个时域话音译码器为码激发线性预测(celp)译码器。在celp译码器中,通过发现短期共振峰滤波器的系数的线性预测(lp)分析来去除话音信号中的短期相关性或冗余。将短期预测滤波器应用于传入话音帧生成lp残余信号,通过长期预测滤波器参数及后续随机码簿对所述lp残余信号进行进一步模型化及量化。因此,celp译码将编码时域话音波形的任务划分成编码lp短期滤波器系数及编码lp残余的单独任务。可以固定速率(即,对于每一帧,使用相同数目个位no)或可变速率(其中,不同位率用于不同类型的帧内容)执行时域译码。可变速率译码器试图使用将参数编码至足以获得目标质量的等级所需要的位量。

例如celp译码器的时域译码器可依赖于每帧大量位n0以保持时域话音波形的准确性。倘若每帧位计数no相对较大(例如,8kbps或高于8kbps),则这些译码器可递送极好的语音质量。在低位率(例如,4kbps及低于4kbps)下,归因于受限数目个可用位,时域译码器可不能保持高质量及稳固性能。在低位率下,受限码簿空间削减在较高速率商业应用中所部署的时域译码器的波形匹配能力。因此,低位率下的许多celp译码系统操作遭受表征为噪声的感知显著失真。

低位率下对celp译码器的替代为在类似于celp译码器的原理下操作的“噪声激发线性预测”(nelp)译码器。nelp译码器使用经滤波伪随机噪声信号来模型化话音而非码簿。由于nelp使用用于经译码话音的较简单模型,因此nelp达成比celp低的位率。nelp可用于压缩或表示清音话音或静默。

以大约为2.4kbps的速率操作的译码系统在本质上通常是参数的。即,这些译码系统通过以常规时间间隔发射描述话音信号的音调周期及频谱包络(或共振峰)的参数进行操作。说明此类参数译码器的为lp声码器。

lp声码器通过每音调周期单一脉冲来模型化浊音话音信号。可扩增此基本技术以包含关于频谱包络以及其它物质的发射信息。尽管lp声码器提供通常合理的性能,但其可引入表征为蜂音的感知显著失真。

近年来,已出现为波形译码器及参数译码器两者的混合的译码器。说明这些混合译码器的为原型波形内插(pwi)话音译码系统。pwi话音译码系统也可被称为原型音调周期(ppp)话音译码器。pwi话音译码系统提供用于译码浊音话音的有效方法。pwi的基本概念为以固定时间间隔提取代表性音调循环(原型波形)、发射其描述及通过在原型波形之间进行内插而重新构建话音信号。pwi方法可对lp残余信号抑或话音信号起作用。

在传统电话系统(例如,公共交换电话网络(pstn))中,信号带宽限于300赫兹(hz)至3.4千赫兹(khz)的频率范围。在宽带(wb)应用(例如,蜂窝式电话及因特网通讯协议语音(voip))中,信号带宽可跨越50hz至7khz的频率范围。超宽带(swb)译码技术支持扩展至16khz左右的带宽。将信号带宽自3.4khz的窄频电话扩展至16khz的swb电话可改进信号重新构建的质量、可懂度及自然度。

宽带译码技术涉及编码及发射信号的较低频率部分(例如,50hz至7khz,也被称为“低频带”)。为了改进译码效率,可不完全编码及发射信号的较高频率部分(例如,7khz至16khz,也被称为“高频带”)。低频带信号的性质可用于生成高频带信号。举例来说,可基于低频带残余使用非线性模型(例如,绝对值函数)生成高频带激励信号。当低频带残余通过脉冲经稀疏译码时,由稀疏译码的残余生成的高频带激励信号可在高频带的清音区域中导致伪影。



技术实现要素:

揭示用于高频带激励信号生成的系统及方法。音频解码器可在发射装置处接收由音频编码器编码的音频信号。音频解码器可确定特定音频信号的浊音分类(例如,强浊音、弱浊音、弱清音、强清音)。举例来说,特定音频信号的范围可为强浊音(例如,话音信号)至强清音(例如,噪声信号)。音频解码器可基于浊音分类控制输入信号的表示的包络的量。

控制包络的量可包含控制包络的特性(例如,形状、频率范围、增益和/或量值)。举例来说,音频解码器可从经编码音频信号生成低频带激励信号,且可基于浊音分类控制低频带激励信号的包络的形状。举例来说,音讯译码器可基于应用于低频带激励信号的滤波器的截止频率控制包络的频率范围。作为另一实例,音频解码器可通过基于浊音分类调整线性预测译码(lpc)系数的一或多个极点来控制包络的量值、包络的形状、包络的增益或其组合。作为另一实例,音频解码器可通过基于浊音分类调整滤波器的系数来控制包络的量值、包络的形状、包络的增益或其组合,其中所述滤波器应用于低频带激励信号。

音讯译码器可基于包络的受控量调制白噪声信号。举例来说,相比在浊音分类为强清音时,经调制的白噪声信号在浊音分类为强浊音时可更多地对应于低频带激励信号。音频解码器可基于经调制的白噪声信号生成高频带激励信号。举例来说,音讯译码器可扩展低频带激励信号且可组合经调制的白噪声信号及经扩展的低频带信号来生成高频带激励信号。

在特定实施例中,一种方法包含在装置处确定输入信号的浊音分类。所述输入信号对应于音频信号。所述方法也包含基于浊音分类控制输入信号的表示的包络的量。所述方法进一步包含基于包络的受控量调制白噪声信号。所述方法包含基于经调制的白噪声信号生成高频带激励信号。

在另一特定实施例中,一种设备包含浊音分类器、包络调整器、调制器及输出电路。所述浊音分类器经配置以确定输入信号的浊音分类。所述输入信号对应于音频信号。所述包络调整器经配置以基于浊音分类控制输入信号的表示的包络的量。所述调制器经配置以基于包络的受控量调制白噪声信号。所述输出电路经配置以基于经调制的白噪声信号生成高频带激励信号。

在另一特定实施例中,一种计算机可读存储装置存储在由至少一个处理器执行时引起所述至少一个处理器确定输入信号的浊音分类的指令。所述指令在由至少一个处理器执行时进一步引起所述至少一个处理器基于浊音分类控制输入信号的表示的包络的量、基于包络的受控量调制白噪声信号及基于经调制的白噪声信号生成高频带激励信号。

由所揭示实施例中的至少一者提供的特定优势包含生成对应于清音音频信号的平滑发声合成音频信号。举例来说,对应于清音音频信号的合成音频信号可具有极少(或不具有)伪影。本发明的其它方面、优点和特征将在审阅申请案之后变得显而易见,所述申请案包含以下部分:附图说明、实施方式及权利要求书。

附图说明

图1为说明包含装置的系统的特定实施例的图,所述装置可操作以执行高频带激励信号生成;

图2为说明可操作以执行高频带激励信号生成的解码器的特定实施例的图;

图3为说明可操作以执行高频带激励信号生成的编码器的特定实施例的图;

图4为说明高频带激励信号生成的方法的特定实施例的图;

图5为说明高频带激励信号生成的方法的另一实施例的图;

图6为说明高频带激励信号生成的方法的另一实施例的图;

图7为说明高频带激励信号生成的方法的另一实施例的图;

图8为说明高频带激励信号生成的方法的另一实施例的流程图;及

图9为根据图1至8的系统及方法的可操作以执行高频带激励信号生成的装置的框图。

具体实施方式

本文所描述的原理可应用于(例如)耳机、手持话机或经配置以执行高频带激励信号生成的其它音频装置。除非由其上下文明确限制,否则术语“信号”在本文中用以指示其通常意义中的任一者,包含如电线、总线或其它发射媒体上表达的存储器位置(或存储器位置的集合)的状态。除非由其上下文明确地限制,否则术语“生成”在本文中用以来指示其通常意义中的任一者,例如计算或另外产生。除非由其上下文明确限制,否则术语“计算”在本文中用以指示其通常意义中的任一者,例如计算、评估、平滑化和/或从多个值中进行选择。除非由其上下文明确限制,否则术语“获得”在本文中用以指示其通常意义中的任一者,例如计算、推导、接收(例如,从另一组件、块或装置)和/或检索(例如,从存储器寄存器或存储组件的阵列)。

除非由其上下文明确地限制,否则术语“产生”是用以指示其通常意义中的任一者,例如计算、生成和/或提供。除非通过其上下文明确地限制,否则术语“提供”是用以指示其通常意义中的任一者,例如计算、生成和/或产生。除非由其上下文明确限制,否则术语“耦合”是用以指示直接或间接的电气或物理连接。如果连接为间接的,则所属领域的一般技术人员应充分地理解,在经“耦合”的结构之间可存在其它块或组件。

术语“配置”可用于对如通过其特定上下文指示的方法、设备/装置和/或系统的参考中。在本描述及权利要求书中使用术语“包括”的情况下,其并不排除其它组件或操作。术语“基于”(如在“a基于b”中)用以指示其通常意义中的任一者,包含以下情况:(i)“基于至少”(例如,“a基于至少b”);及如果在特定上下文中是适当的,则(ii)“等于”(例如,“a等于b”)。在a基于b包含基于至少的情况(i)下,此可包含a耦合至b的配置。类似地,术语“响应于”用以指示其通常意义中的任一者,包含“至少响应于”。术语“至少一个”用以指示其通常意义中的任一者,包含“一或多个”。术语“至少两个”用以指示其通常意义中的任一者,包含“两个或多于两个”。

除非特定上下文另有指示,否则通用地及互换地使用术语“设备”及“装置”。除非另有指示,否则对具有特定特征的设备的操作的任何揭示内容也明确地希望揭示具有相似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示内容也明确地希望揭示根据相似配置的方法(且反之亦然)。除非特定上下文另有指示,否则通用地且可互换地利使用术语“方法”、“过程”、“程序”及“技术”。术语“组件”及“模块”可用于指示较大配置的一部分。以引用方式对文件的一部分的任何合并也应被理解为合并在所述部分内所引用的术语或变量的定义(其中这些定义出现在文件中的别处)以及在所合并部分中所引用的任何图式。

如本文所使用,术语“通信装置”是指可用于经由无线通信网络的语音和/或数据通信的电子装置。通信装置的实例包含蜂窝式电话、个人数字助理(pda)、手持型装置、耳机、无线调制解调器、膝上型计算机、个人计算机等。

参考图1,展示包含可操作以执行高频带激励信号生成的装置的系统的特定实施例,且通常将其指定为100。在特定实施例中,系统100的一或多个组件可集成至解码系统或设备中(例如,无线电话或译码器/解码器(编解码器)中)、集成至编码系统或设备中或所述两者中。在其它实施例中,系统100的一或多个组件可集成至机顶盒、音乐播放器、视频播放器、娱乐单元、导航装置、通信装置、个人数字助理(pda)、固定位置数据单元或计算机中。

应注意,在以下描述中,将由图1的系统100执行的各种功能描述为由某些组件或模块执行。组件及模块的此划分仅是为了说明。在替代实施例中,由特定组件或模块执行的功能可划分为多个组件或模块。此外,在替代实施例中,图1的两个或多于两个组件或模块可集成至单一组件或模块中。可使用硬件(例如,现场可编程门阵列(fpga)装置、专用集成电路(asic)、数字信号处理器(dsp)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合实施图1中所说明的每一组件或模块。

尽管图1至9中所描绘的说明性实施例是关于高频带模型描述的,所述高频带模型类似于用于增强型变量率编解码器-窄频-宽带(evrc-nw)中的模型,但说明性实施例中的一或多者可使用任何其它高频带模型。应理解,仅例如描述任何特定模型的使用。

系统100包含经由网络120与第一装置102通信的移动装置104。移动装置104可耦合至麦克风146或与其通信。移动装置104可包含激励信号生成模块122、高频带编码器172、多路复用器(mux)174、发射器176或其组合。第一装置102可耦合至扬声器142或与其通信。第一装置102可包含经由高频带合成器168耦合至mux170的激励信号生成模块122。激励信号生成模块122可包含浊音分类器160、包络调整器162、调制器164、输出电路166或其组合。

在操作期间,移动装置104可接收输入信号130(例如,第一用户152的用户话音信号,清音信号,或所述两者)。举例来说,第一用户152可与第二用户154进行语音呼叫。第一用户152可使用移动装置104,且第二用户154可使用第一装置102用于语音呼叫。在语音呼叫期间,第一用户152可向耦合至移动装置104的麦克风146说话。输入信号130可对应于第一用户152的话音、背景噪声(例如,音乐、街道噪声、另一个人的话音等)或其组合。移动装置104可经由麦克风146接收输入信号130。

在特定实施例中,输入信号130可为包含在自近似50赫兹(hz)至近似16千赫兹(khz)的频率范围中的数据的超宽带(swb)信号。输入信号130的低频带部分及输入信号130的高频带部分可分别占据50hz至7khz及7khz至16khz的非重叠频带。在替代实施例中,低频带部分及高频带部分可分别占据50hz至8khz及8khz至16khz的非重叠频带。在另一替代实施例中,低频带部分及高频带部分可重叠(例如,分别为50hz至8khz及7khz至16khz)。

在特定实施例中,输入信号130可为具有近似50hz至近似8khz的频率范围的宽带(wb)信号。在此实施例中,输入信号130的低频带部分可对应于近似50hz至近似6.4khz的频率范围,且输入信号130的高频带部分可对应于近似6.4khz至近似8khz的频率范围。

在特定实施例中,麦克风146可捕获输入信号130,且在移动装置104处的模/数转换器(adc)可将经捕获输入信号130自模拟波形转换成由数字音频样本组成的数字波形。数字音频样本可由数字信号处理器处理。增益调整器可通过提高或降低音频信号(例如,模拟波形或数字波形)的振幅等级来调整增益(例如,模拟波形或数字波形的增益)。增益调整器可在模拟或数字域中操作。举例来说,增益调整器可在数字域中操作且可调整由模/数转换器产生的数字音频样本。在增益调整之后,回音消除器可减小可已由扬声器的输出输入麦克风146所产生的任何回音。数字音频样本可由声码器(语音编码器-解码器)“压缩”。回音消除器的输出可耦合至声码器预处理块,例如,滤波器、噪声处理器、速率转换器等。声码器的编码器可压缩数字音频样本且形成发射包(数字音频样本的经压缩位的表示)。在特定实施例中,声码器的编码器可包含激励信号生成模块122。激励信号生成模块122可生成高频带激励信号186,如参考第一装置102所描述。激励信号生成模块122可将高频带激励信号186提供至高频带编码器172。

高频带编码器172可基于高频带激励信号186编码输入信号130的高频带信号。举例来说,高频带编码器172可基于高频带激励信号186生成高频带位流190。高频带位流190可包含高频带参数信息。举例来说,高频带位流190可包含以下中的至少一者:高频带线性预测译码(lpc)系数、高频带线谱频率(lsf)、高频带线谱对(lsp)、增益形状(例如,对应于特定帧的子帧的时间增益参数)、增益帧(例如,对应于用于特定帧的高频带与低频带的能量比率的增益参数)或对应于输入信号130的高频带部分的其它参数。在特定实施例中,高频带编码器172可使用向量量化器、隐马尔可夫模型(hmm)或高斯混合模型(gmm)中的至少一者确定高频带lpc系数。高频带编码器172可基于lpc系数确定高频带lsf、高频带lsp或所述两者。

高频带编码器172可基于输入信号130的高频带信号生成高频带参数信息。举例来说,移动装置104的解码器可模拟第一装置102的解码器。移动装置104的解码器可基于高频带激励信号186生成合成音频信号,如参考第一装置102所描述。高频带编码器172可基于合成音频信号与输入信号130的比较生成增益值(例如,增益形状、增益帧或所述两者)。举例来说,增益值可对应于合成音频信号与输入信号130之间的差异。高频带编码器172可将高频带位流190提供至mux174。

mux174可将高频带位流190与低频带位流进行组合以生成位流132。移动装置104的低频带编码器可基于输入信号130的低频带信号生成低频带位流。低频带位流可包含低频带参数信息(例如,低频带lpc系数、低频带lsf或所述两者)及低频带激励信号(例如,输入信号130的低频带残余)。发射包可对应于位流132。

发射包可存储在可与移动装置104的处理器共享的存储器中。处理器可为与数字信号处理器通信的控制处理器。移动装置104可经由网络120将位流132发射至第一装置102。举例来说,发射器176可调制某一形式的发射包(可将其它信息附于所述发射包)且经由天线空中发送经调制信息。

第一装置102的激励信号生成模块122可接收位流132。举例来说,第一装置102的天线可接收包括发射包的某一形式的传入包。位流132可对应于经脉码调制(pcm)编码的音频信号的帧。举例来说,在第一装置102处的模/数转换器(adc)可将位流132从模拟信号转换成具有多个帧的数字pcm信号。

发射包可“未由在第一装置102处的声码器的解码器压缩”。未压缩波形(或数字pcm信号)可被称作重新构建的音频样本。重新构建的音频样本可由声码器后处理块进行后处理且可由回音消除器使用以去除回音。为清楚起见,声码器的解码器及声码器后处理块可被称作声码器解码器模块。在一些配置中,回音消除器的输出可由激励信号生成模块122处理。替代地,在其它配置中,声码器解码器模块的输出可由激励信号生成模块122处理。

激励信号生成模块122可从位流132提取低频带参数信息、低频带激励信号及高频带参数信息。浊音分类器160可确定指示输入信号130的浊音/清音性质(例如,强浊音、弱浊音、弱清音或强清音)的浊音分类180(例如,0.0至1.0的值),如参考图2所描述。浊音分类器160可将浊音分类180提供至包络调整器162。

包络调整器162可确定输入信号130的表示的包络。包络可为时变包络。举例来说,包络可每输入信号130的帧更新超过一次。作为另一实例,可响应于接收输入信号130的每一样本的包络调整器162而更新包络。相比在浊音分类对应于强清音时,包络的形状的变化程度在浊音分类180对应于强浊音时可更大。输入信号130的表示可包含输入信号130的(或输入信号130的经编码版本的)低频带激励信号、输入信号130的(或输入信号130的经编码版本的)高频带激励信号或谐波性扩展的激励信号。举例来说,激励信号生成模块122可通过扩展输入信号130的(或输入信号130的经编码版本的)低频带激励信号来生成谐波性扩展的激励信号。

包络调整器162可基于浊音分类180控制包络的量,如参考图4至7所描述。包络调整器162可通过控制包络的特性(例如,形状、量值、增益和/或频率范围)来控制包络的量。举例来说,包络调整器162可基于滤波器的截止频率控制包络的频率范围,如参考图4所描述。可基于浊音分类180确定截止频率。

作为另一实例,包络调整器162可通过基于浊音分类180调整高频带线性预测译码(lpc)系数的一或多个极点来控制包络的形状、包络的量值、包络的增益或其组合,如参考图5所描述。作为另一实例,包络调整器162可通过基于浊音分类180调整滤波器的系数来控制包络的形状、包络的量值、包络的增益或其组合,如参考图6所描述。可在变换域(例如,频域)或时域中控制包络的特性,如参考图4至6所描述。

包络调整器162可将信号包络182提供至调制器164。信号包络182可对应于输入信号130的表示的包络的受控量。

调制器164可使用信号包络182来调制白噪声156以生成经调制的白噪声184。调制器164可将经调制的白噪声184提供至输出电路166。

输出电路166可基于经调制的白噪声184生成高频带激励信号186。举例来说,输出电路166可组合经调制的白噪声184与另一信号来生成高频带激励信号186。在特定实施例中,另一信号可对应于基于低频带激励信号生成的扩展信号。举例来说,输出电路166可通过升采样低频带激励信号、对经升采样信号应用绝对值函数、降采样应用绝对值函数的结果及使用适应性白化来用线性预测滤波器(例如,四阶线性预测滤波器)以频谱方式平坦化经降采样信号来生成扩展信号。在特定实施例中,输出电路166可基于谐波性参数缩放经调制的白噪声184及另一信号,如参考图4至7所描述。

在特定实施例中,输出电路166可组合经调制的白噪声的第一比率与未经调制的白噪声的第二比率来生成经缩放的白噪声,其中第一比率及第二比率是基于浊音分类180确定的,如参考图7所描述。在此实施例中,输出电路166可组合经缩放的白噪声与另一信号来生成高频带激励信号186。输出电路166可将高频带激励信号186提供至高频带合成器168。

高频带合成器168可基于高频带激励信号186生成合成高频带信号188。举例来说,高频带合成器168可基于特定高频带模型模型化和/或解码高频带参数信息,且可使用高频带激励信号186来生成合成的高频带信号188。高频带合成器168可将合成高频带信号188提供至mux170。

第一装置102的低频带解码器可生成合成的低频带信号。举例来说,低频带解码器可基于特定低频带模型解码和/或模型化低频带参数信息,且可使用低频带激励信号来生成合成的低频带信号。mux170可组合合成高频带信号188与合成低频带信号来生成输出信号116(例如,经解音频信号)。

输出信号116可由增益调整器扩增或抑制。第一装置102可经由扬声器142将输出信号116提供至第二用户154。举例来说,增益调整器的输出可通过数/模转换器自数字信号转换成模拟信号且经由扬声器142放出。

由此,系统100可在合成音频信号对应于清音(或强清音)输入信号时使得能够生成“平滑”发声合成信号。可使用基于输入信号的浊音分类调制的噪声信号生成合成高频带信号。相比在输入信号为强清音时,经调制的噪声信号在输入信号为强浊音时可更密切地对应于输入信号。在特定实施例中,当输入信号为强清音时,合成高频带信号可具有降低的稀疏性或不具有稀疏性,从而产生更平滑(例如,具有较少伪影)的合成音频信号。

参考图2,揭示可操作以执行高频带激励信号生成的解码器的特定实施例,且通常将其指定为200。在特定实施例中,解码器200可对应于或包含于图1的系统100中。举例来说,解码器200可包含于第一装置102、移动装置104或所述两者中。解码器200可说明在接收装置(例如,第一装置102)处的经编码音频信号的解码。

解码器200包含耦合至低频带合成器204的多路分用器(demux)202、浊音因数产生器208及高频带合成器168。低频带合成器204及浊音因数产生器208可经由激励信号产生器222耦合至高频带合成器168。在特定实施例中,浊音因数产生器208可对应于图1的浊音分类器160。激励信号产生器222可为图1的激励信号生成模块122的特定实施例。举例来说,激励信号产生器222可包含包络调整器162、调制器164、输出电路166、浊音分类器160或其组合。低频带合成器204及高频带合成器168可耦合至mux170。

在操作期间,demux202可接收位流132。位流132可对应于经脉码调制(pcm)编码的音频信号的帧。举例来说,在第一装置102处的模/数转换器(adc)可将位流132自模拟信号转换成具有多个帧的数字pcm信号。demux202可自位流132生成位流的低频带部分232及位流的高频带部分218。demux202可将位流的低频带部分232提供至低频带合成器204且可将位流的高频带部分218提供至高频带合成器168。

低频带合成器204可从位流的低频带部分232提取和/或解码一或多个参数242(例如,输入信号130的低频带参数信息)及低频带激励信号244(例如,输入信号130的低频带残余)。在特定实施例中,低频带合成器204可从位流的低频带部分232提取谐波性参数246。

谐波性参数246可在位流232的编码期间嵌入位流的低频带部分232中且可对应于输入信号130的高频带中谐波与噪声能量的比率。低频带合成器204可基于音调增益值确定谐波性参数246。低频带合成器204可基于参数242确定音调增益值。在特定实施例中,低频带合成器204可从位流的低频带部分232提取谐波性参数246。举例来说,移动装置104可包含在位流132中的谐波性参数246,如参考图3所描述。

低频带合成器204可基于参数242及低频带激励信号244使用特定低频带模型生成合成低频带信号234。低频带合成器204可将合成低频带信号234提供至mux170。

浊音因数产生器208可从低频带合成器204接收参数242。浊音因数产生器208可基于参数242、先前浊音决策、一或多个其它因数或其组合生成浊音因数236(例如,0.0至1.0的值)。浊音因数236可指示输入信号130的浊音/清音性质(例如,强浊音、弱浊音、弱清音或强清音)。参数242可包含输入信号130的低频带信号的零交叉率、第一反射系数、低频带激励中的适应性码簿贡献的能量与低频带激励中适应性码簿及固定码簿贡献的和的能量的比率、输入信号130的低频带信号的音调增益或其组合。浊音因数产生器208可基于方程式1确定浊音因数236。

浊音因数(voicingfactor)=∑ai*pi+c,(方程式1)

其中i∈{0,…,m-1},其中ai及c为权重,pi对应于特定经测量信号参数,且m对应于用于浊音因数确定的参数的数目。

在说明性实施例中,浊音因数(voicingfactor)=-0.4231*zcr+0.2712*fr+0.0458*acb_to_excitation+0.1849*pg+0.0138*prev_voicing_decision+0.0611,其中zcr对应于零交叉速率,fr对应于第一反射系数,acb_to_excitation对应于低频带激励中适应性码簿贡献的能量与低频带激励中适应性码簿及固定码簿贡献的总和的能量的比率,pg对应于音调增益,且previous_voicing_decision对应于先前针对另一帧计算的另一浊音因数。在特定实施例中,浊音因数产生器208可使用较高阈值以用于将帧分类为清音而非浊音。举例来说,如果将前述帧分类为清音且所述帧具有满足第一阈值(例如,低阈值)的浊音值,则浊音因数产生器208可将帧分类为清音。浊音因数产生器208可基于以下各者确定浊音值:输入信号130的低频带信号的零交叉速率、第一反射系数、低频带激励中适应性码簿贡献的能量与低频带激励中适应性码簿及固定码簿贡献的总和的能量的比率、输入信号130的低频带信号的音调增益或其组合。替代地,如果帧的浊音值满足第二阈值(例如,极低阈值),则浊音因数产生器208可将帧分类为清音。在特定实施例中,浊音因数236可对应于图1的浊音分类180。

激励信号产生器222可自低频带合成器204接收低频带激励信号244及谐波性参数246,且可自浊音因数产生器208接收浊音因数236。激励信号产生器222可基于低频带激励信号244、谐波性参数246及浊音因数236生成高频带激励信号186,如参考图1及4至7所描述。举例来说,包络调整器162可基于浊音因数236控制低频带激励信号244的包络的量,如参考图1及4至7所描述。在特定实施例中,信号包络182可对应于包络的受控量。包络调整器162可将信号包络182提供至调制器164。

调制器164可使用信号包络182调制白噪声156以生成经调制的白噪声184,如参考图1及4至7所描述。调制器164可将经调制的白噪声184提供至输出电路166。

输出电路166可通过组合经调制的白噪声184及另一信号来生成高频带激励信号186,如参考图1及4至7所描述。在特定实施例中,输出电路166可基于谐波性参数246组合经调制白噪声184及另一信号,如参考图4至7所描述。

输出电路166可将高频带激励信号186提供至高频带合成器168。高频带合成器168可基于高频带激励信号186及位流的高频带部分218将合成高频带信号188提供至mux170。举例来说,高频带合成器168可自位流的高频带部分218提取输入信号130的高频带参数。高频带合成器168可使用高频带参数及高频带激励信号186来基于特定高频带模型生成合成的高频带信号188。在特定实施例中,mux170可组合合成低频带信号234及合成高频带信号188来生成输出信号116。

因此,当合成音频信号对应于清音(或强清音)输入信号时,图2的解码器200可使得能够生成“平滑”发声合成信号。可使用基于输入信号的浊音分类而调制的噪声信号生成合成的高频带信号。相比在输入信号为强清音时,经调制的噪声信号在输入信号为强浊音时可更密切地对应于输入信号。在特定实施例中,当输入信号为强清音时,合成高频带信号可具有降低的稀疏性或不具有稀疏性,从而产生更平滑(例如,具有较少伪影)的合成音频信号。另外,基于先前浊音决策确定浊音分类(或浊音因数)可减轻帧的错分类的效应且可产生浊音频框与清音频框之间的更平滑转变。

参考图3,揭示可操作以执行高频带激励信号生成的编码器的特定实施例,且通常将其指定为300。在特定实施例中,编码器300可对应于或包含于图1的系统100中。举例来说,编码器300可包含于第一装置102、移动装置104或所述两者中。编码器300可说明在发射装置(例如,移动装置104)处的音频信号的编码。

编码器300包含耦合至低频带编码器304、浊音因数产生器208及高频带编码器172的滤波器组302。低频带编码器304可耦合至mux174。低频带编码器304及浊音因数产生器208可经由激励信号产生器222耦合至高频带编码器172。高频带编码器172可耦合至mux174。

在操作期间,滤波器组302可接收输入信号130。举例来说,输入信号130可经由麦克风146由图1的移动装置104接收。滤波器组302可将输入信号130分离成包含低频带信号334及高频带信号340的多个信号。举例来说,滤波器组302可使用对应于输入信号130的较低频率子频带(例如,50hz至7khz)的低通滤波器生成低频带信号334且可使用对应于输入信号130的较高频率子频带(例如,7khz至16khz)的高通滤波器生成高频带信号340。滤波器组302可将低频带信号334提供至低频带编码器304且可将高频带信号340提供至高频带编码器172。

低频带编码器304可基于低频带信号334生成参数242(例如,低频带参数信息)及低频带激励信号244。举例来说,参数242可包含低频带lpc系数、低频带lsf、低频带线谱对(lsp)或其组合。低频带激励信号244可对应于低频带残余信号。低频带编码器304可基于特定低频带模型(例如,特定线性预测模型)生成参数242及低频带激励信号244。举例来说,低频带编码器304可生成低频带信号334的参数242(例如,对应于共振峰的滤波器系数),可基于参数242对低频带信号334进行反向滤波,及可自低频带信号334减去所述反向滤波的信号来生成低频带激励信号244(例如,低频带信号334的低频带残余信号)。低频带编码器304可生成包含参数242及低频带激励信号244的低频带位流342。在特定实施例中,低频带位流342可包含谐波性参数246。举例来说,低频带编码器304可确定谐波性参数246,如参考图2的低频带合成器204所描述。

低频带编码器304可将参数242提供至浊音因数产生器208且可将低频带激励信号244及谐波性参数246提供至激励信号产生器222。浊音因数产生器208可基于参数242确定浊音因数236,如参考图2所描述。激励信号产生器222可基于低频带激励信号244、谐波性参数246及浊音因数236确定高频带激励信号186,如参考图2及4至7所描述。

激励信号产生器222可将高频带激励信号186提供至高频带编码器172。高频带编码器172可基于高频带信号340及高频带激励信号186生成高频带位流190,如参考图1所描述。高频带编码器172可将高频带位流190提供至mux174。mux174可组合低频带位流342与高频带位流190来生成位流132。

因此,编码器300可使得能够模拟在接收装置处的解码器,所述解码器使用基于输入信号的浊音分类而调制的噪声信号来生成合成音频信号。编码器300可生成高频带参数(例如,增益值),所述参数用于生成极其近似输入信号130的合成音频信号。

图4至7为说明高频带激励信号生成的方法的特定实施例的图。可由图1至3的系统100至300的一或多个组件执行图4至7的方法中的每一者。举例来说,可由图1的高频带激励信号生成模块122的一或多个组件、图2和/或图3的激励信号产生器222、图2的浊音因数产生器208或其组合执行图4至7的方法中的每一者。图4至7说明生成在变换域中、在时域中或在变换域抑或时域中表示的高频带激励信号的方法的替代实施例。

参考图4,展示高频带激励信号生成的方法的特定实施例的图,且通常将其指定为400。方法400可对应于生成在变换域或时域中表示的高频带激励信号。

方法400包含在404处确定浊音因数。举例来说,图2的浊音因数产生器208可基于代表性信号422确定浊音因数236。在特定实施例中,浊音因数产生器208可基于一或多个其它信号参数确定浊音因数236。在特定实施例中,若干信号参数可组合起作用来确定浊音因数236。举例来说,浊音因数产生器208可基于位流的低频带部分232(或图3的低频带信号334)、参数242、先前浊音决策、一或多个其它因数或其组合来确定浊音因数236,如参考图2至3所描述。代表性信号422可包含位流的低频带部分232、低频带信号334或通过扩展低频带激励信号244生成的扩展信号。可在变换(例如,频率)域或时域中表示代表性信号422。举例来说,激励信号生成模块122可通过对输入信号130、图1的位流132、位流的低频带部分232、低频带信号334、通过扩展图2的低频带激励信号244生成的扩展信号或其组合应用变换(例如,傅立叶变换)来生成代表性信号422。

方法400也包含在408处计算低通滤波器(lpf)截止频率,及在410处控制信号包络的量。举例来说,图1的包络调整器162可基于浊音因数236计算lpf截止频率426。如果浊音因数236指示强浊音音频,则lpf截止频率426可较高,指示时间包络的谐波分量的较高影响。当浊音因数236指示强清音音频时,lpf截止频率426可较低,对应于时间包络的谐波分量的较低(或无)影响。

包络调整器162可通过控制信号包络182的特性(例如,频率范围)来控制信号包络182的量。举例来说,包络调整器162可通过将低通滤波器450应用于代表性信号422来控制信号包络182的特性。低通滤波器450的截止频率可基本上等于lpf截止频率426。包络调整器162可通过基于lpf截止频率426追踪代表性信号422的时间包络来控制信号包络182的频率范围。举例来说,低通滤波器450可对代表性信号422进行滤波,使得经滤波信号具有由lpf截止频率426定义的频率范围。为了说明,经滤波信号的频率范围可低于lpf截止频率426。在特定实施例中,经滤波信号可具有与低于lpf截止频率426的代表性信号422的振幅匹配的振幅且可具有高于lpf截止频率426的低振幅(例如,基本上等于0)。

曲线图470说明原始频谱形状482。原始频谱形状482可表示代表性信号422的信号包络182。第一频谱形状484可对应于通过将具有lpf截止频率426的滤波器应用于代表性信号422而生成的经滤波信号。

lpf截止频率426可确定追踪速度。举例来说,相比在浊音因数236指示清音时,在浊音因数236指示浊音时可更快地追踪(例如,更频繁地更新)时间包络。在特定实施例中,包络调整器162可控制时域中的信号包络182的特性。举例来说,包络调整器162可逐个样本控制信号包络182的特性。在替代实施例中,包络调整器162可控制在变换域中表示的信号包络182的特性。举例来说,包络调整器162可通过基于追踪速度追踪频谱形状来控制信号包络182的特性。包络调整器162可将信号包络182提供至图1的调制器164。

方法400进一步包含在412处将信号包络182与白噪声156相乘。举例来说,图1的调制器164可使用信号包络182来调制白噪声156以生成经调制的白噪声184。信号包络182可调制在变换域或时域中表示的白噪声156。

方法400也包含在406处决定混合。举例来说,图1的调制器164可基于谐波性参数246及浊音因数236确定待应用于经调制白噪声184的第一增益(例如,噪声增益434)及待应用于代表性信号422的第二增益(例如,谐波增益436)。举例来说,可计算噪声增益434(例如,介于0与1之间)及谐波增益436来匹配由谐波性参数246所指示的谐波与噪声能量的比率。调制器164在浊音因数236指示强清音时可增大噪声增益434且在浊音因数236指示强浊音时可减小噪声增益434。在特定实施例中,调制器164可基于噪声增益434确定谐波增益436。在特定实施例中,谐波增益

方法400进一步包含在414处将经调制白噪声184及噪声增益434相乘。举例来说,图1的输出电路166可通过将噪声增益434应用于对经调制的白噪声184来生成经缩放的经调制白噪声438。

方法400也包含在416处将代表性信号422及谐波增益436相乘。举例来说,图1的输出电路166可通过将谐波增益436应用于代表性信号422来生成经缩放的代表性信号440。

方法400进一步包含在418处将经缩放的经调制白噪声438与经缩放的代表性信号440相加。举例来说,图1的输出电路166可通过将经缩放的经调制白噪声438与经缩放的代表性信号440组合(例如,相加)来生成高频带激励信号186。在替代实施例中,可由图1的调制器164执行操作414、操作416或所述两者。高频带激励信号186可在变换域或时域中。

因此,方法400可使得信号包络的量能够通过基于浊音因数236控制包络的特性来控制。在特定实施例中,可基于谐波性参数246通过增益因数(例如,噪声增益434及谐波增益436)动态地确定经调制白噪声184及代表性信号422的比例。可缩放经调制的白噪声184及代表性信号422,使得高频带激励信号186的谐波与噪声能量的比率近似输入信号130的高频带信号的谐波与噪声能量的比率。

在特定实施例中,可经由处理单元(例如中央处理单元(cpu)、数字信号处理器(dsp)或控制器)的硬件(例如,现场可编程门阵列(fpga)装置、专用集成电路(asic)等)、经由固件装置或其任何组合来实施图4的方法400。作为一实例,可由执行指令的处理器(如关于图9所描述)执行图4的方法400。

参考图5,展示高频带激励信号生成的方法的特定实施例的图,且通常将其指定为500。方法500可包含通过控制在变换域中表示的信号包络的量、调制在变换域中表示的白噪声或所述两者来生成高频带激励信号。

方法500包含方法400的操作404、406、412及414。可在变换(例如,频率)域中表示代表性信号422,如参考图4所描述。

方法500也包含在508处计算带宽扩张因数。举例来说,图1的包络调整器162可基于浊音因数236确定带宽扩张因数526。举例来说,相比在浊音因数236指示强清音时,带宽扩张因数526在浊音因数236指示强浊音时可指示更大带宽扩张。

方法500进一步包含在510处通过调整高频带lpc极点生成频谱。举例来说,包络调整器162可确定与代表性信号422相关联的lpc极点。包络调整器162可通过控制信号包络182的量值、信号包络182的形状、信号包络182的增益或其组合来控制信号包络182的特性。举例来说,包络调整器162可通过基于带宽扩张因数526调整lpc极点来控制信号包络182的量值、信号包络182的形状、信号包络182的增益或其组合。在特定实施例中,可在变换域中调整lpc极点。包络调整器162可基于经调整lpc极点生成频谱。

曲线图570说明原始频谱形状582。原始频谱形状582可表示代表性信号422的信号包络182。可基于与代表性信号422相关联的lpc极点生成原始频谱形状582。包络调整器162可基于浊音因数236调整lpc极点。包络调整器162可将对应于经调整lpc极点的滤波器应用于代表性信号422来生成具有第一频谱形状584或第二频谱形状586的经滤波信号。当浊音因数236指示强浊音时,经滤波信号的第一频谱形状584可对应于经调整lpc极点。当浊音因数236指示强清音时,经滤波信号的第二频谱形状586可对应于经调整lpc极点。

信号包络182可对应于所生成频谱、经调整lpc极点、与具有经调整lpc极点的代表性信号422相关联的lpc系数或其组合。包络调整器162可将信号包络182提供至图1的调制器164。

调制器164可使用信号包络182调制白噪声156来生成经调制白噪声184,如参考方法400的操作412所描述。调制器164可调制在变换域中表示的白噪声156。图1的输出电路166可基于经调制的白噪声184及噪声增益434生成经缩放的经调制白噪声438,如参考方法400的操作414所描述。

方法500也包含在512处将高频带lpc频谱542及代表性信号422相乘。举例来说,图1的输出电路166可使用高频带lpc频谱542对代表性信号422进行滤波来生成经滤波信号544。在特定实施例中,输出电路166可基于与代表性信号422相关联的高频带参数(例如,高频带lpc系数)来确定高频带lpc频谱542。为了说明,输出电路166可基于图2的位流的高频带部分218或基于自图3的高频带信号340生成的高频带参数信息来确定高频带lpc频谱542。

代表性信号422可对应于自图2的低频带激励信号244生成的扩展信号。输出电路166可使用高频带lpc频谱542合成扩展信号来生成经滤波信号544。合成可在变换域中进行。举例来说,输出电路166可使用频域中的倍增执行合成。

方法500进一步包含在516处将经滤波信号544及谐波增益436相乘。举例来说,图1的输出电路166可将经滤波信号544与谐波增益436相乘来生成经缩放的经滤波信号540。在特定实施例中,可由图1的调制器164执行操作512、操作516或所述两者。

方法500也包含在518处将经缩放的经调制白噪声438与经缩放的经滤波信号540相加。举例来说,图1的输出电路166可组合经缩放的经调制白噪声438及经缩放的经滤波信号540来生成高频带激励信号186。可在变换域中表示高频带激励信号186。

因此,方法500可使得信号包络的量能够通过基于浊音因数236在变换域中调整高频带lpc极点而控制。在特定实施例中,可基于谐波性参数246通过增益(例如,噪声增益434及谐波增益436)动态地确定经调制白噪声184与经滤波信号544的比例。可缩放经调制的白噪声184及经滤波信号544,使得高频带激励信号186的谐波与噪声能量的比率近似输入信号130的高频带信号的谐波与噪声能量的比率。

在特定实施例中,可经由处理单元(例如中央处理单元(cpu)、数字信号处理器(dsp)或控制器)的硬件(例如,现场可编程门阵列(fpga)装置、专用集成电路(asic)等)、经由固件装置或其任何组合来实施图5的方法500。作为一实例,可由执行指令的处理器(如关于图9所描述)执行图5的方法500。

参考图6,展示高频带激励信号生成的方法的特定实施例的图,且通常将其指定为600。方法600可包含通过控制时域中的信号包络的量来生成高频带激励信号。

方法600包含方法400的操作404、406及414及方法500的操作508。代表性信号422及白噪声156可在时域中。

方法600也包含在610处执行lpc合成。举例来说,图1的包络调整器162可通过基于带宽扩张因数526调整滤波器的系数来控制信号包络182的特性(例如,形状、量值和/或增益)。在特定实施例中,可在时域中执行lpc合成。滤波器的系数可对应于高频带lpc系数。lpc滤波器系数可表示频谱峰值。通过调整lpc滤波器系数控制频谱峰值可使得能够基于浊音因数236控制白噪声156的调制的程度。

举例来说,当浊音因数236指示浊音话音时,可保持频谱峰值。作为另一实例,当浊音因数236指示清音话音时可平滑化频谱峰值,同时保持整体频谱形状。

曲线图670说明原始频谱形状682。原始频谱形状682可表示代表性信号422的信号包络182。可基于与代表性信号422相关联的lpc滤波器系数生成原始频谱形状682。包络调整器162可基于浊音因数236调整lpc滤波器系数。包络调整器162可将对应于经调整lpc滤波器系数的滤波器应用于代表性信号422来生成具有第一频谱形状684或第二频谱形状686的经滤波信号。当浊音因数236指示强浊音时,经滤波信号的第一频谱形状684可对应于经调整lpc滤波器系数。当浊音因数236指示强浊音时,可保持频谱峰值,如通过第一频谱形状684所说明。当浊音因数236指示强清音时,第二频谱形状686可对应于经调整的lpc滤波器系数。当浊音因数236指示强清音时,可保持整体频谱形状,同时可平滑化频谱峰值,如通过第二频谱形状686所说明。信号包络182可对应于经调整滤波器系数。包络调整器162可将信号包络182提供至图1的调制器164。

调制器164可使用信号包络182(例如,经调整滤波器系数)调制白噪声156以生成经调制白噪声184。举例来说,调制器164可将滤波器应用于白噪声156以生成经调制白噪声184,其中滤波器具有经调整的滤波器系数。调制器164可将经调制的白噪声184提供至图1的输出电路166。输出电路166可将经调制白噪声184与噪声增益434相乘来生成经缩放的经调制白噪声438,如参考图4的操作414所描述。

方法600进一步包含在612处执行高频带lpc合成。举例来说,图1的输出电路166可合成代表性信号422来生成合成高频带信号614。可在时域中执行合成。在特定实施例中,可通过扩展低频带激励信号来生成代表性信号422。输出电路166可通过将使用高频带lpc的合成滤波器应用于代表性信号422来生成合成的高频带信号614。

方法600也包含在616处将合成的高频带信号614与谐波增益436相乘。举例来说,图1的输出电路166可将谐波增益436应用于合成的高频带信号614来生成经缩放的合成高频带信号640。在替代实施例中,图1的调制器164可执行操作612、操作616或所述两者。

方法600进一步包含在618处将经缩放的经调制白噪声438与经缩放的合成高频带信号640相加。举例来说,图1的输出电路166可组合经缩放的经调制白噪声438及经缩放的合成高频带信号640来生成高频带激励信号186。

因此,方法600可使得信号包络的量能够通过基于浊音因数236调整滤波器的系数而控制。在特定实施例中,可基于浊音因数236动态地确定经调制白噪声184与合成高频带信号614的比例。可缩放经调制的白噪声184及合成的高频带信号614,使得高频带激励信号186的谐波与噪声能量的比率近似输入信号130的高频带信号的谐波与噪声能量的比率。

在特定实施例中,可经由处理单元(例如中央处理单元(cpu)、数字信号处理器(dsp)或控制器)的硬件(例如,现场可编程门阵列(fpga)装置、专用集成电路(asic)等)、经由固件装置或其任何组合来实施图6的方法600。作为一实例,可由执行指令的处理器(如关于图9所描述)执行图6的方法600。

参考图7,展示高频带激励信号生成的方法的特定实施例的图,且通常将其指定为700。方法700可对应于通过控制在时域或变换(例如,频率)域中表示的信号包络的量来生成高频带激励信号。

方法700包含方法400的操作404、406、412、414及416。可在变换域或时域中表示代表性信号422。方法700也包含在710处确定信号包络。举例来说,图1的包络调整器162可通过将具有恒定系数的低通滤波器应用于代表性信号422来生成信号包络182。

方法700也包含在702处确定均方根值。举例来说,图1的调制器164可确定信号包络182的均方根能量。

方法700进一步包含在712处将均方根值与白噪声156相乘。举例来说,图1的输出电路166可将均方根值与白噪声156相乘以生成未经调制的白噪声736。

图1的调制器164可将信号包络182与白噪声156相乘以生成经调制的白噪声184,如参考方法400的操作412所描述。可在变换域或时域中表示白噪声156。

方法700也包含在704处确定经调制及未经调制的白噪声的增益比例。举例来说,图1的输出电路166可基于噪声增益434及浊音因数236确定未经调制的噪声增益734及经调制的噪声增益732。如果浊音因数236指示经编码的音频信号对应于强浊音音讯,则经调制的噪声增益732可对应于较高比例的噪声增益434。如果浊音因数236指示经编码的音频信号对应于强清音音讯,则未经调制的噪声增益734可对应于较高比例的噪声增益434。

方法700进一步包含在714处将未经调制的噪声增益734及未经调制白噪声736相乘。举例来说,图1的输出电路166可将未经调制的噪声增益734应用于未经调制的白噪声736来生成经缩放的未经调制的白噪声742。

输出电路166可将经调制噪声增益732应用于经调制的白噪声184来生成经缩放的经调制白噪声740,如参考方法400的操作414所描述。

方法700也包含在716处将经缩放的未经调制的白噪声742与经缩放的白噪声744相加。举例来说,图1的输出电路166可组合经缩放的未经调制的白噪声742与经缩放的经调制白噪声740来生成经缩放的白噪声744。

方法700进一步包含在718处将经缩放的白噪声744与经缩放的代表性信号440相加。举例来说,输出电路166可组合经缩放的白噪声744与经缩放的代表性信号440来生成高频带激励信号186。方法700可使用在变换(或时间)域中表示的代表性信号422及白噪声156生成在变换(或时间)域中表示的高频带激励信号186。

因此,方法700可使得未经调制的白噪声736及经调制的白噪声184的比例能够基于浊音因数236通过增益因数(例如,未经调制的噪声增益734及经调制的噪声增益732)而动态地确定。相比对应于基于经稀疏译码的低频带残余调制的白噪声的高频带信号,用于强清音音讯的高频带激励信号186可对应于具有较少伪影的未经调制的白噪声。

在特定实施例中,可经由处理单元(例如中央处理单元(cpu)、数字信号处理器(dsp)或控制器)的硬件(例如,现场可编程门阵列(fpga)装置、专用集成电路(asic)等)、经由固件装置或其任何组合来实施图7的方法700。作为一实例,可由执行指令的处理器(如关于图9所描述)执行图7的方法700。

参考图8,展示高频带激励信号生成的方法的特定实施例的流程图,且通常将其指定为800。可由图1至3的系统100至300的一或多个组件执行方法800。举例来说,可通过图1的高频带激励信号生成模块122的一或多个组件、图2或图3的激励信号产生器222、图2的浊音因数产生器208或其组合执行方法800。

方法800包含在802处在装置处确定输入信号的浊音分类。所述输入信号可对应于音频信号。举例来说,图1的浊音分类器160可确定输入信号130的浊音分类180,如参考图1所描述。输入信号130可对应于音频信号。

方法800也包含在804处基于浊音分类控制输入信号的表示的包络的量。举例来说,图1的包络调整器162可基于浊音分类180控制输入信号130的表示的包络的量,如参考图1所描述。输入信号130的表示可为位流(例如,图2的位流232)的低频带部分、低频带信号(例如,图3的低频带信号334)、通过扩展低频带激励信号(例如,图2的低频带激励信号244)生成的扩展信号、另一信号或其组合。举例来说,输入信号130的表示可包含图4至7的代表性信号422。

方法800进一步包含在806处基于包络的受控量调制白噪声信号。举例来说,图1的调制器164可基于信号包络182调制白噪声156。信号包络182可对应于包络的受控量。为了说明,调制器164可调制时域中的白噪声156,例如图4及6至7中。替代地,调制器164可调制在变换域中表示的白噪声156,例如图4至7中。

方法800也包含在808处基于经调制的白噪声信号生成高频带激励信号。举例来说,图1的输出电路166可基于经调制的白噪声184生成高频带激励信号186,如参考图1所描述。

因此,图8的方法800可使得能够基于输入信号的包络的受控量生成高频带激励信号,其中基于浊音分类控制包络的量。

在特定实施例中,可经由处理单元(例如中央处理单元(cpu)、数字信号处理器(dsp)或控制器)的硬件(例如,现场可编程门阵列(fpga)装置、专用集成电路(asic)等)、经由固件装置或其任何组合来实施图8的方法800。作为一实例,可由执行指令的处理器(如关于图9所描述)执行图8的方法800。

尽管图1至8的实施例描述基于低频带信号生成高频带激励信号,但在其它实施例中,可对输入信号130进行滤波以产生多个频带信号。举例来说,多个频带信号可包含较低频带信号、中等频带信号、较高频带信号、一或多个额外频带信号,或其组合。中等频带信号可对应于比较低频带信号更高的频率范围,且较高频带信号可对应于比中等频带信号更高的频率范围。较低频带信号及中等频带信号可对应于重叠或非重叠频率范围。中等频带信号及较高频带信号可对应于重叠或非重叠频率范围。

激励信号生成模块122可使用第一频带信号(例如,较低频带信号或中等频带信号)来生成对应于第二频带信号(例如,中等频带信号或较高频带信号)的激励信号,其中第一频带信号对应于比第二频带信号更低的频率范围。

在特定实施例中,激励信号生成模块122可使用第一频带信号来生成对应于多个频带信号的多个激励信号。举例来说,激励信号生成模块122可使用较低频带信号来生成对应于中等频带信号的中等频带激励信号、对应于较高频带信号的较高频带激励信号、一或多个额外频带激励信号,或其组合。

参考图9,描绘装置(例如,无线通信装置)的特定说明性实施例的框图,且通常将其指定为900。在各种实施例中,装置900可具有比图9中所说明的更少或更多的组件。在说明性实施例中,装置900可对应于图1的移动装置104或第一装置102。在说明性实施例中,装置900可根据图4至8的方法400至800中的一或多者操作。

在特定实施例中,装置900包含处理器906(例如,中央处理单元(cpu))。装置900可包含一或多个额外处理器910(例如,一或多个数字信号处理器(dsp))。处理器910可包括话音及音乐译码解码器(编解码器)908及回音消除器912。话音及音乐编解码器908可包含图1的激励信号生成模块122、激励信号产生器222、图2的浊音因数产生器208、声码器编码器936、声码器解码器938,或声码器编码器936及声码器解码器938两者。在特定实施例中,声码器编码器936可包含图1的高频带编码器172、图3的低频带编码器304或所述两者。在特定实施例中,声码器解码器938可包含图1的高频带合成器168、图2的低频带合成器204或所述两者。

如所说明,激励信号生成模块122、浊音因数产生器208及激励信号产生器222可为可由声码器编码器936及声码器解码器938接入的共享组件。在其它实施例中,激励信号生成模块122、浊音因数产生器208和/或激励信号产生器222中的一或多者可包含于声码器编码器936及声码器解码器938中。

尽管将话音及音乐编解码器908说明为处理器910的组件(例如,专用电路和/或可执行编程代码),但在其它实施例中,话音及音乐编解码器908的一或多个组件(例如激励信号生成模块122)可包含于处理器906、编解码器934、另一处理组件或其组合中。

装置900可包含存储器932及编解码器934。装置900可包含经由收发器950耦合至天线942的无线控制器940。装置900可包含耦合至显示控制器926的显示器928。扬声器948、麦克风946或所述两者可耦合至编解码器934。在特定实施例中,扬声器948可对应于图1的扬声器142。在特定实施例中,麦克风946可对应于图1的麦克风146。编解码器934可包含数/模转换器(dac)902及模/数转换器(adc)904。

在特定实施例中,编解码器934可自麦克风946接收模拟信号,使用模/数转换器904将模拟信号转换成数字信号,及将数字信号提供至话音及音乐编解码器908(例如,以脉码调制(pcm)格式)。话音及音乐编解码器908可处理数字信号。在特定实施例中,话音及音乐编解码器908可将数字信号提供至编解码器934。编解码器934可使用数/模转换器902将数字信号转换成模拟信号且可将模拟信号提供至扬声器948。

存储器932可包含可由装置900的处理器906、处理器910、编解码器934、另一处理单元或其组合执行以执行本文中所揭示的方法及过程(例如,图4至8的方法400至800中的一或多者)的指令956。

可经由专用硬件(例如,电路)通过执行指令以执行一或多个任务的处理器或其组合来实施系统100至300的一或多个组件。作为一实例,存储器932或处理器906、处理器910和/或编解码器934的一或多个组件可为存储器装置,例如随机存取存储器(ram)、磁电阻随机存取存储器(mram)、自旋扭矩转移mram(stt-mram)、闪速存储器、只读存储器(rom)、可编程只读存储器(prom)、可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)、寄存器、硬盘、可卸除式磁盘或光盘只读存储器(cd-rom)。存储器装置可包含在由计算机(例如,编解码器934中的处理器、处理器906和/或处理器910)执行时可引起计算机执行图4至8的方法400至800中的一或多者的至少一部分的指令(例如,指令956)。作为一实例,存储器932或处理器906、处理器910、编解码器934的一或多个组件可为非暂时性计算机可读媒体,其包含在由计算机(例如,编解码器934中的处理器、处理器906和/或处理器910)执行时引起计算机执行图4至8的方法400至800中的一或多者的至少一部分的指令(例如,指令956)。

在特定实施例中,装置900可包含于系统级封装或系统单芯片装置(例如,移动站调制解调器(msm))922中。在特定实施例中,处理器906、处理器910、显示控制器926、存储器932、编解码器934、无线控制器940及收发器950包含于系统级封装或系统单芯片装置922中。在特定实施例中,输入装置930(例如触摸屏和/或小键盘)及电力供应器944耦合至系统单芯片装置922。此外,在特定实施例中,如图9中所说明,显示器928、输入装置930、扬声器948、麦克风946、天线942及电力供应器944在系统单芯片装置922外部。然而,显示器928、输入装置930、扬声器948、麦克风946、天线942及电力供应器944中的每一者可耦合至系统单芯片装置922的组件,例如接口或控制器。

装置900可包含移动通信装置、智能电话、蜂窝式电话、膝上型计算机、计算机、平板计算机、个人数字助理、显示装置、电视、游戏机、音乐播放器、收音机、数字视频播放器、数字影碟(dvd)播放器、调谐器、相机、导航装置、解码器系统、编码器系统或其任何组合。

在说明性实施例中,处理器910可为可操作的以执行参考图1至8所描述的方法或操作的全部或一部分。举例来说,麦克风946可捕获音频信号(例如,图1的输入信号130)。adc904可将所捕获音频信号自模拟波形转换成由数字音频样本组成的数字波形。处理器910可处理数字音频样本。增益调整器可调整数字音频样本。回音消除器912可减少可已由扬声器948的输出输入麦克风946所产生的回音。

声码器编码器936可压缩对应于经处理话音信号的数字音频样本且可形成发射包(例如,数字音频样本的经压缩位的表示)。举例来说,发射包可对应于图1的位流132的至少一部分。发射包可存储在存储器932中。收发器950可调制某一形式的发射包(例如,可将其它信息附于所述发射包)且可经由天线942发射经调制数据。

作为另一实例,天线942可接收包含接收包的传入包。可由另一装置经由网络发送接收包。举例来说,接收包可对应于图1的位流132的至少一部分。声码器解码器938可解压缩接收包。经解压缩波形可被称作重新构建的音频样本。回音消除器912可去除来自经重新构建的音频样本的回音。

执行话音及音乐编解码器908的处理器910可生成高频带激励信号186,如参考图1至8所描述。处理器910可基于高频带激励信号186生成图1的输出信号116。增益调整器可扩增或抑制输出信号116。dac902可将输出信号116自数字波形转换成模拟波形且可将经转换信号提供至扬声器948。

结合所描述的实施例,揭示一种包含用于确定输入信号的浊音分类的装置的设备。输入信号可对应于音频信号。举例来说,用于确定浊音分类的装置可包含图1的浊音分类器160、经配置以确定输入信号的浊音分类的一或多个装置(例如,执行在非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。

举例来说,浊音分类器160可确定参数242,所述参数包含输入信号130的低频带信号的零交叉率、第一反射系数、低频带激励中的适应性码簿贡献的能量与低频带激励中的适应性码簿及固定码簿贡献的总和的能量的比率、输入信号130的低频带信号的音调增益或其组合。在特定实施例中,浊音分类器160可基于图3的低频带信号334确定参数242。在替代实施例中,浊音分类器160可自图2的位流的低频带部分232提取参数242。

浊音分类器160可基于方程式确定浊音分类180(例如,浊音因数236)。举例来说,浊音分类器160可基于方程式1及参数242确定浊音分类180。为了说明,浊音分类器160可通过计算零交叉率、第一反射系数、能量比率、音调增益、先前浊音决策、恒定值或其组合的加权总和来确定浊音分类180,如参考图4所描述。

设备也包含用于基于浊音分类控制输入信号的表示的包络的量的装置。举例来说,用于控制包络的量的装置可包含图1的包络调整器162、经配置以基于浊音分类控制输入信号的表示的包络的量的一或多个装置(例如,执行在非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。

举例来说,包络调整器162可通过将图1的浊音分类180(例如图2的浊音因数236)乘以截止频率缩放因数来生成频率浊音分类。截止频率缩放因数可为默认值。lpf截止频率426可对应于默认截止频率。包络调整器162可通过调整lpf截止频率426来控制信号包络182的量,如参考图4所描述。举例来说,包络调整器162可通过将频率浊音分类与lpf截止频率426相加来调整lpf截止频率426。

作为另一实例,包络调整器162可通过将图1的浊音分类180(例如,图2的浊音因数236)乘以带宽缩放因数来生成带宽扩张因数526。包络调整器162可确定与代表性信号422相关联的高频带lpc极点。包络调整器162可通过将带宽扩张因数526乘以极点缩放因数来确定极点调整因数。极点缩放因数可为默认值。包络调整器162可通过调整高频带lpc极点来控制信号包络182的量,如参考图5所描述。举例来说,包络调整器162可通过极点调整因数将高频带lpc极点调整至原始状态。

作为另一实例,包络调整器162可确定滤波器的系数。滤波器的系数可为默认值。包络调整器162可通过将带宽扩张因数526乘以滤波器缩放因数来确定滤波器调整因数。滤波器缩放因数可为默认值。包络调整器162可通过调整滤波器的系数来控制信号包络182的量,如参考图6所描述。举例来说,包络调整器162可将滤波器的系数中的每一者乘以滤波器调整因数。

设备进一步包含用于基于包络的受控量调制白噪声信号的装置。举例来说,用于调制白噪声信号的装置可包含图1的调制器164、经配置以基于包络的受控量调制白噪声信号的一或多个装置(例如,执行在非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。举例来说,调制器164可确定白噪声156及信号包络182是否在同一域中。如果白噪声156在与信号包络182不同的域中,则调制器164可将白噪声156转换成在与信号包络182相同的域中或可将信号包络182转换成在与白噪声156相同的域中。调制器164可基于信号包络182调制白噪声156,如参考图4所描述。举例来说,调制器164可将在时域中的白噪声156及信号包络182相乘。作为另一实例,调制器164可卷积频域中的白噪声156及信号包络182。

设备也包含用于基于经调制的白噪声信号生成高频带激励信号的装置。举例来说,用于生成高频带激励信号的装置可包含图1的输出电路166、经配置以基于经调制的白噪声信号生成高频带激励信号的一或多个装置(例如,执行在非暂时性计算机可读存储媒体处的指令处理器)或其任何组合。

在特定实施例中,输出电路166可基于经调制的白噪声184生成高频带激励信号186,如参考图4至7所描述。举例来说,输出电路166可将经调制白噪声184与噪声增益434相乘来生成经缩放的经调制白噪声438,如参考图4至6所描述。输出电路166可组合经缩放的经调制白噪声438及另一信号(例如,图4的经缩放的代表性信号440、图5的经缩放的经滤波信号540或图6的经缩放的合成高频带信号640)来生成高频带激励信号186。

作为另一实例,输出电路166可将经调制的白噪声184与图7的经调制的噪声增益732相乘来生成经缩放的经调制白噪声740,如参考图7所描述。输出电路166可将经缩放的经调制白噪声740及经缩放的未经调制的白噪声742进行组合(例如,相加)来生成经缩放的白噪声744。输出电路166可组合经缩放的代表性信号440及经缩放的白噪声744来生成高频带激励信号186。

所属领域的技术人员将进一步了解,结合本文所揭示的实施例所描述的各种说明性逻辑块、配置、模块、电路及算法步骤可实施为电子硬件、由处理装置(例如硬件处理器)执行的计算机软件或两者的组合。上文已通常在功能性方面描述各种说明性组件、块、配置、模块、电路及步骤。此功能性经实施为硬件或可执行软件取决于特定应用及强加于整个系统的设计约束而定。对于每一特定应用来说,所属领域的技术人员可以变化的方式实施所描述的功能性,但不应将所述实施决策解释为导致脱离本发明的范围。

结合本文中所揭示的实施例而描述的方法或算法的步骤可直接体现于硬件中、由处理器执行的软件模块中,或两者的组合中。软件模块可驻存于存储器装置中,例如随机存取存储器(ram)、磁电阻随机存取存储器(mram)、自旋扭矩转移mram(stt-mram)、闪速存储器、只读存储器(rom)、可编程只读存储器(prom)、可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)、寄存器、硬盘、可卸除式磁盘或光盘只读存储器(cd-rom)。示范性存储器装置耦合至处理器,使得处理器可从存储器装置读取信息且将信息写入至存储器装置。在替代方案中,存储器装置可与处理器成一体式。处理器及存储媒体可驻存于专用集成电路(asic)中。asic可驻存于计算装置或用户终端中。在替代方案中,处理器及存储媒体可作为离散组件驻存于计算装置或用户终端中。

提供所揭示的实施例的先前描述以使所属领域的技术人员能够制作或使用所揭示的实施例。对于所属领域的技术人员来说,这些实施例的各种修改将易于显而易见,且本文所定义的原理可在不脱离本发明的范围的情况下应用于其它实施例。因此,本发明并非希望限于本文中所展示的实施例,而应符合可能与如以下权利要求书所定义的原理及新颖特征相一致的最广泛范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1