语音参数量化方法、装置、计算机设备和存储介质与流程

文档序号:16687787发布日期:2019-01-22 18:30阅读:185来源:国知局
语音参数量化方法、装置、计算机设备和存储介质与流程
本申请涉及音频编码
技术领域
,特别是涉及一种语音参数量化方法、装置、计算机设备和存储介质。
背景技术
:声码器是一种对话音进行分析和合成的编译码器,也称话音分析合成系统或话音频带压缩系统,是压缩话音通信频带和进行保密通信的有力工具。声码器可以分为编码器和解码器,编码器将音频信号转化为比特流用于信道传输,解码器从比特流中恢复出用于语音合成的参数进行语音合成,输出音频数据。目前,编码器常用的语音参数量化方法包括互联网低比特率编码(internetlowbitratecodec,ilbc)、增强型可变速率编解码器(enhancedvariableratecodec,evrc)、自适应多速率语音编码(adaptivemultirate,amr)等方法。但是,上述语音参数量化方法不够灵活,不能适应各种场景。技术实现要素:基于此,有必要针对上述技术问题,提供一种能够灵活适应多种场景的语音参数量化方法、装置、计算机设备和存储介质。一种语音参数量化方法,所述方法包括:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为2400bps,且所述语音参数为基音周期,则根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化。在其中一个实施例中,所述根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化,包括:若所述当前帧为浊音帧,则对所述语音信号在所述当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化;若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化。在其中一个实施例中,若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化,包括:若所述当前帧为清音帧,则将所述语音信号的基音周期对应的比特位均量化为第一值;若所述语音信号的周期属性为非周期,则将所述语音信号的基音周期对应的比特位均量化为第二值。在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为2400bps,且所述语音参数为线谱对lsf参数,则采用预设的三级矢量码本对所述lsf参数进行量化。在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为1200bps,则根据传输所述语音信号的时间帧的清浊类型确定所述语音信号的超帧模式;根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在其中一个实施例中,所述根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音参数为lsf参数,则根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中至少包括两个浊音帧,则采用预设的三级量化码本对当前超帧中第三帧的lsf参数进行量化,并根据前一超帧中第三帧的lsf参数量化值和所述当前超帧中第三帧的lsf参数量化值,对第一帧和第二帧的lsf参数进行量化,所述第三帧为所述超帧模式中时序上位于最后的时间帧。在其中一个实施例中,所述根据前一超帧中第三帧的lsf参数量化值和所述当前超帧中第三帧的lsf参数量化值,对第一帧和第二帧的lsf参数进行量化,包括:根据前一超帧中第三帧的lsf参数量化值和所述当前超帧中第三帧的lsf参数量化值,确定预测系数码本中的每个预测系数对应的第一帧的lsf参数量化值和第二帧的lsf参数量化值;根据所述第一帧的lsf参数、所述第二帧的lsf参数、所述第一帧的lsf参数量化值和所述第二帧的lsf参数量化值,确定目标预测系数;根据所述目标预测系数确定残差矢量,并采用预设的二级矢量码本对所述残差矢量进行量化。在其中一个实施例中,根据所述第一帧的lsf参数、所述第二帧的lsf参数、所述第一帧的lsf参数量化值和所述第二帧的lsf参数量化值,确定目标预测系数,包括:根据所述第一帧的lsf参数、所述第二帧的lsf参数、所述第一帧的lsf参数量化值和所述第二帧的lsf参数量化值,确定所述预测系数码本中的每个预测系数对应的预测误差;确定最小的预测误差对应的预测系数为所述目标预测系数。在其中一个实施例中,所述根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中包括一个浊音帧,则采用预设的三级矢量码本对所述超帧模式中浊音帧的lsf参数进行量化,采用预设的一级矢量码本对所述超帧模式中清音帧的lsf参数进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧均为清音帧,则采用预设的一级矢量码本对所述超帧模式中清音帧的lsf参数进行量化。在其中一个实施例中,所述根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音参数为基音周期和清浊类型,则根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧均为清音帧,则将所述基音周期和清浊类型对应的比特位均量化为第二值。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧包括一个清音帧,则将所述清浊类型对应的比特位均量化为第二值,将所述超帧模式中浊音帧的基音周期进行对数转换,并根据转换结果和所述清浊类型确定目标量化值。在其中一个实施例中,所述根据转换结果和所述清浊类型确定目标量化值,包括:对所述转换结果进行均匀量化,获取均匀量化系数;根据所述均匀量化系数、所述清浊类型与预设的码本序号之间的对应关系,确定所述目标量化值。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中包括两个浊音帧,则将所述浊音帧的清浊类型对应的比特位量化为第二值,将所述清音帧的清浊类型对应的比特位量化为第一值;并采用预设的矢量码本对所述三个相邻的时间帧的基音周期进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧包括一个浊音帧,则根据预设的矢量码本获得n比特的码本序号;根据所述n比特的码本序号的前m比特的值对所述清浊类型进行量化,将所述n比特码本序号的低n-m比特确定为所述基音周期的量化值,其中,n和m均为正整数,且n大于m。一种语音参数量化装置,包括:获取模块,用于采用预设的参数分析方法获取语音信号的语音参数;确定模块,用于根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。上述语音参数量化方法、装置、计算机设备和存储介质,采用预设的参数分析方法获取语音信号的语音参数,根据语音信号的传输速率和语音参数,确定与语音参数对应的量化方法对语音参数进行量化,可以针对不同的传输速率和语音参数灵活设置不同的量化方法,适用于不同的场景中,满足用户的不同需求。附图说明图1为本申请一实施例提供的一种语音参数量化方法的流程图;图2为本申请另一实施例提供的一种语音参数量化方法的流程图;图3为本申请一实施例提供的一种语音参数量化装置的框图;图4为本申请另一实施例提供的一种语音参数量化装置的框图;图5为本申请另一实施例提供的一种语音参数量化装置的框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。声码器总体上可以分为编码器和解码器,编码器可以将8000hz、16bit均匀量化的音频信号转化为2400bps或1200bps的比特流用于信道传输,解码器从比特流中恢复出用于语音合成的参数合成音频信号,并输出8000hz、16bit的音频数据。本申请中以编码器为执行主体,重点描述编码器中的量化方案,解码过程为编码的逆过程。图1为本申请一实施例提供的一种语音参数量化方法的流程图,该方法的执行主体为编码器,如图1所示,该方法包括:步骤101、采用预设的参数分析方法获取语音信号的语音参数。其中,语音参数可以包括基音周期、子带的清浊类型、线性预测编码(linearpredictioncoding,lpc)参数、线谱对(linespectrumfrequency,lsf)参数、增益参数、傅里叶幅度参数等。在本实施例中,基于10阶线性滤波器进行lpc参数提取时,具体的,可以采用合成滤波器传递函数来提取lpc参数,其中,ai为lpc(线性预测)系数。经过lpc分析后,可以将lpc系数转化为lsf参数。可以采用归一化幅度差能量方法或者自相关函数和方法获取语音信号的基音周期,还可以对基音周期进行平滑处理,得到整数的基音周期。对于子带的清浊类型,可以将语音信号分成5个子带,在每个子带上单独计算浊音度,并进行清浊判决,得到清浊类型。对于每一帧输入的语音信号,按照不同的窗口位置可以计算两个增益值g1和g2,即为增益参数。还可以提取语音信号对应的余量谱中基因频率的前十个谐波的幅度值作为傅里叶幅度参数等。本申请中对于语音参数的获取方法不以此为限。步骤102、根据语音信号的传输速率和语音参数,确定与语音参数对应的量化方法对语音参数进行量化。其中,语音信号的传输速率通常为2400bps或1200bps,也可以为其它的速率,本申请并不以此为限。在本实施例中,可以根据实际需求,针对语音信号的不同传输速率、不同语音参数设置不同量化方法。例如,对于语音信号的传输速率为2400bps的lsf参数,可以采用3级码本进行量化;对于语音信号的传输速率为1200bps的lsf参数,还可以对语音信号的不同的超帧模式设置不同的量化方法;对于语音信号的传输速率为2400bps的基音周期,可以将基因周期和非周期标志进行连个量化;对于语音信号的传输速率为1200bps的基音周期,可以将基音周期和清浊类型进行联合量化等等。本申请实施例提供的语音参数量化方法,采用预设的参数分析方法获取语音信号的语音参数,根据语音信号的传输速率和语音参数,确定与语音参数对应的量化方法对语音参数进行量化,可以针对不同的传输速率和语音参数灵活设置不同的量化方法,适用于不同的场景中,满足用户的不同需求。下面重点介绍传输速率为2400bps时,基音周期的量化方法。在一个实施例中,根据语音信号的传输速率和语音参数,确定与语音参数对应的量化方法对语音参数进行量化,包括:若语音信号的传输速率为2400bps,且语音参数为基音周期,则根据语音信号的周期属性或传输语音信号的当前帧的清浊类型,对基音周期进行量化。在本实施例中,若语音信号的传输速率为2400bps,可以根据语音信号的周期属性或传输语音信号的当前帧的清浊类型,将语音信号的基因周期和非周期性标志进行联合量化,例如,使用8比特对基音周期进行量化编码,该量化值同时指示帧的清浊类型以及非周期标志。可选地,步骤“根据语音信号的周期属性或传输语音信号的当前帧的清浊类型,对基音周期进行量化”,包括:若当前帧为浊音帧,则对语音信号在当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化;若当前帧为清音帧,或者,语音信号的周期属性为非周期,则对语音信号的基音周期进行比特量化。在本实施例中,判断当前帧的清浊类型,若该当前帧为浊音帧,则可以对当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化。例如,如果当前帧为浊音帧,首先将浊音帧的基音周期转换成以10或2为底的对数,并进行254阶均匀量化,若基音周期范围为lg(20)~lg(144),则量化的结果是2~255之间的序号。若当前帧为清音帧,或者,语音信号的周期属性为非周期,则采用预设的量化值对语音信号的基音周期进行比特量化。可选地,若当前帧为清音帧,或者,语音信号的周期属性为非周期,则对语音信号的基音周期进行比特量化,包括:若当前帧为清音帧,则将语音信号的基音周期对应的比特位均量化为第一值;若语音信号的周期属性为非周期,则将语音信号的基音周期对应的比特位均量化为第二值。在本实施例中,第一值可以为1,第二值可以为0,或者,也可以是第一值为0,第二值为1,本申请实施例中主要以第一值为1、第二值为0来举例说明,但并不一次为限。例如,若使用8比特量化编码,若当前帧为清音帧,则将8个比特量化编码均设置为1;若当前帧为非周期标志为1,将8个比特量化编码均设置为0。本申请实施例中,当语音信号的传输速率为2400bps,对于基因周期量化时,将语音信号的基音周期和非周期性标志进行联合量化,基因周期的量化值不仅可以指示帧的清浊类型,还可以指示非周期标志,使得基音周期表示的范围更广,而且,上述方法的运算量较低。下面重点介绍传输速率为2400bps时,lsf参数的量化方法。在一个实施例中,根据语音信号的传输速率和语音参数,确定与语音参数对应的量化方法对语音参数进行量化,包括:若语音信号的传输速率为2400bps,且语音参数为线谱对lsf参数,则采用预设的三级矢量码本对lsf参数进行量化。在本实施例中,基于多级矢量量化(multi-stagevectorquantizer,msvq)方案,可以使用3级(7+6+6)矢量码本对lsf参数量化,其分别含有128、64、64个lsf码本矢量,量化后的结果为码本矢量索引,共占用19bits。具体的量化方法如下:首先将由lpc参数转化得到的lsf参数按照升序排列,并保证每相邻lsf参数的距离至少为50hz,得到排序后的lsf参数矢量f;然后在各矢量码本中按照如下公式所示的加权欧氏距离准则进行搜索:其中,'f为码本中的矢量,是3级码本的累加值。使得dlsp(f,'f)最小的'f所对应的码本矢量即是搜索的结果,也即,使得dlsp(f,'f)最小的'f所对应的码本矢量为lsf参数的量化结果。w(i)是加权系数,可以按照以下公式计算得到:其中,p(f(i))是预测滤波器在第i个线谱频率参数对应频率输出的功率谱密度。本申请实施例中,若语音信号的传输速率为2400bps,且语音参数为线谱对lsf参数,则采用预设的三级矢量码本对lsf参数进行量化,运算量比较小。下面重点介绍传输速率为2400bps时,增益量化方法。在本实施例中,每一帧需要量化两个增益g1和g2。g2使用5bits进行均匀量化,范围从10db到77db;g1的量化需要结合g2和pg2(pg2上一帧的g2),采用下述的自适应算法用3bits进行均匀量化:如果|g2-pg2|<5,且|g1-0.5(g2+pg2)|<3.0,则g1量化编码为3比特的0;否则,g1在(g_min,g_max)范围内进行3比特的7层均匀量化,量化的结果是1~7之间的序号。其中g_min和g_max按照下式计算,并限定在10到77范围内:g-min=min(g2,pg2)-6.0,g-max=max(g2,pg2)+6.0。下面重点介绍传输速率为2400bps时,清浊类型的量化方法。在本实施例中,子带的清浊类型可以使用5个子带的清浊(u/v)判决进行量化,每个子带用1比特表示清音或是浊音,例如,若该比特位为1表示为浊音,若该比特位为0表示为清音。5个子带共需要5比特来表示,但由于最低频段子带的清浊音是由基音周期的量化值判断的,因此只需要量化4个较高频段子带的清浊音,实际需要4比特。具体的量化的规则如下:如果最低频段子带的浊音度判决为清音,则当前帧为清音帧,此时4个较高频段子带的u/v判决全部量化为0;如果最低频段子带的浊音度判定为浊音,则当前帧为浊音帧,此时4个较高频段子带的u/v判决根据其浊音度vbpi进行,如果vbpi>0.6,则当前子带对应的比特量化为1浊音,否则量化为0清音;如果4个子带量化的结果为0001,则将其强制设为0000,即将最高频带强制认为是清音子带。下面重点介绍传输速率为2400bps时,傅里叶幅度的量化方法。在本实施例中,检测预测余量信号的前10次谐波的傅里叶幅度并量化,如果谐波数小于10,则将高次谐波谱幅度置1,拼成10维矢量进行量化。解码时将10次谐波以上部分的谱进行平坦化处理,谐波的归一化能量用1表示,即解码器得到的解码序列为对此10维谐波幅度矢量可以采用一个8比特的矢量码本进行量化,码本搜索采用全搜索算法,失真测度采用如下式所示的加权欧式距离准则:其中,a是码本中的矢量,w(i)是加权系数,w(i)由下式计算得出:其中,fi=8000i/60,是基音周期为60的第i次谐波对应的频率。表1为传输速率为2400bps的语音参数的量化结果示意,表2为语音帧的传输顺序示意。如表1和表2所示,每一帧包含48bit,其中1bit表示帧类型,表示当前语音帧是语音帧还是非语音帧,其余bits用来表示语音参数。表1表2上述实施例中,主要介绍了传输速率为2400bps时的语音参数量化方法,下面重点介绍传输速率为1200bps时的语音参数量化方法。在1200bps模式下,采用三帧联合量化方式,每一次量化60ms的超帧,输出72bit。表3为超帧模式示意,表4为5种超帧模式对应bit分配方式。如表3所示,可以根据3个子帧的清浊音类型,将超帧分为5种模式,其中,u代表清音帧,v代表浊音帧。表3表4在其中一个实施例中,根据语音信号的传输速率和语音参数,确定与语音参数对应的量化方法对语音参数进行量化,包括:若语音信号的传输速率为1200bps,则根据传输语音信号的时间帧的清浊类型确定语音信号的超帧模式;根据语音参数和超帧模式,确定与语音参数对应的量化方法对语音参数进行量化。在本实施例中,若语音信号的传输速率为1200bps,则可以如表3所示,根据时间帧的清浊类型将超帧分为5种模式,然后根据语音参数和超帧模式,确定每一个语音参数的量化方法。下面重点介绍语音信号的传输速率为1200bps时,lsf参数的量化方法。在一个实施例中,根据语音参数和超帧模式,确定与语音参数对应的量化方法对语音参数进行量化,包括:若语音参数为lsf参数,则根据超帧模式,采用预设的码本量化方法对lsf参数进行量化。可选地,根据超帧模式,采用预设的码本量化方法对lsf参数进行量化,包括:超帧模式包括三个相邻的时间帧,且三个相邻的时间帧中至少包括两个浊音帧,则采用预设的三级量化码本对当前超帧中第三帧的lsf参数进行量化,并根据前一超帧中第三帧的lsf参数量化值和当前超帧中第三帧的lsf参数量化值,对第一帧和第二帧的lsf参数进行量化,第三帧为超帧模式中时序上位于最后的时间帧。在本实施例中,若超帧模式为表3中的mode1模式和mode2模式,对第三帧的lsf参数使用7-6-6比特三级矢量码本进行量化,采用的方法和码本同2400bps的lsf量化相同。若超帧模式为mode3模式,则使用一个9比特一级矢量码本量化第三帧的lsf参数。对于第一、第二帧的lsf,则使用当前超帧中第三帧lsf的量化值和上一超帧中第三帧lsf的量化值,按照预测的方式进行量化。可选地,如图2所示,步骤“根据前一超帧中第三帧的lsf参数量化值和当前超帧中第三帧的lsf参数量化值,对第一帧和第二帧的lsf参数进行量化”,包括:步骤201、根据前一超帧中第三帧的lsf参数量化值和当前超帧中第三帧的lsf参数量化值,确定预测系数码本中的每个预测系数对应的第一帧的lsf参数量化值和第二帧的lsf参数量化值。在本实施例中,设'f3(i)为当前超帧中第三帧lsf的量化值,'fp(i)为前一超帧中第三帧lsf的量化值,则根据如下公式分别计算第一帧lsf参数的量化值和第二帧lsf参数的量化值其中,i=1,…,10,a1和a2是2比特预测码本中的预测系数。预测系数码本中共有4阶预测系数矢量,对每一个预测系数依次求得对应的和步骤202、根据第一帧的lsf参数、第二帧的lsf参数、第一帧的lsf参数量化值和第二帧的lsf参数量化值,确定目标预测系数。可选地,根据第一帧的lsf参数、第二帧的lsf参数、第一帧的lsf参数量化值和第二帧的lsf参数量化值,确定目标预测系数,包括:根据第一帧的lsf参数、第二帧的lsf参数、第一帧的lsf参数量化值和第二帧的lsf参数量化值,确定预测系数码本中的每个预测系数对应的预测误差;确定最小的预测误差对应的预测系数为目标预测系数。在本实施例中,根据第一帧的lsf参数f1(i)、第二帧的lsf参数f2(i)、第一帧的lsf参数量化值和第二帧的lsf参数量化值按照公式计算预测误差e,将预测误差e最小值所对应的预测系数确定为目标预测系数,则预测误差e最小值所对应的码本序号即为目标预测系数所在码本的量化结果。步骤203、根据目标预测系数确定残差矢量,并采用预设的二级矢量码本对残差矢量进行量化。在本实施例中,确定了标预测系数,即搜索得到最优的预测系数矢量后,根据公式和计算预测系数矢量对应的预测残差r1(i)和r2(i),其中,i=1,…,10。最后将r1(i)和r2(i)组合成为残差矢量r=[r1(1),…,r1(10),r2(1),…,r2(10)],使用8-6比特二级矢量码本进行矢量量化。可选地,如果是mode2模式,先使用7-6-6比特三级矢量码本量化第三帧的lsf参数,再上述预测方法量化第一、第二帧的lsf参数,与mode1模式不同的是,在搜索预测系数a1和a2时,mode2模式使用的是4比特16阶的预测码本,而mode1模式使用的是2比特4阶预测码本。可选地,如果是mode3模式,先使用一个9比特一级矢量码本量化第三帧的lsf参数,再使用上述预测方法量化第一、第二帧的lsf参数。预测的方法与mode1和mode2相同,预测系数a1和a2搜索使用的码本与mode1模式相同,但是预测残差量化使用的码本为8-6-6-6四级矢量码本。可选地,根据超帧模式,采用预设的码本量化方法对lsf参数进行量化,包括:超帧模式包括三个相邻的时间帧,且三个相邻的时间帧中包括一个浊音帧,则采用预设的三级矢量码本对超帧模式中浊音帧的lsf参数进行量化,采用预设的一级矢量码本对超帧模式中清音帧的lsf参数进行量化。在本实施例中,如果是mode4模式,则是对三帧的lsf参数直接量化,量化的结果按照帧顺序在比特流中依次传输。所使用的码本在浊音帧时为7-6-6比特三级矢量码本,清音帧时为9比特一级矢量码本。可选地,根据超帧模式,采用预设的码本量化方法对lsf参数进行量化,包括:超帧模式包括三个相邻的时间帧,且三个相邻的时间帧均为清音帧,则采用预设的一级矢量码本对超帧模式中清音帧的lsf参数进行量化。例如,如果是mode5模式,则可以使用9比特一级矢量码本对三帧的lsf参数依次量化。下面重点介绍语音信号的传输速率为1200bps时,基音周期和清浊类型的量化方法。在一个实施例中,根据语音参数和超帧模式,确定与语音参数对应的量化方法对语音参数进行量化,包括:若语音参数为基音周期和清浊类型,则根据超帧模式,采用预设的比特量化方法对基音周期和清浊类型进行量化。在本实施例中,若语音信号的传输速率为1200bps,若语音参数为基音周期和清浊类型,则可以根据表3中的不同的超帧模式选择不同的量化方法。表5为基音周期和清浊类型的量化结果示意,如表5所示,可以使用12bit对基音周期和清浊类型进行联合量化,其中9bit表示基音周期,3bit表示清浊类型。表5可选地,根据超帧模式,采用预设的比特量化方法对基音周期和清浊类型进行量化,包括:若超帧模式包括三个相邻的时间帧,且三个相邻的时间帧均为清音帧,则将基音周期和清浊类型对应的比特位均量化为第二值。例如,对于uuu模式的超帧,基音周期和清浊音类型直接量化为12比特的0。可选地,根据超帧模式,采用预设的比特量化方法对基音周期和清浊类型进行量化,包括:若超帧模式包括三个相邻的时间帧,且三个相邻的时间帧包括一个清音帧,则将清浊类型对应的比特位均量化为第二值,将超帧模式中浊音帧的基音周期进行对数转换,并根据转换结果和清浊类型确定目标量化值。进一步地,根据转换结果和清浊类型确定目标量化值,包括:对转换结果进行均匀量化,获取均匀量化系数;根据均匀量化系数、清浊类型与预设的码本序号之间的对应关系,确定目标量化值。在本实施例中,对于uuv、uvu、vuu三种超帧模式只含有1个浊音帧的类型,3比特清浊类型指示量化为000。对于基音周期,首先将其中浊音帧的基音周期转换成以10为底的对数,进行99阶均匀量化,范围为lg(20)~lg(144),量化的结果是1~99之间的序号;其次将均匀量化系数结合清浊音类型映射为512阶映射码本序号,作为最终的目标量化值。可选地,根据超帧模式,采用预设的比特量化方法对基音周期和清浊类型进行量化,包括:若超帧模式包括三个相邻的时间帧,且三个相邻的时间帧中包括两个浊音帧,则将浊音帧的清浊类型对应的比特位量化为第二值,将清音帧的清浊类型对应的比特位量化为第一值;并采用预设的矢量码本对三个相邻的时间帧的基音周期进行量化。在本实施例中,对于vvu、vuv、uvv三种超帧模式中包括两个浊音帧的类型,3比特清浊类型指示分别量化为001、010和100;三帧的基音周期依次组合成为一个三维的矢量,再使用一个512阶的码本进行量化。可选地,根据超帧模式,采用预设的比特量化方法对基音周期和清浊类型进行量化,包括:若超帧模式包括三个相邻的时间帧,且三个相邻的时间帧包括一个浊音帧,则根据预设的矢量码本获得n比特的码本序号;根据n比特的码本序号的前m比特的值对清浊类型进行量化,将n比特码本序号的低n-m比特确定为基音周期的量化值,其中,n和m均为正整数,且n大于m。在本实施例中,vvv的超帧类型较为特殊,首先使用一个12阶的码本搜索,得到11比特的码本序号;其次根据码本序号前2比特的值从00到11将清浊类型指示值分别映射为011、101、110和111,再将码本序号的低9比特作为基音周期的量化值。下面重点描述语音信号的传输速率为1200bps时,子带的清浊音判决量化方法。在本实施例中,表6为清浊音判决量化中帧模式对应的比特数分配示意,如表6所示,子带的清浊音判决量化的比特数依赖于超帧内浊音帧的个数,例如,vvv模式的超帧共有3个浊音帧,每帧分配2比特,共占用6比特;其它超帧模式的比特数计算方法相同。表6帧模式vvvvvu,vuv,uvvvuu,uvu,uuvuuu分配比特数6420由于1个浊音帧内共有5个子带,最低频段子带的清浊音判决可由解码器通过基音周期的量化值得出,而完整表示高频段4个子带的清浊音判决信息共4个比特16种类型,量化时需要映射到2比特4种类型。表7为清浊音判决量化映射的规则,表7中清浊音判决的4个比特依次表示从第2子带到第5子带的清浊音类型,为1表示浊音子带,0表示清音子带。经映射后只剩下四种u/v判决类型,量化时用2比特来表示。表7在一个实施例中,对于语音信号的传输速率为1200bps时的增益量化,超帧中的每一帧需要量化两个增益g1和g2,方法和2400bps模式的增益量化方法相同。3帧的g1和g2按帧顺序排列组成一个6维的增益矢量,再使用一个10比特一级矢量量化码本进行量化。下面重点描述语音信号的传输速率为1200bps时,傅里叶幅度的量化方法。在一个实施例中,如果超帧为uuu模式,即不含有浊音帧,则不量化传输傅立叶幅度。对于含有浊音帧的超帧,则从中选取一个浊音帧的傅立叶幅度进行量化,量化的方式和码本与2400bps模式的方式和码本相同;其它浊音帧的傅立叶幅度在解码时由量化值推导出。例如,设是当前超帧中第i帧的归一化傅立叶幅度分析结果,是前超帧中第i帧的归一化傅立叶幅度量化后的结果,是上一个超帧中最后一个浊音帧的量化结果,q[.]表示使用与2400bps相同的方法进行量化,则当前超帧的傅立叶幅度量化和推导规则如表8所示。表8下面重点描述语音信号的传输速率为1200bps时,非周期标志的量化方法。在一个实施例中,使用1比特量化超帧中3帧的非周期标志,首先根据最低频段子带的浊音度vbp1得出三帧的原始非周期标志,如果vbp1<0.5,则当前帧的原非周期标志量化为1,否则量化为0。其次根据超帧类型和原始非周期标志得出1比特的最终量化值,其量化规则如表9所示。表9对应的,解码时,3帧的非周期标志均从1比特的量化值推导出,解码规则如表10所示。表10应该理解的是,虽然图1-2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图3所示,提供了一种语音参数量化装置,包括:获取模块11和确定模块12,其中:获取模块11,用于采用预设的参数分析方法获取语音信号的语音参数;确定模块12,用于根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在一个实施例中,所述确定模块12具体用于若所述语音信号的传输速率为2400bps,且所述语音参数为基音周期,则根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化。在一个实施例中,如图4所示,所述确定模块12包括:第一量化子模块121,用于若所述当前帧为浊音帧,则对所述语音信号在所述当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化;第二量化子模块122,用于若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化。在一个实施例中,所述第二量化子模块122具体用于若所述当前帧为清音帧,则将所述语音信号的基音周期对应的比特位均量化为第一值;若所述语音信号的周期属性为非周期,则将所述语音信号的基音周期对应的比特位均量化为第二值。在一个实施例中,所述确定模块12具体用于若所述语音信号的传输速率为2400bps,且所述语音参数为线谱对lsf参数,则采用预设的三级矢量码本对所述lsf参数进行量化。在一个实施例中,如图5所示,所述确定模块12包括:第一确定子模块123,用于若所述语音信号的传输速率为1200bps,则根据传输所述语音信号的时间帧的清浊类型确定所述语音信号的超帧模式;第二确定子模块124,用于根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在一个实施例中,所述第二确定子模块124具体用于若所述语音参数为lsf参数,则根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化。在一个实施例中,所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中至少包括两个浊音帧,所述第二确定子模块124根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化,包括:所述第二确定子模块124采用预设的三级量化码本对当前超帧中第三帧的lsf参数进行量化,并根据前一超帧中第三帧的lsf参数量化值和所述当前超帧中第三帧的lsf参数量化值,对第一帧和第二帧的lsf参数进行量化,所述第三帧为所述超帧模式中时序上位于最后的时间帧。在一个实施例中,所述第二确定子模块124根据前一超帧中第三帧的lsf参数量化值和所述当前超帧中第三帧的lsf参数量化值,对第一帧和第二帧的lsf参数进行量化,包括:所述第二确定子模块124根据前一超帧中第三帧的lsf参数量化值和所述当前超帧中第三帧的lsf参数量化值,确定预测系数码本中的每个预测系数对应的第一帧的lsf参数量化值和第二帧的lsf参数量化值;根据所述第一帧的lsf参数、所述第二帧的lsf参数、所述第一帧的lsf参数量化值和所述第二帧的lsf参数量化值,确定目标预测系数;根据所述目标预测系数确定残差矢量,并采用预设的二级矢量码本对所述残差矢量进行量化。在一个实施例中,所述第二确定子模块124根据所述第一帧的lsf参数、所述第二帧的lsf参数、所述第一帧的lsf参数量化值和所述第二帧的lsf参数量化值,确定目标预测系数,包括:所述第二确定子模块124根据所述第一帧的lsf参数、所述第二帧的lsf参数、所述第一帧的lsf参数量化值和所述第二帧的lsf参数量化值,确定所述预测系数码本中的每个预测系数对应的预测误差;确定最小的预测误差对应的预测系数为所述目标预测系数。在一个实施例中,所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中包括一个浊音帧,所述第二确定子模块124根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化,包括:所述第二确定子模块124采用预设的三级矢量码本对所述超帧模式中浊音帧的lsf参数进行量化,采用预设的一级矢量码本对所述超帧模式中清音帧的lsf参数进行量化。在一个实施例中,所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧均为清音帧,所述第二确定子模块124根据所述超帧模式,采用预设的码本量化方法对所述lsf参数进行量化,包括:所述第二确定子模块124采用预设的一级矢量码本对所述超帧模式中清音帧的lsf参数进行量化。在一个实施例中,所述第二确定子模块124具体用于若所述语音参数为基音周期和清浊类型,则根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化。在一个实施例中,若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧均为清音帧,所述第二确定子模块124根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:所述第二确定子模块124用于将所述基音周期和清浊类型对应的比特位均量化为第二值。在一个实施例中,若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧包括一个清音帧,所述第二确定子模块124根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:所述第二确定子模块124将所述清浊类型对应的比特位均量化为第二值,将所述超帧模式中浊音帧的基音周期进行对数转换,并根据转换结果和所述清浊类型确定目标量化值。在一个实施例中,所述第二确定子模块124根据转换结果和所述清浊类型确定目标量化值,包括:所述第二确定子模块124对所述转换结果进行均匀量化,获取均匀量化系数;根据所述均匀量化系数、所述清浊类型与预设的码本序号之间的对应关系,确定所述目标量化值。在一个实施例中,若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中包括两个浊音帧,所述第二确定子模块124根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:所述第二确定子模块124将所述浊音帧的清浊类型对应的比特位量化为第二值,将所述清音帧的清浊类型对应的比特位量化为第一值;并采用预设的矢量码本对所述三个相邻的时间帧的基音周期进行量化。在一个实施例中,若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧包括一个浊音帧,所述第二确定子模块124根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:所述第二确定子模块124根据预设的矢量码本获得n比特的码本序号;根据所述n比特的码本序号的前m比特的值对所述清浊类型进行量化,将所述n比特码本序号的低n-m比特确定为所述基音周期的量化值,其中,n和m均为正整数,且n大于m。关于语音参数量化装置的具体限定可以参见上文中对于语音参数量化方法的限定,在此不再赘述。上述语音参数量化装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储语音参数数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音参数量化方法。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1