0.6kb/s声码器能量参数增益形状量化的联合搜索方法

文档序号:2837109阅读:583来源:国知局

专利名称::0.6kb/s声码器能量参数增益形状量化的联合搜索方法
技术领域
:本发明属于语音编码
技术领域
,特别涉及低速率参数语音编码技术。
背景技术
:语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。近些年来国际电信联盟(ITU)、一些区域组织和一些国家相继制定了一系列语音压缩编码标准,在编码速率为1.2kb/s到16kb/s上得到了令人满意的语音质量。目前国内外的研究主要集中在1.2kb/s速率以下高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放等。0.6kb/s声码器算法是其中的热点,本发明提出了一种针对0.6kb/s声码器算法中能量参数增益形状联合量化的联合搜索算法,能够降低能量参数的量化误差,提高合成语音的质量。
发明内容本发明的目的在于提供一种能够降低能量参数的量化误差,提高600b/s声码器合成语音质量的能量参数增益形状量化的联合搜索方法。本发明的特征在于,该方法是在数字集成电路中依次按以下步骤实现的步骤(1)对输入语音信号样点按设定的时间间隔顺序分帧;其中所述的语音信号样点是已按照设定频率采样且经过高通滤波去除工频干扰后的信号样点;步骤(2)把步骤(1)中经过分帧而得到的子帧每相邻三个子帧一组地组成超帧,分别按照下式求取当前超帧内各子帧的能量参数gn,ign,i=log1Li&Sigma;Lis(n)2]]>其中,n代表当前超帧序号,i代表当前超帧内第i个子帧的序号,i=1,2,3,Li是第i子帧求取能量参数的窗口长度,s(n)是所述Li内的语音信号;步骤(3)按下式求取当前超帧内各子帧能量参数的平均值gng&OverBar;n=13&Sigma;i=13gn,i;]]>步骤(4)将(3)中求取的能量参数的平均值gn按下式进行均匀标量量化,其标量量化的取值范围是10dB~77dB之间,使用5比特,从而得到标量量化索引值,用l表示表示向下取整;步骤(5)以步骤(4)得到的索引值l为中心,按照下式确定一个标量量化候选索引区间ψψ=[l-2,l+2];步骤(6)对步骤(5)的得到候选索引区间内的每一个索引值lm分别求取其反标量量化后的值gn,lm^=77-1032lm+10,]]>lm是属于索引区间ψ的值;步骤(7)将步骤(2)得到的当前超帧各子帧能量参数gn,i分别除以步骤(6)中求取的值得到归一化后的新矢量(gn,1′,gn,2′,gn,3′),其中gn,1&prime;=gn,1/gn,lm^;]]>步骤(8)用设定的矢量量化码本对步骤(7)中求取的矢量进行矢量量化,矢量量化采用全搜索的方法,在矢量量化码本中找到使误差Elm,k=&Sigma;i=13(gn,i-gn,lm^*gk,i&prime;&prime;)2]]>最小的索引值k=argminkElm,k,]]>gk,i″代表设定的量化码本中索引为k的三维码字矢量的第i个分量,i=1,2,3;步骤(9)对候选索引区间ψ内的所有lm值进行(7)、(8)两式的计算,找到使Elm,k最小的lm与k,作为能量参数最终的量化结果。本发明的特点是对能量参数的增益形状联合量化方法采用了联合搜索的方法。原有的技术并没有采用联合搜索算法,而是采用逐步搜索,不能有效降低能量参数的量化误差。本发明采用增益形状联合量化的联合搜索方法,能够进一步降低能量参数的量化误差1%左右。本方法可以降低能量参数的量化误差,提高合成语音的自然度。该方法最适合600b/s低速率参数语音编码,将在信号处理器芯片DSP上实现。图1为本发明提出的0.6kb/s声码器能量参数增益形状联合量化的联合搜索方法流程框图。具体实施例方式本发明提出的0.6kb/s声码器能量参数增益形状联合量化的联合搜索方法结合附图及实施例进一步说明如下本发明的方法流程如图1所示,包括以下步骤步骤(1)对输入语音信号样点按设定的时间间隔顺序分帧;其中所述的语音信号样点是已按照设定频率采样且经过高通滤波去除工频干扰后的信号样点;步骤(2)把步骤(1)中经过分帧而得到的子帧每相邻三个子帧一组地组成超帧,分别按照下式求取当前超帧内各子帧的能量参数gn,ign,i=log1Li&Sigma;Lis(n)2]]>其中,n代表当前超帧序号,i代表当前超帧内第i个子帧的序号,i=1,2,3,Li是第i子帧求取能量参数的窗口长度,s(n)是所述Li内的语音信号;步骤(3)按下式求取当前超帧内各子帧能量参数的平均值gng&OverBar;n=13&Sigma;i=13gn,i;]]>步骤(4)将(3)中求取的能量参数的平均值gn按下式进行均匀标量量化,其标量量化的取值范围是10dB~77dB之间,使用5比特,从而得到标量量化索引值,用l表示表示向下取整;步骤(5)以步骤(4)得到的索引值l为中心,按照下式确定一个标量量化候选索引区间ψψ=[l-2,l+2];步骤(6)对步骤(5)的得到候选索引区间内的每一个索引值lm分别求取其反标量量化后的值gn,lm^=77-1032lm+10,]]>lm是属于索引区间ψ的值;步骤(7)将步骤(2)得到的当前超帧各子帧能量参数gn,i分别除以步骤(6)中求取的值得到归一化后的新矢量(gn,1′,gn,2′,gn,3′),其中gn,1&prime;=gn,1/gn,lm^;]]>步骤(8)用设定的矢量量化码本对步骤(7)中求取的矢量进行矢量量化,矢量量化采用全搜索的方法,在矢量量化码本中找到使误差Elm,k=&Sigma;i=13(gn,i-gn,lm^*gk,i&prime;&prime;)2]]>最小的索引值k=argminkElm,k,]]>gk,i″代表设定的量化码本中索引为k的三维码字矢量的第i个分量,i=1,2,3;步骤(9)对候选索引区间ψ内的所有lm值进行(7)、(8)两式的计算,找到使Elm,k最小的lm与k,作为能量参数最终的量化结果。本发明上述方法各步骤的具体实施例分别详细说明如下上述方法步骤(1)对输入语音信号样点按时间顺序分帧的实施例是按8kHz频率采样、已经过高通滤波去除工频干扰的语音样点。每25ms,也就是200个语音样点构成一个子帧;上述方法步骤(2)的实施例为对三个语音帧组成的超帧的每一帧按如下公式提取增益参数gn,ign,i=log1Li&Sigma;Lis(n)2]]>其中,n为当前超帧的序号,i为当前超帧第i个子帧的序号,L是窗口的长度,设为当前子帧长200个样点,s(n)即是前述的8kHz频率采样、已经过高通滤波去除工频干扰的语音信号。上述方法步骤(3)的实施例为按照下式求取当前超帧的平均能量gng&OverBar;n=(&Sigma;i=13gn,i)/3]]>上述方法步骤(4)的实施例为将gn进行均匀标量量化,为了提高量化性能,将其量化取值范围限制在10dB~77dB之间,上溢和下溢采用限幅处理,此参数用5比特表示,量化索引值由下式得到其中为取整符号。上述方法步骤(5)中的实施例为以步骤(4)中求取的值l为中心选定一个索引候选区间ψ,其中ψ=[l-2,l+2]上述方法步骤(6)的实施例为对区间ψ内的索引值lm进行反标量量化,求取反量化后的值为由下式得到gn,lm^=77-1032lm+10]]>上述方法步骤(7)的实施例为将当前超帧在步骤(2)中求得的各帧的能量参数除以步骤(6)中的得到归一化后的新矢量(gn,1′,gn,2′,gn,3′),其中gn,i&prime;=gn,i/g^n,lm]]>上述方法步骤(8)的实施例为对步骤(7)中求取的归一化矢量进行矢量量化,矢量量化的码本如下表所示<tablesid="table1"num="001"><tablewidth="856">量化索引值k码字矢量gk″00.770791,0.856724,1.37381710.726911,1.055533,1.21795721.216932,0.911708,0.87327930.881003,1.042607,1.07691741.159534,1.037779,0.80336651.061736,1.003369,0.93554860.939219,0.911485,1.14909970.998837,0.999830,1.002373</table></tables>矢量量化的搜索准则是使误差Elm,k最小,其中Elm,k按下式计算Elm,k=&Sigma;i=13(gn,i-gn,lm^*gk,i&prime;&prime;)2]]>其中,gk,i″代表量化码本中索引为k的矢量的第i个分量,k=1...8,i=1...3;;上述方法步骤(9)的实施例为对候选索引区间ψ内的所有值进行步骤(7)、(8)的计算,找到使Elm,k最小的lm与k,作为能量参数最终的量化结果。权利要求1.0.6kb/s声码器能量参数增益形状联合量化的联合搜索方法,其特征在于,该方法是在数字集成电路中依次按以下步骤实现的步骤(1)对输入语音信号样点按设定的时间间隔顺序分帧;其中所述的语音信号样点是已按照设定频率采样且经过高通滤波去除工频干扰后的信号样点;步骤(2)把步骤(1)中经过分帧而得到的子帧每相邻三个子帧一组地组成超帧,分别按照下式求取当前超帧内各子帧的能量参数gn.ign.i=log1Li&Sigma;Lis(n)2]]>其中,n代表当前超帧序号,i代表当前超帧内第i个子帧的序号,i=1,2,3,Li是第i子帧求取能量参数的窗口长度,s(n)是所述Li内的语音信号;步骤(3)按下式求取当前超帧内各子帧能量参数的平均值gng&OverBar;n=13&Sigma;i=13gn,i;]]>步骤(4)将(3)中求取的能量参数的平均值gn按下式进行均匀标量量化,其标量量化的取值范围是10dB~77dB之间,使用5比特,从而得到标量量化索引值,用l表示表示向下取整;步骤(5)以步骤(4)得到的索引值l为中心,按照下式确定一个标量量化候选索引区间ψψ=[l-2,l+2];步骤(6)对步骤(5)的得到候选索引区间内的每一个索引值lm分别求取其反标量量化后的值gn,lm^=77-1032lm+10,]]>lm是属于索引区间ψ的值;步骤(7)将步骤(2)得到的当前超帧各子帧能量参数gn.i分别除以步骤(6)中求取的值得到归一化后的新矢量(gn,1′,gn,2′,gn,3′),其中gn,1&prime;=gn,1/gn,lm^;]]>步骤(8)用设定的矢量量化码本对步骤(7)中求取的矢量进行矢量量化,矢量量化采用全搜索的方法,在矢量量化码本中找到使误差Elm,k=&Sigma;i=13(gn,i-gn,lm^*gk,i&prime;&prime;)2]]>最小的索引值k=argminElm,k,kgk,i&prime;&prime;]]>代表设定的量化码本中索引为k的三维码字矢量的第i个分量,i=1,2,3;步骤(9)对候选索引区间ψ内的所有lm值进行(7)、(8)两式的计算,找到使Elm,k最小的lm与k,作为能量参数最终的量化结果。2.按权利要求1所述的0.6kb/s声码器能量参数增益形状联合量化的联合搜索方法,其特征在于,所述超帧内的子帧数大于等于2。3.按权利要求2所述的0.6kb/s声码器能量参数增益形状联合量化的联合搜索方法,其特征在于,步骤(5)中以初始求取的均匀量化后的索引值为中心来选取一个候选区间ψ。全文摘要本发明属于低速率语音压缩编码
技术领域
,其特征在于,在求取了连续三个语音帧的能量参数后,求取其能量平均值,并对该平均值进行均匀标量量化得到量化索引。以得到的量化索引为中心确定一个候选区间,并将此候选区间内的值进行反标量量化,用反标量量化后的值对连续三帧的能量参数进行归一化得到归一化矢量,进行矢量量化。对候选区内的所有值进行上述运算,找到量化误差最小的区间值与码本索引。这种方法可以降低能量参数的量化误差,提高合成语音的自然度。该方法适合低速率参数语音编码。文档编号G10L19/00GK101030376SQ20071006540公开日2007年9月5日申请日期2007年4月13日优先权日2007年4月13日发明者崔慧娟,唐昆,李晔,洪侃申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1