基于超帧模式的多矢量多码本尺寸联合优化方法

文档序号:2830879阅读:209来源:国知局

专利名称::基于超帧模式的多矢量多码本尺寸联合优化方法基于超帧模式的多矢量多码本尺寸联合优化方法
技术领域
基于超帧模式的多矢量多码本尺寸联合优化方法属于语音编码
技术领域
,特别涉及语音编码参数量化技术。
背景技术
:语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。目前国内外的研究主要集中在L2kb/s以下速率高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放、IP电话等。高质量低速率语音编码技术是语音信号处理领域中的重要研究课题之一。由于编码速率太低,必须采用多帧联合(即超帧)处理的参数语音编码技术。在超低速率语音编码算法中,编码参数通常进行基于超帧模式的多码本矢量量化,各编码参数的量化码本在不同超帧模式下具有相同的尺寸。原有方法的流程如图1所示,包括以下步骤-(1)根据语音编码算法分配给带通清浊音参数的量化比特数训练其量化码本;(2)根据带通清浊音参数的量化码本确定不同的编码超帧模式;(3)根据语音编码算法分配给基音周期参数,线谱频率参数、短时帧能量参数的量化比特数,分别训练各参数在不同超帧模式下的码本。不同的超帧模式下,各参数量化采用不同的量化码本,但是相同参数在不同超帧模式下码本尺寸相同。
发明内容本发明的目的是改进已有的多参数矢量量化技术,超低速率语音编码算法比特资源十分有限,而各个参数的量化精度都需要进一步的提高,原有方法并没有完全利用参数在不同超帧模式下统计特性的差异。为此,本文提出了一种基于超帧模式的多矢量多码本尺寸联合优化方法,对各编码参数在不同超帧模式下码本的尺寸进行联合优化,实验结果表明,该联合优化算法能够明显降低各参数的量化误差,提高声码器合成语音的质量。本发明提出的基于超帧模式的多矢量多码本尺寸联合优化方法,包括以下步骤步骤(1)根据语音编码算法中分配给带通清浊音参数矢量量化的比特数确定量化码本的尺寸M,M=2,同时用模拟退火算法训练得到带通清浊音参数的量化码本;步骤(2)根据带通清浊音矢量量化的码本将编码模式分为M种超帧模式;步骤(3)以Z&,-2+"p为准则,对不同超帧模式下基音周期矢量的码本尺寸初始值联合调整,即依据所述准则增大全浊音超帧模式下的基音周期码本尺寸,降低全清音或者清音子帧超过三帧的超帧模式下基音周期码本尺寸,^,表示第/个超帧模式下,基音周期矢量量化码本的尺寸,%、分别表示用于量化清浊音参数、基音周期矢量的比特数;步骤(4)以|;5>^,=2"*++"'为准则,在步骤(3)已调整好不同超帧模式下基音周期码/=1本尺寸的基础上,对不同超帧模式下线谱频率矢量的码本尺寸动态调整,即依据准则增大基音周期码本较小的超帧模式下的线谱频率参数码本尺寸,降低基音周期码本较大的超帧模式下线谱频率参数码本尺寸,其中&.表示第/个超帧模式下,线谱频率参数矢量最后一级的量化码本尺寸,w,表示用于量化线谱频率参数矢量最后一级的比特数;步骤(5)以|]&,&&,=2"'++"'+为准则,在步骤(4)已调整好基音周期和线谱频率参;=1数矢量码本尺寸的基础上,对不同超帧模式下短时帧能量矢量的码本尺寸动态调整,即依据准则增大基音周期与线谱频率参数码本较小的超帧模式下的短时帧能量参数码本尺寸,降低其他超帧模式下短时帧能量参数码本尺寸,其中&,表示第/个超帧模式下,短时帧能量矢量的码本尺寸,表示用于量化短时帧能量矢量的比特数;步骤(6)基于步骤(2)中得到的超帧模式及步骤(3)至步骤(5)中得到的此超帧模式下各参数码本尺寸,分别对基音周期、线谱频率参数、短时帧能量矢量训练码本。本发明的特点为在超低速率语音编码算法中进行基于超帧模式的多码本矢量量化,充分利用参数在不同超帧模式下统计特性的差异,例如在某种出现概率较大或比较重要的超帧模式下,可以增大某种参数的码本尺寸。以此例推,对各参数在不同超帧模式下码本的尺寸进行联合优化,从而提高了量化精度。将本文提出的这种基于超帧模式的多矢量多码本尺寸联合优化方法运用在一种基于MELP的300bps声码器上,实验结果表明,该联合优化算法能够明显降低各参数的量化误差,提高声码器合成语音的质量。图1为原有方法的基于超帧模式的多码本矢量量化算法流程框图。图2为本发明提出的基于超帧模式的多矢量多码本尺寸联合优化方法流程框图。具体实施方式本发明提出的基于超帧模式的多矢量多码本尺寸联合优化方法结合附图及实施例进一步说明如下本发明的方法流程如图2所示,包括以下步骤步骤(1)根据语音编码算法中分配给带通清浊音参数矢量量化的比特数^确定量化码本的尺寸M,M=2"N同时用模拟退火算法训练得到带通清浊音参数的量化码本;步骤(2)根据带通清浊音矢量量化的码本将编码模式分为M种超帧模式;步骤(3)以£&,=2"4+为准则,对不同超帧模式下基音周期矢量的码本尺寸初始值联合调整,即依据所述准则增大全浊音超帧模式下的基音周期码本尺寸,降低全清音或者清音子帧超过三帧的超帧模式下基音周期码本尺寸,、,表示第/个超帧模式下,基音周期矢量量化码本的尺寸,、分别表示用于量化清浊音参数、基音周期矢量的比特数;步骤(4)以|]&,5;,=2'"++"'为准则,在步骤(3)已调整好不同超帧模式下基音周期码Ml本尺寸的基础上,对不同超帧模式下线谱频率矢量的码本尺寸动态调整,即依据准则增大基音周期码本较小的超帧模式下的线谱频率参数码本尺寸,降低基音周期码本较大的超帧模式下线谱频率参数码本尺寸,其中&表示第/个超帧模式下,线谱频率参数矢量最后一级的量化码本尺寸,",表示用于量化线谱频率参数矢量最后一级的比特数;步骤(5)以l;&,&5;,=2""","'+为准则,在步骤(4)已调整好基音周期和线谱频率参'=1数矢量码本尺寸的基础上,对不同超帧模式下短时帧能量矢量的码本尺寸动态调整,即依据准则增大基音周期与线谱频率参数码本较小的超帧模式下的短时帧能量参数码本尺寸,降低其他超帧模式下短时帧能量参数码本尺寸,其中&,表示第/个超帧模式下,短时帧能量矢量的码本尺寸,"g表示用于量化短时帧能量矢量的比特数;步骤(6)基于步骤(2)中得到的超帧模式及步骤(3)至步骤(5)中得到的此超帧模式下各参数码本尺寸,分别对基音周期、线谱频率参数、短时帧能量矢量训练码本。上述方法步骤(1)的实施例为根据语音编码算法中分配给带通清浊音参数矢量量化的比特数确定量化码本的尺寸M,比特分配方案参考美国政府多带激励的线性预测(MELP)语音编码算法标准。在基于MELP的300bps声码器中,用于量化带通清浊音参数的比特数为4,M=2"*=16。同吋训练得到带通清浊音参数的量化码本,量化码本的训练方法参见杨行峻等人编著的《语音信号数字处理》中描述的模拟退火算法。上述方法步骤(2)的实施例为根据步骤(1)中训练得到的带通清浊音矢量量化的码本将编码模式分为M种超帧模式。清浊音矢量量化码字是通过对训练语音样本统计得到的出现次数最多的16种超帧清浊音矢量,每个码字代表了超帧的一种超帧模式,对应的超帧模式在表l中给出。表1带通清浊音参数矢量量化码本和对应的超帧模式<table>tableseeoriginaldocumentpage7</column></row><table>00000000000000000000000000000014111111111111111110001000000000151100010000000011100lll]l111116上述方法步骤(3)的实施例为基于超帧模式对基音周期的码本尺寸进行优化。此时准则为f;&,=2"',,其中=4、=8。由表1可见,超帧模式中含有全清音帧(0000000000,=100000000000000000000)和全浊音帧(111111111111111111111111111111)。清音帧的基音周期为固定值50;浊音帧的基音周期取值范围为[18,148],需要高效量化。清音帧越多的超帧模式其码本尺寸越小,动态调整的具体步骤如下a.设置各超帧模式下基音周期码本尺寸初值,Spl=Sp2=...=S一=256;b.将全清音超帧模式的码本尺寸縮减为1,对应码矢为(50,50,50,50,50,50);节省出来的码本尺寸增加到全浊音超帧模式上。c.将含清音帧超过3帧以上的超帧模式码本尺寸縮减一半,节省出来的码本尺寸增加到全浊音超帧模式上。得到16种超帧模式下基音周期参数各量化码本的尺寸如表2所示。表2基音周期参数(i3)各超帧模式(M)下码本尺寸<table>tableseeoriginaldocumentpage8</column></row><table>上述方法步骤(4)的实施例为在步骤(3)已确定不同超帧模式下基音周期的码本尺寸基础上,对线谱频率参数矢量进行码本尺寸动态调整。鉴于运算量和存储量的考虑,目前只对线谱频率参数多级矢量量化的最后一级采用了此方法。此时准则为|>p,&=2"'+"P+"',其中&也相应地表示线谱频率参数多级矢量量化最后一级的码本大小;w,=5相应地表示用于量化线谱频率参数多级矢量量化最后一级的比特数。首先,设定不同超帧模式下,线谱频率参数多级矢量量化最后一级的码本尺寸大小为2"',縮减基音周期码本尺寸较大的超帧模式下线谱频率参数最后一级的量化码本尺寸,增加到基音周期码本尺寸较小的超帧模式下线谱频率参数的量化码本尺寸。最终确定线谱频率参数最后一级量化码本的大小如表3所示。表3线谱频率参数最后一级(/)各超帧模式(7kf)下码本尺寸<table>tableseeoriginaldocumentpage8</column></row><table>上述方法步骤(5)的实施例为在已确定不同超帧模式下基音周期及线谱频率参数码本尺寸的基础上,调整短时帧能量矢量在各超帧模式下的码本尺寸。此时准则为,<formula>formulaseeoriginaldocumentpage9</formula>其中&,表示第z'个超帧模式下,短时帧能量矢量的码本尺寸<formula>formulaseeoriginaldocumentpage9</formula>,表示用于量化短时帧能量矢量的比特数。首先,设定不同超帧模式下短时帧能量参数码本尺寸大小都为2。縮减基音周期及线谱频率参数码本尺寸较大的超帧模式下短时帧能量参数的量化码本尺寸,增加到基音周期及线谱频率参数码本尺寸较小的超帧模式下短时帧能量参数的量化码本尺寸。得到16种超帧模式下短时帧能量参数各量化码本的尺寸如表4所示。表4短时帧能量参数(G)各超帧模式(M)下码本尺寸<table>tableseeoriginaldocumentpage9</column></row><table>上述方法步骤(3)至步骤(5),在理想情况下,依据准则<formula>formulaseeoriginaldocumentpage9</formula>,同<formula>formulaseeoriginaldocumentpage9</formula>时调整各超帧模式下基音周期、线谱频率参数、短时帧能量参数矢量的码本尺寸,将得到各参数在不同超帧模式下的最优的码本尺寸。但联合动态分配多个编码参数的码本尺寸难以实现,故而采用分步分项解决的方案。上述方法步骤(6)的实施例为根据步骤(2)中得到的超帧模式及步骤(3)至步骤(5)中得到的此超帧模式下的各参数码本尺寸,分别对基音周期、线谱频率参数、短时帧能量参数矢量重新训练码本。码本训练方法参见杨行峻等人编著的《语音信号数字处理》中描述的模拟退火算法。权利要求1.基于超帧模式的多矢量多码本尺寸联合优化方法,其特征在于,该方法在编码端依次按以下步骤实现步骤(1)根据语音编码算法中分配给带通清浊音参数矢量量化的比特数nb确定量化码本的尺寸M,M=2nb同时用模拟退火算法训练得到带通清浊音参数的量化码本;步骤(2)根据带通清浊音矢量量化的码本将编码模式分为M种超帧模式;步骤(3)以<math-cwu><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msub><mi>S</mi><mi>pi</mi></msub><mo>=</mo><msup><mn>2</mn><mrow><msub><mi>n</mi><mi>b</mi></msub><mo>+</mo><msub><mi>n</mi><mi>p</mi></msub></mrow></msup></mrow></math>]]></math-cwu><!--imgid="icf0001"file="S2008101051363C00012.gif"wi="23"he="9"top="97"left="49"img-content="drawing"img-format="tif"orientation="portrait"inline="no"/-->为准则,对不同超帧模式下基音周期矢量的码本尺寸初始值联合调整,即依据所述准则增大全浊音超帧模式下的基音周期码本尺寸,降低全清音或者清音子帧超过三帧的超帧模式下基音周期码本尺寸,Spi表示第i个超帧模式下,基音周期矢量量化码本的尺寸,nb、np分别表示用于量化清浊音参数、基音周期矢量的比特数;步骤(4)以<math-cwu><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msub><mi>S</mi><mi>pi</mi></msub><msub><mi>S</mi><mi>li</mi></msub><mo>=</mo><msup><mn>2</mn><mrow><msub><mi>n</mi><mi>b</mi></msub><mo>+</mo><msub><mi>n</mi><mi>p</mi></msub><mo>+</mo><msub><mi>n</mi><mi>l</mi></msub></mrow></msup></mrow></math>]]></math-cwu><!--imgid="icf0002"file="S2008101051363C00013.gif"wi="30"he="9"top="152"left="49"img-content="drawing"img-format="tif"orientation="portrait"inline="no"/-->为准则,在步骤(3)已调整好不同超帧模式下基音周期码本尺寸的基础上,对不同超帧模式下线谱频率矢量的码本尺寸动态调整,即依据准则增大基音周期码本较小的超帧模式下的线谱频率参数码本尺寸,降低基音周期码本较大的超帧模式下线谱频率参数码本尺寸,其中Sli表示第i个超帧模式下,线谱频率参数矢量最后一级的量化码本尺寸,nl表示用于量化线谱频率参数矢量最后一级的比特数;步骤(5)以<math-cwu><![CDATA[<math><mrow><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msub><mi>S</mi><mi>pi</mi></msub><msub><mi>S</mi><mi>li</mi></msub><msub><mi>S</mi><mi>gi</mi></msub><mo>=</mo><msup><mn>2</mn><mrow><msub><mi>n</mi><mi>b</mi></msub><mo>+</mo><msub><mi>n</mi><mi>p</mi></msub><mo>+</mo><msub><mi>n</mi><mi>l</mi></msub><mo>+</mo><msub><mi>n</mi><mi>g</mi></msub></mrow></msup></mrow></math>]]></math-cwu><!--imgid="icf0003"file="S2008101051363C00014.gif"wi="39"he="9"top="215"left="49"img-content="drawing"img-format="tif"orientation="portrait"inline="no"/-->为准则,在步骤(4)已调整好基音周期和线谱频率参数矢量码本尺寸的基础上,对不同超帧模式下短时帧能量矢量的码本尺寸动态调整,即依据准则增大基音周期与线谱频率参数码本较小的超帧模式下的短时帧能量参数码本尺寸,降低其他超帧模式下短时帧能量参数码本尺寸,其中Sgi表示第i个超帧模式下,短时帧能量矢量的码本尺寸,ng表示用于量化短时帧能量矢量的比特数;步骤(6)基于步骤(2)中得到的超帧模式及步骤(3)至步骤(5)中得到的此超帧模式下各参数码本尺寸,分别对基音周期、线谱频率参数、短时帧能量矢量训练码本。全文摘要基于超帧模式的多矢量多码本尺寸联合优化方法属于语音压缩编码
技术领域
,其特征在于,该方法首先根据带通清浊音参数分配的量化比特数训练其量化码本,并根据量化码本确定编码的超帧模式;根据基音周期参数、线谱频率参数、短时帧能量参数分配的量化比特数,联合分配各超帧模式下三者的码本尺寸;依据不同超帧模式下各参数的码本尺寸训练其对应的量化码本,对上述三个参数矢量分别进行矢量量化,该方法可提高上述参数量化精度,减小合成语音误差,增强清晰度,最适合低速率语音编码。文档编号G10L19/00GK101261835SQ20081010513公开日2008年9月10日申请日期2008年4月25日优先权日2008年4月25日发明者昆唐,崔慧娟,晔李,明许申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1