一种基于m码字分裂的矢量量化码本生成方法

文档序号：2827256研发日期：2014年阅读：676来源：国知局

技术简介：
本发明针对传统LBG算法码本生成效率低、收敛慢的问题，提出基于M码字分裂的矢量量化码本生成方法。通过自适应选取分裂码字数（2/4/5），结合正交增量设计与码字补偿机制，在保持量化性能的同时显著缩短生成时间，提升码本初始化效率。
关键词：矢量量化码本生成,M码字分裂,正交增量

一种基于m码字分裂的矢量量化码本生成方法
【专利摘要】本发明公开了一种基于M码字分裂的矢量量化码本生成方法，该方法是在每次迭代前的码本初始化阶段，根据目标码本大小，自适应地选取分裂码字数为2、4或5，在一个码字分裂为4个或5个码字时，其中两对码字的增量部分具有正交特性，在一个码字分裂为5个码字时，原码字将保留在新码字中；在最后一次码字分裂前，若需要生成的新码字数量不足，则选取码本中的若干个码字使用二分法进行码字补偿，使最后一次分裂得到的总码字数达到目标码本大小。本发明在不改变码本量化性能的同时缩短了码本生成时间，适用于图像压缩、模式识别、视频编码等领域，特别适用于语音编码领域。
【专利说明】一种基于M码字分裂的矢量量化码本生成方法【技术领域】
[0001]本发明涉及码本生成方法研究领域，特别涉及一种基于M码字分裂的矢量量化码本生成方法。
【背景技术】
[0002]随着计算机和大规模集成电路的发展，数字信号的分析和处理已广泛应用于图像压缩、模式识别、语音编码、视频编码等领域。数字信号，特别是数字音频信号与数字图像信号，虽然具有抗干扰能力强、无噪声积累、便于加密等优点，但是在数字通信中由于其庞大的数据量也会导致高码率问题，影响传输速率的同时增加设备存储和处理负担。数据压缩成为解决此问题的关键技术。
[0003]量化是数据压缩的常用技术，量化方法可分为两种:标量量化和矢量量化。标量量化是指每次量化一个采样，所有采样采用特性相同的量化器，采样间量化彼此无关。矢量量化是把k个(k>2)标量数据构成k维空间Rk中的一个矢量，然后在矢量空间中进行整体量化。矢量量化属于一种有效的有损压缩技术，具有压缩比大、编解码简单等优点。
[0004]矢量量化的理论基础是Shannon的率失真定理，其基本原理是使用码本中与输入矢量之间失真误差最小码字的索引代替输入矢量进行存储或传输，在解码端进行简单的查表操作对矢量进行重构。矢量量化主要包括三大关键技术，即码本生成算法、码字搜索算法以及码字索引分配算法，其中最重要是码本生成算法，它是设计矢量量化器成功与否的关键。20世纪80年代初，Linde等人提出了 LBG(Linde-Buz0-Gray)算法，用于解决矢量量化器的码本生成问题。
[0005]传统LBG算法包括码本初始化和聚类迭代两个过程。算法使用二分法(即按2的幂)对码本进行分裂初始化，初始化后进入聚类迭代，每次迭代使用最小失真准则，对训练样本重新分类，使每次迭代后的平均失真度减小。它是一个由初始码本寻找最佳码本的过程。LBG算法简单且容易实施，现有的矢量量化算法绝大多数使用LBG算法生成矢量码本。但使用传统LBG算法生成码本存在两个问题:一是对初始码本的选取会影响码本性能以及算法的收敛速度。二是计算量大，码本生成时间长。

【发明内容】

[0006]本发明的主要目的在于克服现有技术的缺点与不足，提供一种基于M码字分裂的矢量量化码本生成方法，该方法克服了因迭代次数过多和收敛速度过慢导致的生成码本时效性不足问题，比常规的LBG矢量码本生成方法可以更快地生成码本，而不降低码本的量化性能。
[0007]本发明的目的通过以下技术方案实现:一种基于M码字分裂的矢量量化码本生成方法，对码本进行分裂初始化时，根据目标码本大小，自适应地选取分裂码字数为2、4或5，在一个码字分裂为4个或5个码字时，其中两对码字的增量部分具有正交特性，在一个码字分裂为5个码字时，原码字将保留在新码字中；在最后一次码字分裂前，若需要生成的新码字数量不足，则选取码本中的若干个码字使用二分法进行码字补偿，使最后一次分裂得到的总码字数达到目标码本大小。
[0008]具体包括以下步骤:
[0009](I)给定目标码本大小N、迭代计算停止门限Θ以及训练样本集，计算所有训练样本集的中心，将此中心作为第一个码字釘即初始码本；
[0010](2)根据目标码本大小N，确定各次分裂码字数M，总分裂次数I以及最后一次分裂前的码字补偿个数S ；
[0011](3)对码本进行M分裂初始化；
[0012](4)按最近邻原则对训练样本集进行量化分类，划分胞腔，根据得到的胞腔更新码字；
[0013](5)计算码本的平均失真度和相对失真度，判断相对失真度是否符合迭代计算停止门限Θ，如果是，进入步骤(6)，否则，重新进行步骤(4)；
[0014](6)判断当前码字数是否等于目标码本大小N，如果是，则结束退出；否则执行步骤(3)。
[0015]具体的，所述步骤(3)中，对码本进行分裂初始化，当一个码字X分裂为M个新码字Yi(i=l，…，M，M=2，4，5)时，第1、2个码字分布在原矢量方向上，而第3、4个码字的坐标点分布在与原矢量正交的一个平面上，且关于原始矢量点对称，设X1和X2分别为码字X的一对相邻的奇偶维分量，ε为分裂尺度控制系数,Yi为分裂的第i个码字，对码字的奇偶维分量在正交方向上进行分裂，则:
[0016]当M=2 时，Y1=X+Δ X，Y2=X-Δ X，其中 ΔΧ=(εχ” ε χ2)；
[0017]当Μ=4 时，Υ1>2=Χ± Δ X, Υ3，4=Χ 土 Δ ' X,其中 ΔΧ=(εχ”εχ2),Λ' Χ=(-εχ2，εΧι)，其中 ΛΧ.Λ' Χ=0，满足正交性;
[0018]当Μ=5时，X分裂为5个码字，除包含Μ=4所分裂的4个码字外，保留原码字作为第5个码字。
[0019]更进一步的，对于一个k维的矢量，当k为偶数时，通过相邻的奇偶维分量成对或隔位元素成对来构建码字分裂所需要的矢量增量ΛΧ和Λ ' X，使之满足ΛΧ.Λ ' Χ=0；如果k为奇数,则选出矢量ΔΧ中的绝对值最小的元素Axi，该元素不参加Δ' X构建的元素对配置，从而保证ΛΧ.Λ ' X=| AXi|2达到最小，使得ΛΧ和Λ' X接近正交。
[0020]更进一步的，当码本进行最后一次分裂前，若最后一次分裂前的码字补偿个数δ不等于0，则对码本进行码字补偿，码字补偿方法如下:设置另一分裂控制系数ε'，把码本中归属训练样本最多的S个码字进行二分，从而得到补偿码字，然后进入最后一次的分裂初始化。
[0021]优选的，所述第一个码字ylO为所有训练样本集的中心，作为固定码字始终保留在码本中，每次通过选取不同的矢量元素对进行正交分裂，M=2或者M=4时，由W代替分裂出的任意一个码字。W参与后续聚类迭代，但不参与迭代过程中的码字更新，通过选取不同的矢量元素对构建上述ΛΧ和Λ' X，使得W每次分裂出的新码字与前面分裂产生的码字不同。
[0022]优选的，所述步骤(4)中，按最近邻原则对训练样本集进行量化分类所使用平方失真度公式为:
[0023]
【权利要求】
1.一种基于M码字分裂的矢量量化码本生成方法，其特征在于，对码本进行分裂初始化时，根据目标码本大小，自适应地选取分裂码字数为2、4或5，在一个码字分裂为4个或5个码字时，其中两对码字的增量部分具有正交特性，在一个码字分裂为5个码字时，原码字将保留在新码字中；在最后一次码字分裂前，若需要生成的新码字数量不足，则选取码本中的若干个码字使用二分法进行码字补偿，使最后一次分裂得到的总码字数达到目标码本大小。
2.根据权利要求1所述的基于M码字分裂的矢量量化码本生成方法，其特征在于，包括以下步骤:(1)给定目标码本大小N、迭代计算停止门限Θ以及训练样本集，计算所有训练样本集的中心，将此中心作为第一个码字計，即初始码本；(2)根据目标码本大小N，确定总分裂次数I，各次分裂码字数M以及最后一次分裂前的码字补偿个数δ ；(3)对码本进行M分裂初始化；(4)按最近邻原则对训练样本集进行量化分类，划分胞腔，根据得到的胞腔更新码字；(5)计算码本的平均失真度和相对失真度，判断相对失真度是否符合迭代计算停止门限Θ，如果是，进入步骤(6)，否则，重新进行步骤(4)；(6)判断当前码字数是否等于目标码本大小N，如果是，则结束退出；否则执行步骤(3)。
3.根据权利要求2所述的基于M码字分裂的矢量量化码本生成方法，其特征在于，所述步骤(3)中，对码本进行分裂初始化，当一个码字X分裂为M个新码字Yi (i=l,…，M，M=2，4，5)时，第1、2个码字分布在原矢量方向上，而第3、4个码字的坐标点分布在与原矢量正交的一个平面上，且关于原始矢量点对称，设X1和X2分别为码字X的一对相邻的奇偶维分量，ε为分裂尺度控制系数,Yi为分裂的第i个码字，对码字的奇偶维分量在正交方向上进行分裂，则:
当 M=2 时，Y1=X+Λ X，Y2=X-AX,其中 ΔΧ=( ε X1, ε χ2)；
当 Μ=4 时,Υ1;2=Χ土 Δ X, Υ3，4=Χ± Δ ' X,其中 AX=Gx1, ε χ2) , Δ ' X= (- ε χ2, ε X1),其中ΛΧ.Λ' X=0，满足正交性；当Μ=5时，X分裂为5个码字，除包含Μ=4所分裂的4个码字外，保留原码字作为第5个码字。
4.根据权利要求3所述的基于M码字分裂的矢量量化码本生成方法，其特征在于，对于一个k维的矢量，当k为偶数时，通过相邻的奇偶维分量成对或隔位元素成对来构建码字分裂所需要的矢量增量ΛΧ和Λ ' X，使之满足ΛΧ.Λ' X=0;如果k为奇数，则选出矢量ΔΧ中的绝对值最小的元素Axi，该元素不参加Δ' X构建的元素对配置,从而保证ΛΧ.Λ' Χ=| ΛΧ?|2达到最小，使得ΛΧ和Λ ' X接近正交。
5.根据权利要求3所述的基于M码字分裂的矢量量化码本生成方法，其特征在于，当码本进行最后一次分裂前，若最后一次分裂前的码字补偿个数S不等于0，则对码本进行码字补偿，码字补偿方法如下:设置另一分裂控制系数ε'，把码本中归属训练样本最多的δ个码字进行二分，从而得到补偿码字，然后进入最后一次的分裂初始化。
6.根据权利要求2所述的基于M码字分裂的矢量量化码本生成方法，其特征在于，所述M为所有训练样本集的中心，作为固定码字始终保留在码本中，每次通过选取不同的矢量元素对进行正交分裂，M=2或者M=4时，由^代替分裂出的任意一个码字。
【文档编号】G10L19/038GK103794219SQ201410036779
【公开日】2014年5月14日申请日期:2014年1月24日优先权日:2014年1月24日
【发明者】贺前华, 何伟俊, 李嘉安娜申请人:华南理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贺前华;何伟俊;李嘉安娜
技术所有人：华南理工大学
我是此专利的发明人

上一篇：基于wifi实现音频接入的便携式卡拉ok装置制造方法
下一篇：一种组合型阵列式阻抗复合消声器的制造方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！