一种选择预测矢量量化的迭代优化设计方法

文档序号：2831167阅读：190来源：国知局

专利名称：一种选择预测矢量量化的迭代优化设计方法
技术领域：
本发明涉及一种选择预测矢量量化的迭代优化设计方法，属于信源编码领域。
背景技术：
为了提高信源压缩程度，矢量量化己经被广泛应用于各种信源压縮编码算法。在各种压縮编码算法中，人们采用了不同的矢量量化结构，包括预测矢量量化、多级矢量量化、分裂矢量量化、分类矢量量化、增益形状矢量量化和格状矢量量化等。其中，预测矢量量化利用前面帧的参数乘以相应的预测系数得到对当前帧参数的预测值，将当前帧参数减去预测值得到预测残差，对预测残差进行量化。这种量化方法可以有效利用参数帧间相关性，提高参数量化效率，被广泛应用于语音、图像和视频编码算法。
常规的预测矢量量化采用固定的预测系数，没有考虑帧间相关性的差异。对帧间相关性强的情况，需要采用较大的预测系数。对帧间相关性弱的情况，需要采用较小的预测系数。为此，选择预测矢量量化提出采用多个预测矢量量化组合，每个组合对应一个预测系数和一个预测残差量化码本。对每一个输入数据，分别采用各个预测矢量量化组合进行量化编码，选择量化误差小的组合作为该输入数据的量化码本。
针对选择预测矢量量化设计，Jan Linden在1996年IEEE Nordic Signal Processing Symposium上发表的"Improving predictive vector quantizers in speech coding applications "、 Thomas Eriksson在1995年International Conference on Digital Signal Processing Vol. 1, pp.96-101上发表的"A safety-net approach for improved exploitation of speech correlations "、在1996年International Conference on Acoustics Speech and Signal Processing Vol. 2, pp.765-768 上发表的 "Exploiting interframe correlation in spectral quantization: a study of different memory VQ scheme"中提出一种预测矢量量化和不预测矢量量化结合的矢量量化结构，采用所有训练数据对不预测矢量量化进行码本设计，采用前后帧相关性强的训练数据对预测矢量量化进行码本设计。Mei Yong在1988年International Conference on Acoustics Speech and Signal Processing Vol. 1, pp.402-405 上发表的 "Encoding of LPC spectral parameters using switched-adaptive interframe vector prediction"中提出在予员领!l模式较少日寸米用前后帧相关系数与门限比较进行划分，在预测模式较多时通过预测系数量化分类进行划分，对分类的数据作为一个整体进行设计。Alan McCree在1998年 International Conference on Acoustics Speech and Signal Processing Vol. 2， pp.593-596上发表的"A 1.7kb/s MELP coder with improved analysis and quantization"中提出对各个预测器采用特定的训练数据进行训练，并对预测器和量化器迭代优化设计。Rodrigo C. de Lamare在2001年International Symposium on Signal Processing and its Applications Vol. 2, pp. 727-730上发表的 "Analysis of LSF switched-predictive vector quantizers"中对各种选择预领!j矢量量化进行了比较，在各种选择预测矢量量化设计过程中，提出利用前后帧参数的频谱距离大小来划分训练数据，对每一类训练数据进行预测器和量化器设计。高戈在2002年《计算机工程与应用》第10期发表的"语音谱参数的增强双预测多级矢量量化的码本设计方法"中也提出了一种选择预测矢量量化设计方法，也是根据参数前后帧间相关性进行训练数据划分。
以上这些选择预测矢量量化设计方法都是采用固定的训练数据划分，没有充分考虑这种划分的适当性。这些划分方法包括根据参数帧间相关性大小进行划分和根据前后帧参数频谱距离大小进行划分两类。

发明内容
本发明要解决的技术问题是针对现有技术存在的缺陷，克服固定训练数据划分的不足，充分考虑数据划分对选择预测矢量量化设计性能的影响，提出在常规选择预测矢量量化设计的基础上，对每一个训练数据在量化过程中根据其选择的预测和量化组合，对训练数据进行重新划分。通过训练数据划分和量化器设计的迭代，采用闭环的方法优化选择预测矢量量化设计性能。
本发明一种选择预测矢量量化的迭代优化设计方法，包括如下步骤
a. )输入训练参数，并设置训练参数模式数为M， M为自然数，下同；
b. )设输入训练参数维数为p，对每一个输入训练参数计算前后参数相关系数，第"个输入训练参数的第A维数据为^A^1,…,;7，第"个训练参数的前
后相关系数为
<formula>formula see original document page 4</formula>当 ;^4〈^i时，则将第w个训练参数划入第"莫式，其中 ;为设定的第z'模式
门限值，7;+1为设定的第/ + 1模式门限值，/为自然数，1，下同；
C.)对每个模式中的训练参数设计预测矢量量化器第/模式的预测系数
为《=|> ^ ,^^/|> ,^—wvw，其中w为第/模式中输入训练参数的数
目，vt^为第/模式第w个输入训练参数的加权值，对每个模式的输入训练参数
计算预测残差，第/模式中第"个输入训练参数的预测残差为
C = ~ —《x"一w ，对每个模式的预测残差分别经过LBG得到矢量量化码本，最后得到选择预测矢量量化器；
d. )将每一个输入训练参数采用步骤c设计的选择预测矢量量化器进行量化每个输入训练参数采用第Z'模式进行预测矢量量化后输出参数为 ;b =i—w + ^，其中i^为第"-1个训练参数第A:维数据的量化值，《t为第/模式的预测残差矢量量化值；
e. )计算每个训练参数对各个模式预测矢量量化的量化误差步骤d所述
的第/模式中的每个输入训练参数的量化误差为"'=1>^(~ -O2，其中， W^为第W个输入训练参数第A:维的加权值；
f. )当步骤e所述的第z'模式中的每个输入训练参数满足_/ = min{D'}，
则将该输入训练参数划入模式y，其中乂为自然数，取值范围为0^^M-1;
g. )判断步骤f是否存在输入参数模式改变，当模式不改变，结束码本设
计过程，输出码本；当模式改变，返回步骤C。
本发明提出的方法是在常规选择预测矢量量化设计的基础上，充分考虑数据划分和量化设计的相互关系，对两者进行闭环的迭代优化，能够有效改善码本设计质量，减小量化误差。同时，本发明提出的方法属于离线操作，不影响实时量化的复杂度。仿真表明，由本发明设计的选择预测矢量量化能减小参数量化失真，改善信号压縮质量。

图1:本发明流程图2:本发明采用选择预测矢量量化结构框图。
图3:本发明针对线谱对参数进行模式数目为2的选择预测多级矢量量化迭代优化设计的详细流程图。
具体实施例方式
本发明流程图如图1所示。本发明针对选择预测矢量量化，其结构框图如
图2所示。本发明选择预测矢量量化的迭代优化设计方法，针对语音编码中的
线谱对参数进行选择预测多级矢量量化，包括如下步骤
a. )输入语音信号，通过对语音信号分帧后采用线性预测分析得到输入线
谱对训练参数，包括如下步骤
1. )将输入语音信号划分为25ms的分帧信号，帧长为200点。分帧信号4")，"-l,…,200经过低通滤波器后进行加窗处理，窗为汉明窗，长度为200 占.
'、、、9
2. )将步骤1所述的加窗后的输入信号、(")，"-l,…,200计算自相关系
数r(/)
199
3. )对自相关系数KO采用Levinson-Durbin算法计算10阶线性预测系数^， / = 1，2,...，10;
4. )将步骤3所述的10阶线性预测系数0,.乘以0.卯《/=7，...,70对线性
预测系数进行共振峰带宽扩展；
5. )计算如下2个多项式的根，将10阶线性预测系数转换得到10阶线谱对参数
《0) = v40) + z-"^(z-1) F20) = j(>) —z-"j(z-!)
10
其中，J(z) = l-|>,^，乂(z)表示将线性预测系数",进行Z变换；
6 .)将步'骤5计算的线谱对参数减去线谱对均值得到第n帧第fc维的无
偏的线谱对参数X^，A^1，…,10;
将无偏的线谱对参数、,J-1,…，10作为输入信号，并设置信号模式数为
M， M为自然数，下同；
b. )采用步骤6所述的无偏线谱对参数\,,/1 = 1，一，10计算第"帧前后相关
系数4:
10 10
当7^4^乙时，则将所述的无偏线谱对参数《划入第/模式，其中 :为设定
的第"莫式门限值，7;+1为设定的第/ + 1模式门限值，/为自然数，0&、M-1，下同；
c.)将每个模式中的每个输入参数进行预测多级矢量量化第/模式的预
测系数为"i -Sw^^^/IXA-^^,其中W为第z'模式中输入参数数
目，1,为第,'模式第个输入参数的线谱对权值
0.64《,)03， "9 、03 h10
是第w个输入参数在y^处的线性预测逆滤波器幅度响应值；对每个模
式的输入参数计算预测残差，第/模式中第w个输入参数的预测残差为 -"i^w 。对每个模式的预测残差分别进行多级矢量量化码本设计。 d.)每个输入参数采用第/模式进行预测矢量量化后输出线谱对参数为 = " : tu +己，其中之^为第"-1个参数第H隹数据的量化值，/L为
—
第/模式的预测残差多级矢量量化值；
e.)步骤d所述的第f模式中的每个输入参数的量化误差为
O^Sw^U^-《t)2，其中，h^为第"个输入参数第^维的加权值；
f. )当步骤e所述的第z'模式中的每个输入参数满足_/ = min{Z)'}，则将
该输入参数划入模式J'，其中J'为自然数，取值范围为0《y《M-l;
g. )判断步骤f是否存在输入参数模式改变，当模式不改变，结束码本设计过程，输出经过更新过后的码本；当模式改变，返回步骤C。
本发明是通过以下技术方案实现的。首先，采用前后帧参数相关性大小或前后帧参数频谱距离大小划分训练数据。根据需要划分的总模式数目M设置门限进行划分。然后，对每一个模式，进行预测矢量量化设计。再次，在初始选择预测矢量量化设计的基础上，对每一个训练数据进行量化。在量化过程中，在M个量化结果中选择量化误差最小的预测器和量化器作为该训练数据的模式z'。如果该训练数据原先属于模式/，该训练数据保持其所属模式；如果该训练数据原先不属于模式/，该训练数据从原模式中去除，将其划入模式/。在所有训练数据量化完成后，如果所有的训练数据的模式没有变化，则选择预测矢量量化设计收敛；如果训练数据存在模式变化，则重新对受影响的各个模式的
预测器和量化器进行设计。最后，通过训练数据模式选择和预测矢量量化设计的迭代进行，优化码本设计，直到设计收敛。
如图3所示，本发明对线谱对参数采用选择预测矢量量化，选择模式数目为2，门限值为0.5。预测采用一级预测系数，预测残差采用4级矢量量化，各级量化比特数分别为7、 6、 6、 4。采用训练外的10个10秒汉语语音产生4000 个10维线谱对参数矢量作为测试数据，采用常规方法设计的码本和迭代优化方法设计的码本分别进行量化，按通用的线谱对谱失真方法计算量化频谱失真，两种方法得到的平均频谱失真分别为0.943、 0.921，谱失真介于2dB到4dB 之间帧的百分比分别为1.998%、 1.986%,均没有谱失真大于4dB的帧。这些数据说明，本发明中的选择预测矢量量化设计方法可以有效改进线谱对频谱失真。
权利要求
1. 一种选择预测矢量量化的迭代优化设计方法，其特征在于包括如下步骤a. )输入训练参数，并设置训练参数模式数为M，M为自然数，下同；b. )设输入训练参数维数为p，对每一个输入训练参数计算前后参数相关系数，第n个输入训练参数的第k维数据为xn，k，k＝1，…，p，第n个训练参数的前后相关系数为当Ti≤An<Ti+1时，则将第n个训练参数划入第i模式，其中Ti为设定的第i模式门限值，Ti+1为设定的第i+1模式门限值，i为自然数，0≤i≤M-1，下同；c. )对每个模式中的训练参数设计预测矢量量化器第i模式的预测系数为其中N为第i模式中输入训练参数的数目，wn，k为第i模式第n个输入训练参数的加权值，对每个模式的输入训练参数计算预测残差，第i模式中第n个输入训练参数的预测残差为对每个模式的预测残差分别经过LBG得到矢量量化码本，最后得到选择预测矢量量化器；d. )将每一个输入训练参数采用步骤c设计的选择预测矢量量化器进行量化每个输入训练参数采用第i模式进行预测矢量量化后输出参数为其中为第n-1个训练参数第k维数据的量化值，为第i模式的预测残差矢量量化值；e. )计算每个训练参数对各个模式预测矢量量化的量化误差步骤d所述的第i模式中的每个输入训练参数的量化误差为，其中，wn，k为第n个输入训练参数第k维的加权值；f. )当步骤e所述的第i模式中的每个输入训练参数满足则将该输入训练参数划入模式j，其中j为自然数，取值范围为0≤j≤M-1；g. )判断步骤f是否存在输入参数模式改变，当模式不改变，结束码本设计过程，输出码本；当模式改变，返回步骤c。
全文摘要
本发明公布了一种选择预测矢量量化的迭代优化设计方法，该方法利用常规的前后帧相关性划分训练数据，采用不同的训练数据进行各个预测系数计算和码本设计。然后，采用设计的预测系数和码本对训练数据进行量化，根据量化误差大小调整训练数据划分。通过训练数据划分和码本设计迭代，优化选择预测矢量量化码本设计。本发明改进了训练数据固定划分的缺点，可以有效提高选择预测矢量量化设计性能。本发明能减小参数量化失真，改善信号压缩质量。
文档编号G10L19/00GK101420230SQ20081023559
公开日2009年4月29日申请日期2008年12月1日优先权日2008年12月1日
发明者张雄伟, 亮敖, 霞邹申请人:中国人民解放军理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张雄伟;邹霞;敖亮
技术所有人：中国人民解放军理工大学
我是此专利的发明人

上一篇：分频带测量耳间相关度感知特性的方法及其装置的制作方法
上一篇：便携式圆头凤尾筝的制作方法