基于条件高斯混合模型的线谱对参数降维量化方法

文档序号：2829047阅读：376来源：国知局

专利名称：基于条件高斯混合模型的线谱对参数降维量化方法
技术领域：
本发明涉及一种参数量化方法，具体地说是一种基于条件高斯混合模型的线谱对参数降维量化方法。
背景技术：
LSP(线谱对)参数是语音编码中的一个重要参数，它对解码后的语音质量起着绝对性的作用，因此该参数的量化就显得十分重要。LSP参数的量化问题从上世纪70年代就是热点问题。其中研究的主要方向是对矢量量化器结构的改进，最初的量化器为分裂矢量量化器，它将LSP参数分裂成几个维数较小的子矢量，然后分别训练码书并量化。这种方法在当时具有突破性，它大大减小了计算复杂度，同时又保留了矢量量化的优点。对分裂矢量量化器的直接发展是Stephen So提出的转换分裂矢量量化器，该算法在量化前先将LSP参数分类，从而用更有针对性的码书量化已分类的序列。格型量化器也用于量化LSP参数，但由于格型量化器针对高斯分布具有较好的效果，LSP参数的分布不易确定。随着高斯混合模型逐渐被引入到语音的矢量量化中来，高斯混合模型与格型量化器结合的研究越来越被人关注。在诸多的研究方向中，LSP参数帧间相关性的挖掘也是一个热点。学者试图利用LSP参数间的这种冗余用更少的比特达到透明量化。

发明内容
本发明的目的在于提供一种训练简单、计算复杂度低的基于条件高斯混合模型的线谱对参数降维量化方法。本发明的目的是这样实现的基于条件高斯混合模型的线谱对参数降维量化方法包括以下步骤步骤(I):首先对采样后的语音信号分帧，提取语音信号的LSP特征参数，并进行特征参数降维；步骤(2):然后分裂特征参数序列得到子矢量；步骤(3):针对子矢量参数序列进行两两结合，建立联合序列；步骤(4):利用联合序列训练条件高斯混合模型，得到条件高斯混合模型的各种参数；步骤(5):利用条件高斯混合模型的均值向量和协方差矩阵等参数，计算条件概率密度，条件概率密度的个数等于高斯分量的个数；步骤￠):然后进行数据分组，将当前一帧数据归入条件概率密度值最大的那一个高斯分量所描述的分组中；步骤(7):将已分组的数据分别用LBG算法训练码书；步骤(8):最终得到的码书即为该语音信号的矢量量化结果。所述步骤(I)包括下列步骤
1)对米样后的语音信号分巾贞；2)每帧提取P阶LSP参数；3)将L帧语音组成一个超帧；4)利用压缩感知理论对该超帧形成的高维线谱对先进行降维处理，得到低维的测量值y，然后固定分配每个子矢量测量值个数。所述步骤(6)包括下列步骤I)分裂原始序列；将16维的LSP参数分裂成3维+3维+3维+3维+4维五个子矢量形式，分裂完毕得到数量均是545，522的子矢量；2)建立联合序列；设初始的LSP子矢量参数序列是X1, x2，…，xn，X为该参数序列的元素，每一个序列的维数都是3或4，将顺序出现的两个序列两两结合，也就是构成一个新的序列集合=X1Xy X2X3^…，χη-ιχη，以其中的XiX2为例，该序列为6或8维,X1构成了其中的前3或4维，X2构成了其中的后3或4维，且X2是当前子帧，X1是前一子帧，称新构建的序列为联合序列；3)训练联合GMM ;设定GMM的分量个数，设GMM由m个高斯分量构成，其中m = 4或m = 8, m为设定的高斯分量的数目，训练完毕,得到m个高斯分量权重,1X6或1X8的均值向量，6X6或8X8的协方差矩阵；4)数据分类；利用公式
权利要求
1.一种基于条件高斯混合模型的线谱对参数降维量化方法，其特征在于包括以下步骤步骤(I):首先对采样后的语音信号分帧，提取语音信号的LSP特征参数，并进行特征参数降维；步骤(2):然后分裂特征参数序列得到子矢量；步骤(3):针对子矢量参数序列进行两两结合，建立联合序列；步骤(4):利用联合序列训练条件高斯混合模型，得到条件高斯混合模型的各种参数；步骤(5):利用条件高斯混合模型的均值向量和协方差矩阵等参数，计算条件概率密度，条件概率密度的个数等于高斯分量的个数；步骤￠):然后进行数据分组，将当前一帧数据归入条件概率密度值最大的那一个高斯分量所描述的分组中；步骤(7):将已分组的数据分别用LBG算法训练码书；步骤(8):最终得到的码书即为该语音信号的矢量量化结果。
2.根据权利要求I所述的基于条件高斯混合模型的线谱对参数降维量化方法，其特征是所述步骤(I)包括下列步骤 1)对米样后的语音信号分巾贞; 2)每帧提取P阶LSP参数； 3)将L帧语音组成一个超帧； 4)利用压缩感知理论对该超帧形成的高维线谱对先进行降维处理，得到低维的测量值y，然后固定分配每个子矢量测量值个数。
3.根据权利要求2所述的基于条件高斯混合模型的线谱对参数降维量化方法，其特征是所述步骤(6)包括下列步骤 1)分裂原始序列；将16维的LSP参数分裂成3维+3维+3维+3维+4维五个子矢量形式，分裂完毕得到数量均是545，522的子矢量； 2)建立联合序列；设初始的LSP子矢量参数序列是X1,x2,---,Xn7X为该参数序列的元素，每一个序列的维数都是3或4，将顺序出现的两个序列两两结合，也就是构成一个新的序列集合=X1X2, X2X3,…，XlriXn,以其中的X1X2为例,该序列为6或8维,X1构成了其中的前3或4维，X2构成了其中的后3或4维，且X2是当前子帧，X1是前一子帧，称新构建的序列为联合序列； 3)训练联合GMM;设定GMM的分量个数，设GMM由m个高斯分量构成，其中m = 4或m=8, m为设定的高斯分量的数目，训练完毕，得到m个高斯分量权重，I X 6或I X 8的均值向量，6X6或8X8的协方差矩阵； 4)数据分类；利用公式
4.根据权利要求3所述的基于条件高斯混合模型的线谱对参数降维量化方法，其特征是所述步骤(4)包括下列步骤 1)求出各个高斯分量的参数，a,,MijCi, a ,是各高斯分量的权重,Mi和Ci分别是对应高斯密度函数的d维均值向量和dXd型协方差矩阵，i为高斯分量的序号；采用EM迭代算法，主要分为以下2个步骤 ①E步，即初始参数估计,利用训练数据求取一组初始参数0= [ a a 2--- a m, M1,M2,…Mni, C1，C2…C111]，可以令A = A =…== *，并使用K-均值方法计算群聚的中心点，以此作为M1, M2,…叱的初始值，a i是各高斯分量的权重，Mi和Ci分别是对应高斯密度函数的d维均值向量和dXd型协方差矩阵，i为高斯分量的序号； ②M步，即最大化，利用①E步得到的参数，根据最大似然准则重新估算模型参数，直到参数值达到预先设定的要求为止，新参数a /，M/，C/可用如下公式计算
5.根据权利要求4所述的基于条件高斯混合模型的线谱对参数降维量化方法，其特征是所述步骤(7)包括下列步骤 1)给定初始码书大小N，通过随机选择法或分裂法选定初始形心<4}，并设初始平均失真^—⑴，给定计算停止门限e，其中0< e <1; 2)围绕给定的码字，按照最近邻准则将训练序列X={Xl, x2,…，X1J，划分为N个不重叠的区域m为训练序列的维数，最近邻准则如下
全文摘要
本发明提供的是一种基于条件高斯混合模型的线谱对参数降维量化方法。具体步骤是首先对采样后的语音信号分帧，提取语音信号的LSP特征参数，进行特征参数降维；然后分裂特征参数序列得到子矢量；针对子矢量参数序列进行两两结合，建立联合序列；利用联合序列训练条件高斯混合模型，得到条件高斯混合模型的参数；利用条件高斯混合模型的均值向量和协方差矩阵等参数，计算条件概率密度，且其个数等于高斯分量的个数；然后进行数据分组，将当前一帧数据归入条件概率密度值最大的那一个高斯分量所描述的分组中；将已分组的数据分别用LBG算法训练码书；最终得到的码书为该语音信号的矢量量化结果。本发明提升了量化性能，训练简单、计算复杂度低。
文档编号G10L19/08GK102708871SQ201210140030
公开日2012年10月3日申请日期2012年5月8日优先权日2012年5月8日
发明者刘晴晴, 廖艳萍, 汤春明, 陈立伟申请人:哈尔滨工程大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈立伟;汤春明;廖艳萍;刘晴晴
技术所有人：哈尔滨工程大学
我是此专利的发明人

上一篇：通讯录人名的语言模型建立方法、语音搜索方法及其系统的制作方法
上一篇：实木碳纤维布复合音板的制作方法