一种语音线性预测模型的非线性量化方法

文档序号:2826392阅读:542来源:国知局
一种语音线性预测模型的非线性量化方法
【专利摘要】本发明公开了一种语音线性预测模型的非线性量化方法,包括:线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;非线性去相关步骤:根据线谱频率参数差值的统计特性,采用结构化的方法,通过非线性变换将线谱频率参数差值去相关;计算边际概率分布步骤:利用去相关的线谱频率参数差值的统计特性,计算其边缘概率密度分布;标量量化器设计步骤:根据得到的边缘概率密度分布函数,设计基于概率密度函数的优化量化器。本发明所述语音线性预测模型的非线性量化方法,可以克服现有技术中时间复杂度高和使用效果差等缺陷,以实现时间复杂度低和使用效果好的优点。
【专利说明】一种语音线性预测模型的非线性量化方法
【技术领域】
[0001]本发明涉及语音编码【技术领域】,具体地,涉及一种语音线性预测模型的非线性量化方法。
【背景技术】
[0002]随着互联网技术的深入发展,语音通信技术得到了长足的进步,传输的语音信号已经由窄带信号传播演进到了宽带信号传播。伴随着多媒体应用的不断开发与推广,人们对于在语音通信技术中语音传输质量和实时性的要求越来越高,因此,研究高效可靠的语音通信算法,具有迫切的社会需求。
[0003]语音通信中要解决的首要问题是语音的编码。经过数十年的发展,语音编码技术大致可以分为三种方式:波形编码技术、基于参数模型的编码技术和混合编码技术。波形编码技术针对语音波形直接进行量化和传输,不基于声学模型。基于参数模型的编码技术将语音通过线性预测模型分析后,分别传输线性预测模型,边信息和语音能量信息。混合编码技术是上述两者的结合。一般来说,基于参数模型的编码技术是应用较为广泛,性能比较可靠的一类编码技术,其核心在于如何有效可靠的传输线性预测模型,即如何实现模型的有效量化和编码。
[0004]线性预测编码技术是语音编码处理中的核心技术。在语音线性预测编码模型的研究中,线谱频率参数是使用较多的一种表示方式,原因在于其频谱敏感区域的分布较为平均,即量化误差对于每一个频段的影响基本一样。早期的线谱频率参数量化研究集中在基于数据的量化器设计上,即获取大量的线谱频率参数并通过Lloyd-Max算法实现矢量量化器。由于数据量有限,此矢量量化器存在严重的过拟合问题。此外,由于矢量量化器的训练时间和量化中心匹配时间随着量化级数的增加呈指数增长,在高速率传输的时候,时间开销较大,复杂度较高。近年来,基于概率密度分布的优化量化吸引了学术界和工业界的大量关注,其原因在于这种方法可以在获得线谱频率参数概率密度分布函数的基础上计算出量化器的量化中心,从而避免了由于数据量有限带来的过拟合问题和训练时间过长的问题。此外,通过统计模型,可以将线谱频率参数之间的相关性去除,得到一组互相独立的参数。在去除记忆优势的基础上,标量量化器可以取代矢量量化其,使得量化中心匹配时间进一步缩短。
[0005]然而,传统的基于概率密度分布的优化量化方法主要基于高斯统计模型构建,无法很好的描述线谱频率参数的有界、有序的特性。针对这一问题,有学者提出了有界的高斯混合模型来描述线谱频率参数的上述特性,虽然取得了一些量化性能上的提高,却带来了时间复杂度太高的负面影响,总体效果不尽如人意。
[0006]在实现本发明的过程中,发明人发现现有技术中至少存在时间复杂度高和使用效
果差等缺陷。

【发明内容】
[0007]本发明的目的在于,针对上述问题,提出一种语音线性预测模型的非线性量化方法,以实现时间复杂度低和使用效果好的优点。[0008]为实现上述目的,本发明采用的技术方案是:一种语音线性预测模型的非线性量化方法,包括:
a、线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值;
b、非线性去相关步骤:根据线谱频率参数差值的统计特性,采用结构化的方法,通过非线性变换将线谱频率参数差值去相关;
C、计算边际概率分布步骤:利用去相关的线谱频率参数差值的统计特性,计算其边缘概率密度分布;
d、标量量化器设计步骤:根据得到的边缘概率密度分布函数,设计基于概率密度函数的优化量化器。
[0009]进一步地,在步骤a之前,还包括:
线性预测模型的线谱频率参数提取步骤:将线性预测模型通过Chebyshev多项式求根法转化为线谱频率参数。
[0010]进一步地,在步骤d之后,还包括:
优化的顺序量化步骤:对变换后的参数实现优化的顺序量化方式,达到控制差错传播的目的。
[0011]进一步地,所述对变换后的参数实现优化的顺序量化方式的操作,具体包括: 将步骤a中描述的去相关过程和步骤d中描述的基于概率密度函数的标量量化器相结
合,形成优化的顺序量化方法,实现有效的差错控制。
[0012]进一步地,所述将步骤a中描述的去相关过程和步骤d中描述的基于概率密度函数的标量量化器相结合,形成优化的顺序量化方法,实现有效的差错控制的操作,具体包括:
1)输入:
a)K + j维线谱频率参数差值向量S = [A ^ ,.,^ SM };
b)如步骤5得到的针对每一个的标量量化器;
2)初始化:
a)计数器I = I ;
3)执行£次循环,其中第I步循环操作:
a)当! = I时:
1.取出向量§中的第一个元素将其通过步骤5中描述的标量量化器量化,得到元素為放入向量文中;
b)当! f I时:1.取出向量中的第一个元素将
【权利要求】
1.一种语音线性预测模型的非线性量化方法,其特征在于,包括: a、线谱频率参数变换步骤:将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值; b、非线性去相关步骤:根据线谱频率参数差值的统计特性,采用结构化的方法,通过非线性变换将线谱频率参数差值去相关; C、计算边际概率分布步骤:利用去相关的线谱频率参数差值的统计特性,计算其边缘概率密度分布; d、标量量化器设计步骤:根据得到的边缘概率密度分布函数,设计基于概率密度函数的优化量化器。
2.根据权利要求1所述的语音线性预测模型的非线性量化方法,其特征在于,在步骤a之前,还包括: 线性预测模型的线谱频率参数提取步骤:将线性预测模型通过Chebyshev多项式求根法转化为线谱频率参数。
3.根据权利要求1或2所述的语音线性预测模型的非线性量化方法,其特征在于,在步骤d之后,还包括: 优化的顺序量化步骤:对变换后的参数实现优化的顺序量化方式,达到控制差错传播的目的。
4.根据权利要求3所述的语音线性预测模型的非线性量化方法,其特征在于,所述对变换后的参数实现优化的顺序量化方式的操作,具体包括: 将步骤a中描述的去相关过程和步骤d中描述的基于概率密度函数的标量量化器相结合,形成优化的顺序量化方法,实现有效的差错控制。
5.根据权利要求4所述的语音线性预测模型的非线性量化方法,其特征在于,所述将步骤a中描述的去相关过程和步骤d中描述的基于概率密度函数的标量量化器相结合,形成优化的顺序量化方法,实现有效的差错控制的操作,具体包括: .1)输入: a)11维线谱频率参数差值向星S”..,丨尤+1 ]; b)如步骤5得到的针对每一个的标量量化器; .2)初始化: a)计数器?=1; b)z 维目标向量i=[n..為]=[o,o,"”o]; .3)执行次循环,其中第i步循环操作: a)当? Z= I时: .1.取出向量g中的第一个元素将其通过步骤5中描述的标量量化器量化,得到元素4放入向量t中; b)当I客I时:i.取出向量中的第一个元素^ ,将:
6.根据权利要求1或2所述的语音线性预测模型的非线性量化方法,其特征在于,在步骤a中,所述将语音线性编码预测模型的线谱频率参数通过线性变换转化为线谱频率参数差值的操作,具体包括: 利用线谱频率参数的有序特性和有界特性,将其变换为线性谱参数差值,此差值的特征为:有序特性分布在(?λ?)开区间内,有序特性加和为I; 所述利用线谱频率参数的有序特性和有界特性,将其变换为线性谱参数差值的操作,具体包括: 1)f维线谱频率参数表示为
7.根据权利要求1或2所述的语音线性预测模型的非线性量化方法,其特征在于,在步骤b中,所述根据线谱频率参数差值的统计特性,采用结构化的方法,通过非线性变换将线谱频率参数差值去相关的操作,具体包括: 利用线谱频率参数差值的统计特性,假设其为中性向量;采用结构化的方法,通过归一化一取首元素的循环运算,将线谱频率参数差值之间的相关性去除,使参数之间统计上相互独立。
8.根据权利要求1或2所述的语音线性预测模型的非线性量化方法,其特征在于,所述采用结构化的方法,通过归一化一取首元素的循环运算,将线谱频率参数差值之间的相关性去除,使参数之间统计上相互独立的操作,具体包括: O输入: a) K+1维线谱频率参数差值向量
9.根据权利要求1或2所述的语音线性预测模型的非线性量化方法,其特征在于,在步骤c中,所述利用去相关的线谱频率参数差值的统计特性,计算其边缘概率密度分布的操作,具体包括: . 1)由步骤c得到的去相关后的线谱频率参数差值是有界的;根据此去相关后的线谱频率参数差值,针对每一个元素JT1, j =H,.训练基于贝塔分布的贝塔混合模型; .2)假设A服从单一贝塔分布,计算此贝塔分布,使得其与上述步骤I)中根据得到的
I贝塔混合模型之间的相对熵最小。
10.根据权利要求1或2所述的语音线性预测模型的非线性量化方法,其特征在于,在步骤d中,所述根据得到的边缘概率密度分布函数,设计基于概率密度函数的优化量化器的操作,具体包括: 采用标量量化的模式取代矢量量化,针对每一维参数设计基于贝塔分布的量化器;根据得到的概率密度分布函数计算出量化中心和量化区域,实现最优的标量量化器。
【文档编号】G10L19/035GK103632673SQ201310538591
【公开日】2014年3月12日 申请日期:2013年11月5日 优先权日:2013年11月5日
【发明者】马占宇, 肖波, 司中威, 郭军 申请人:无锡北邮感知技术产业研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1