一种线性预测分析方法、装置及系统的制作方法

文档序号:2833608阅读:218来源:国知局
专利名称:一种线性预测分析方法、装置及系统的制作方法
技术领域
本发明涉及通信领域,尤其涉及一种线性预测分析方法、装置及系统。
背景技术
为节省语音与音频信号传输和存储的带宽,相应的语音与音频编码技术得到了广泛的应用,目前主要分为有损编码和无损编码,有损编码的重建信号与原始信号并不能保持完全一致,但可以根据声源特点及人的感知特点最大程度上减少信号的冗余信息。无损编码则必须保证重建信号与原始信号完全一致,可以使得最后的解码质量没有任何损伤,一般来讲有损编码压缩率比较高,但重建语音质量没有保证,无1损编码可以保证语音质量,但压缩率较低,大约50%左右。无论在有损编码或无损编码中,线性预测编码(LPC, Linear Prediction Coding)模型被广泛地应用在语音编码领域中,在有损编码中码激励线性预测编码模型是其典型应·用的成功。基本原理为先利用短时线性预测去除语音信号的近样点冗余度,再用长时预测器去除语音信号的远样点冗余度,最后对预测过程中产生的参数以及经过两级预测得到的残差信号进行编码传输。目前大多数有损和无损音频编解码的线性预测分析一般包括加窗、求自相关和Levinson算法求解三个模块,通过线性预测来得到残差信号,再用熵编码对残差信号进行编码来实现音频压缩。在实现上述线性预测编码的过程中,发明人发现现有技术中至少存在以下问题加窗时采用固定窗函数,会使得线性预测性能达不到最优;或者,对输入信号分别进行两次线性预测分析,一次给信号加短窗,另一次给信号加长窗,会因为对输入信号进行了两次线性预测分析,使得线性预测分析的复杂度较大。

发明内容
本发明的实施例提供一种线性预测分析方法、装置及系统,能够提高线性预测性能,降低分析运算复杂度。一种线性预测分析方法,包括获取输入信号的第一个样点的幅值和最后一个样点的幅值,所述输入信号包含N个样点,N为正整数;对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号;对加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明实施例提供的线性预测分析方法,通过获取输入信号的第一个样点和最后一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。一种线性预测分析方法,包括
一种线性预测分析方法,其特征在于,包括获取输入信号编码方式,所述输入信号为G. 711信号;对输入信号进行转换,得到PCM信号;对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗,得到加窗后信号;
对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明实施例提供的线性预测分析方法,通过对输入信号编码方式进行分析,根据该信号编码方式对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本发明实施例提供的线性预测分析方法的流程框图;图2为本发明实施例一提供的线性预测分析方法的流程框图;图3为本发明实施例二提供的线性预测分析方法的流程框图;图4为本发明实施例三提供的线性预测分析方法的流程框图;图5为本发明实施例四提供的线性预测分析方法的流程框图;图6为本发明实施例五提供的线性预测分析方法的流程框图;图7为本发明实施例六提供的线性预测分析方法的流程框图;图8为本发明实施例七提供的线性预测分析方法的流程框图;图9为本发明实施例提供的线性预测分析装置的结构框图;图10为本发明另一实施例提供的线性预测分析装置的结构框图;图11为本发明实施例提供的线性预测编码系统的构造框图;图12为本发明另一实施例提供的线性预测编码系统的构造框图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明的实施例提供一种线性预测分析方法、装置及系统,能够提高线性预测性能,降低分析运算复杂度。下面结合附图对本发明实施例进行详细描述。本发明实施例提供的线性预测分析方法,如图I所示,该方法的步骤包括S101、获取输入信号至少一个样点的信号特性信息;S102、对信号特性信息进行比较分析,得到分析结果;
S103、根据分析结果选择窗函数对输入信号进行自适应加窗,得到加窗后信号;S104、对加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明实施例提供的线性预测分析方法,通过对输入信号进行分析,得到结果,并根据分析结果自适应分配加窗所需的窗函数,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。其中,信号特性信息包括幅值、能量、过零率、信号类型、帧长、编码方式中的任意一个或任意多个。下面通过具体实施例加以说明。实施例一
本发明实施例一提供的线性预测分析方法,如图2所示,该方法步骤包括S201、获取输入信号的第一个样点的幅值|x
I和最后一个样点的幅值x[N_l] |,其中,x[i],i = 0,1,... ,N-I为输入信号,N为输入信号的样点个数(如40、80、
160、240、320等);输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80、160、240、320等);S202、对样点幅值|x[O] |和|x[N_l] |进行分析,并根据分析结果对输入信号进行自适应加窗如当输入样点数为40时如果输入信号的第一个样点的幅值|x
I小于某个预先设定阈值thr (如thr =128),则对窗函数的最前面4个点设置为w(η) = O. 23+0. 77 · cos (2 · π · (31—8 · η)/127), η = O, I, 2, 3否则对窗函数的最前面4个点设置为w(η) = O. 26+0. 74 · cos (2 · π · (31—8 · η)/127), η = O, I, 2, 3对窗函数第5至第36个点都设为1,即w(η) = I, η = 4, . . , 35如果输入信号的最后一个样点的幅值|x[39] I小于某个预先设定阈值thr (如thr=128),则对窗函数的最后面4个点设置为w (η) = O. 23+0. 77 · cos (2 · π · (8 · η_281)/127), η = 36, 37, 38, 39否则对窗函数的最后面4个点设置为w (η) = O. 26+0. 74 · cos (2 · π · (8 · η_281)/127), η = 36, 37, 38, 39然后用上述自适应设置后的窗函数w (η),η = 1,2,...,38,39对信号χ (η),η =1,2,... ,38,39进行加窗,即xd[n] = χ [η] · w[n], η = 0,1, ... , 38, 39得到自适应加窗后的信号xd[n]],η = 0,1,· · ·,38,39又如当输入样点数为80时如果输入信号的第一个样点的幅值|x
I小于某个预先设定阈值thr (如thr =128),则对窗函数的最前面8个点设置为w (η) = O. 26+0. 74 · cos (2 · π · (31-4 · η)/ 127),η = 0,1,2, ... ,7否则对窗函数的最前面8个点设置为
w (η) = O. 16+0. 84 · cos (2 · η · (31-4 · η)/ 127),η = 0,1,2, ... ,7对窗函数第9至第72个点都设为1,即w (η) = I,n = 8,...,71如果输入信号的最后一个样点的幅值|x[79] I小于某个预先设定阈值thr (如thr=128),则对窗函数的最后面8个点设置为w (η) = O. 26+0. 74 · cos (2 · π · (4 · η-285) /127), η = 72, 73, 74, . . , 79否则对窗函数的最后面8个点设置为w (η) = O. 16+0. 84 · cos (2 · π · (4 · η-285)/127), η = 72,73,74, ... , 79
然后用上述自适应设置后的窗函数w (η),η = 0,1,...,78,79对信号χ (η),η =
0,1, . . . ,78,79进行加窗,即xd[n] = x[n] · w[n], η = O, I, . . , 78, 79得到自适应加窗后的信号xd[η]],η = 0,1, . . . ,78,79窗函数w[n]的调整策略可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号。阈值thr也是通过大量实验选定,如thr = 128或thr = 157等;S203、对加窗后信号进行处理,得到线性预测编码系数,用于线性预测。本发明实施例一提供的线性预测分析方法,通过获取输入信号的第一个样点和最后一个样点的幅值,并根据该样点幅值对输入信号进行自适应加窗,因此,能够在增加较少的编码复杂度的情况下,提高了线性预测编码的预测性能。实施例二 本发明实施例二提供的线性预测分析方法,如图3所示,该方法步骤包括S301、获取输入信号的第一个样点的幅值x
|,其中,x[i], i = 0,1, , N-I为输入信号,N为输入信号的样点个数;输入信号在这里是指输入进行LPC分析的信号,可能是一帧信号,也可能是一帧信号加上历史缓冲区的一段信号(如历史缓冲区的L个样点,L可根据不同的编解码器采用不同的正整数,如40、80等);S302、对样点幅值|x
I进行分析,并根据分析结果对输入信号进行自适应加窗如果输入信号的第一个样点的幅值|x
I大于(或大于等于)某个预先设定阈值thr,用第一窗函数对输入信号进行加窗,即令xd[i] = x[i] *wl [i], i = 0,1,. . .,N_1,其中xd[i]为加窗后的信号,wl [i]为第一窗函数;否则,贝Ij用第二窗函数对输入信号进行加窗,即令xd[i] = x[i] · w2[i], i = O,1,. . .,Ν-1,其中w2[i]为第二窗函数;窗函数wl[i]和w2[i]可根据不同的语音频编码器通过大量实验来选定,分别适用于不同的信号,例如wl[i]为正弦窗,w2[i]为汉明窗;或者wl[i]为海明窗,w2[i]为正弦窗。阈值thr也是通过大量实验选定,如thr = 128或thr = 157 ;在一个具体的实现中,thr = 128,当巾贞长N = 80时,
0.16 + 0.84 ■ cos(2 ■ ,τ ·(31 - 4 ■ /)/127), i = 0,1,...,7wl[/] = <I,i = 8,9,…,71
0.16 + 0.84 · cos(2 ·疋·(4 · i - 285) /127), i = 72,73, 79
权利要求
1.一种线性预测分析方法,其特征在于,包括 获取输入信号的第一个样点的幅值和最后一个样点的幅值,所述输入信号包含N个样点,N为正整数; 对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号; 对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
2.根据权利要求I所述的线性预测分析方法,其特征在于,当N= 40时,对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号,包括 如果所述第一个样点的幅值大于或大于等于某一阈值时,用第一窗函数对所述输入信号最前面4个样点进行自适应加窗,得到加窗后信号;否则,用第二窗函数对所述输入信号最前面4个样点进行自适应加窗,得到加窗后信号; 对输入信号第5至第36个样点,窗函数都设为I ; 如果所述最后一个样点的幅值大于或大于等于某一阈值时,用第三窗函数对所述输入信号最后面4个样点进行自适应加窗,得到加窗后信号;否则,用第四窗函数对所述输入信号最后面4个样点进行自适应加窗,得到加窗后信号。
3.根据权利要求2所述的线性预测分析方法,其特征在于, 所述第一窗函数w (η)为w (η) = O. 26+0. 74 · cos (2 · π · (31-8 · η)/127),η = 0,1,2,3所述第二窗函数w (η)为w (η) = O. 23+0. 77 · cos (2 · π · (31-8 · η)/127),η = 0,1,2,3所述第三窗函数为w (η) = O. 26+0. 74 · cos (2 · π · (8 · η-281)/127), η = 36, 37, 38, 39所述第四窗函数为w (η) = O. 23+0. 77 · cos (2 · π · (8 · η_281)/127), η = 36, 37, 38, 39。
4.根据权利要求I所述的线性预测分析方法,其特征在于,当N= 80时,对所述第一个样点的幅值和最后一个样点的幅值进行分析,并根据分析结果对输入信号进行自适应加窗,得到加窗后信号,包括 如果所述第一个样点的幅值大于或大于等于某一阈值时,用第五窗函数对所述输入信号最前面8个样点进行自适应加窗,得到加窗后信号;否则,用第六窗函数对所述输入信号最前面8个样点进行自适应加窗,得到加窗后信号; 对输入信号第9至第72个样点,窗函数都设为I ; 如果所述最后一个样点的幅值大于或大于等于某一阈值时,用第七窗函数对所述输入信号最后面8个样点进行自适应加窗,得到加窗后信号;否则,用第八窗函数对所述输入信号最后面8个样点进行自适应加窗,得到加窗后信号。
5.根据权利要求4所述的线性预测分析方法,其特征在于, 所述第五窗函数w (η)为w (η) = O. 16+0. 84 · cos (2 · η · (31-4 · η)/ 127),η = 0,1,2, ... ,7所述第六窗函数w (η)为W (η) = O. 26+0. 74 · cos (2 · π · (31-4 · η)/127),η = 0,1,2,· · ·,7 所述第七窗函数为w (η) = O. 16+0. 84 · cos (2 · π · (4 · η-285)/127), η = 72,73,74, ... , 79 所述第八窗函数为w (η) = O. 26+0. 74 · cos (2 · π · (4 · η-285)/127),η = 72,73,74,· · ·,79。
6.根据权利要求2至5所述的任一线性预测分析方法,其特征在于, 所述阈值为128或157。
7.根据权利要求I所述的线性预测分析方法,其特征在于,获取输入信号的第一个样点的幅值和最后一个样点的幅值包括 将所述输入信号转换为脉冲编码调制信号; 获取转换后的所述输入信号的第一个样点的幅值和最后一个样点的幅值。
8.根据权利要求I所述的线性预测分析方法,其特征在于, 所述输入信号的第一个样点的幅值为|χ
|,最后一个样点的幅值为|X[N-1]| ;其中,x[i],i = 0,1, ... ,N-I 为输入信号。
9.一种线性预测分析方法,其特征在于,包括 获取输入信号编码方式,所述输入信号为G. 711信号; 对输入信号进行转换,得到PCM信号; 对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗,得到加窗后信号; 对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。
10.根据权利要求9所述的线性预测分析方法,其特征在于,所述对输入信号编码方式进行分析,并根据分析结果对PCM信号进行自适应加窗,得到加窗后信号,包括 如果编码方式为Α-law,用第一窗函数对PCM信号进行加窗; 否则,则用第二窗函数对PCM信号进行加窗。
11.根据权利要求9或10所述的线性预测分析方法,其特征在于,所述第一窗函数为正弦窗,第二窗函数为为汉明窗;或者第一窗函数为海明窗,第二窗函数为正弦窗。
全文摘要
本发明公开了一种线性预测分析方法、装置及系统,涉及通信领域,能够提高线性预测编码的预测性能,并且分析运算复杂度低。解决方案为获取输入信号至少一个样点的信号特性信息;对所述信号特性信息进行比较分析,得到分析结果;根据所述分析结果选择窗函数对所述输入信号进行自适应加窗,得到加窗后信号;对所述加窗后信号进行处理,得到线性预测编码系数用于线性预测。本发明用于线性预测编码。
文档编号G10L19/04GK102930871SQ20121046223
公开日2013年2月13日 申请日期2009年3月11日 优先权日2009年3月11日
发明者许剑峰, 苗磊, 齐峰岩, 张德军, 张清 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1