一种基于频谱映射的端到端的语音加解密方法

文档序号:10654543阅读:346来源:国知局
一种基于频谱映射的端到端的语音加解密方法
【专利摘要】本发明公开了一种基于频谱映射的端到端语音加密方法,包括以下步骤:对数字语音信号进行线性预测(LPC)分析得到LPC系数;将LPC系数转换为线性谱频率(LSF)系数,对LSF系数按照给定的密钥进行映射变换,再将映射后的LSF系数转换为LPC系数,并构造出合成滤波器;原始数字语音信号通过线性预测,得到预测残差信号,最后将预测残差信号通过由映射变换后的LPC系数所构造的合成滤波器得到加密后的语音信号。保证了加密语音信号的语音特征,实现有效的语音加密。
【专利说明】
一种基于频谱映射的端到端的语音加解密方法
技术领域
[0001] 本发明涉及一种语音加解密方法,具体地涉及一种基于线性预测编码和频谱映射 的语音加解密方法。
【背景技术】
[0002] 语音是人类获取信息的重要手段,语音通信是现代通信中最有效最方便的手段之 一。随着通信技术的发展,各种各样的语音通信出现在人们的生活中。但是现实生活中的语 音通信难免地会受到安全威胁,如窃听、电话跟踪、电话劫持和拒绝服务等。因此,语音加密 对于保证语音的安全十分重要。语音加密的重要性表现在两个方面:一方面,随着人们保护 自己隐私权意识逐步上升,对语音加密的重视程度越来越高;另一方面,在军事通信、商业 洽谈、政治谈判等特殊应用中,信息一旦被泄露,将会造成巨大损失,在这里语音加密十分 必要。
[0003] 然而,传统的移动通信缺乏端到端的加密机制,移动网络节点设备间传输的为经 过模数转换的明文信息,被窃听的风险极高。现有的移动通信过程一般经历手机端语音信 号的模数转化、编码传输、基站解码再编码技术,手机端解码数模转换为语音信号等几个过 程。而现有的加密手段多在编码过程之后进行加密,再通过基站的解密解码再编码加密,这 种加密方式是建立在核心网络部分安全可信的前提下,因为只考虑了无线信道部分的安 全,其明文信息对基站可见,导致系统不能为用户提供端到端的安全通信。编码后加密的方 式不可否认的具有加密数据少,占用信道小等优点,但其对基站透明的特点使得这种加密 方式仍存在被窃听的风险。
[0004] 中国专利文献CN201210055857公开了一种语音加密系统,提出了一种语音加密算 法,首先对语音信号按照设定长度分段进行时域到频域的转换,然后在频域对语音信号频 率分组置乱,最后将频域转换为时域形成加密后的语音信号。虽然可以在一定程度上降低 被窃听的风险,但是,经过理论分析与实验证明,该方法合成的加密语音信号对加解密两端 的同步要求高,实用性较差,无法广泛的应用。

【发明内容】

[0005] 为了解决现有技术存在的问题,本发明目的是:提供一种基于频谱映射的端到端 语音加解密方法,基于线性预测编码和频谱映射,在加密端对数字语音信号进行线性预测 (LPC)分析得到LPC系数,然后将LPC系数转换为线性谱频率(LSF)系数,对LSF系数按照给定 的密钥进行映射变换,再将映射后的LSF系数转换为LPC系数,并构造出合成滤波器;另一方 面,原始语音通过线性预测,得到预测残差信号,最后将预测残差信号通过由映射变换后的 LPC系数所构造的合成滤波器得到加密后的语音信号,保证了加密语音信号的语音特征,实 现有效的语音加密。
[0006] 本发明的技术方案是:
[0007] -种基于频谱映射的端到端语音加密方法,其特征在于,包括以下步骤:
[0008] SOI:对数字语音信号进行线性预测LPC分析得到LPC系数;
[0009] S02:将LPC系数转换为线性谱频率LSF系数,对LSF系数按照给定的密钥进行映射 变换,再将映射后的LSF系数转换为LPC系数,并构造出合成滤波器;
[0010] S03:原始数字语音信号通过线性预测,得到预测残差信号,最后将预测残差信号 通过由映射变换后的LPC系数所构造的合成滤波器得到加密后的语音信号。
[0011] 优选的,所述步骤S01中的LPC系数通过以下步骤得到:
[0012] 线性预测L P C为用过去p个样点值s ( η )来预测现在或未来样点值
,预测误差ε(η)为:
[0014] 其中,ai为线性预测系数,η为自然数;[0015] 线性预测LPC的Yule-Walker方程:
[0017] Levinson-Durbin 算法递推公式为:
[0021] 由此可以求解出两阶线性预测的预测系数ai,i = l,2,…,p。
[0022] 优选的,所述将LPC系数转换为线性谱频率LSF系数包括以下步骤:
[0023] p阶线性预测滤波器函数为:
[0027]当阶数p为偶数时有:
[0030]当阶数P为奇数时有:[0031 ] P7 (z) =P(z)
[0033] P' (z)和Q' (z)为对称的偶次多项式,根为复值共辄对,只需确定位于上半圆的根 即可,设在上半圆K (z)和Qlz)的根为#%? = 1,2,···,ρ,其线谱频率为根的角频率0〈ωι〈 π;
[0034] 当阶数ρ为偶数时令
[0035] Μι = ρ/2,Μ2 = ρ/2
[0036] 当阶数ρ为奇数时令
[0037] Μι=(ρ+1)/2,Μ2=(ρ-1)/2
[0038] 利用泰勒级数展开原理,将共辄零点对数分别为施和此对应的Κ (ζ)和V (ζ)展开, 有Μ1+Μ2 = ρ,用z = e#代入,并利用余弦定理转换有:
[0039] Ρ/7( ω )=2cosMi〇+2P/ (l)cos(Mi-l) 〇+---+2?7 (Mi-1 )cos ω+P7 (Μι)
[0040] 〇^( ω )=2(3081^0+207 (l)cos(Mi-l) 0+...+2?7 (Mi-Dcosco+Q' (Μι)
[0041 ] 再令x = cos ω,将上式用Chebyshev多项式Tm(x) = cos(mx)展开有:
[0044] 第邮介义的Chebyshev多项式Tm(x)满足递推Tm(x) = 2xTk-i(x)_Tk-2(x),初值To(x)= 1,Ti(x) =x,求x在[1,-l]区间内,搜索P〃(x) =0和Q〃(x) =0的根植{xi},而对应的LSF的参 数值ω 1由ω i = arccosxi来确定。
[0045] 优选的,所述步骤S02的映射变换包括线性映射和非线性映射,其中线性映射分为 平移映射、旋转映射、相似映射、反演映射,非线性映射即利用各类非线性算子实现映射。 [0046]优选的,所述步骤S02中LSF系数转换为LPC系数,包括以下步骤:
[0047] 由LSF参数ω i逆向推导Chebyshev多项式来求解,LSF参数值叫,令xk = cos c〇k,k = 1,2,…,p得中间式
[0050] 按原推导过程对应关系,由P〃(x)逆推得Ρ?ω)和K(z),同样由Q〃(x)逆推得Q (ω )和Q(z)进而逆推导可得p(z)和Q(z):
[0051] P(z) =P7 (z)*( 1+z-1)
[0052] Q(z) =Q7 (z)*(l-z_1)
[0053] 则有:
[0054] A(z) = (P(z)+Q(z))/2
[0055] 由 A(z)可得 LPC 参数 ai。
[0056] 优选的,在步骤SOI之前对输入的数字语音信号加窗分帧处理,即用窗函数w(n)乘 以s(n),使得加窗语音信号sw=s(n)*w(n)。
[0057] 本发明还公开了一种语音解密方法,其特征在于,包括以下步骤:
[0058] S11:将加密后的数字语音信号进行线性预测LPC分析得到LPC系数;
[0059] S12:将LPC系数转换为线性谱频率LSF系数,对LSF系数按照密钥进行逆映射变换, 再将逆映射后的LSF系数转换为LPC系数,并构造解密语音合成滤波器;
[0060] S13:加密数字语音信号通过线性预测,得到预测残差信号,最后将预测残差信号 通过由逆映射变换后的LPC系数所构造的解密语音合成滤波器得到原始语音信号。
[0061] 与现有技术相比,本发明的优点是:
[0062] 1、本发明是基于线性预测编码和频谱映射的语音加解密方法,在加密端对数字语 音信号进行线性预测(LPC)分析得到LPC系数,然后将LPC系数转换为线性谱频率(LSF)系 数,对LSF系数按照给定的密钥进行映射变换,再将映射后的LSF系数转换为LPC系数,并构 造出合成滤波器;另一方面,原始语音通过线性预测,得到预测残差信号,最后将预测残差 信号通过由映射变换后的LPC系数所构造的合成滤波器得到加密后的语音信号,保证了加 密语音信号的语音特征,实现有效的语音加密。
[0063] 2、解密过程是加密过程的逆过程。解密端对加密后的数字语音信号线性预测 (LPC)得到加密信号的LPC系数,然后将LPC系数转化为线性谱频率(LSF)系数,对LSF系数按 照密钥逆映射,再将逆映射后的LSF系数转换为LPC系数,并构造出语音合成滤波器;与此同 时,加密语音通过线性预测,得到预测的残差信号,最后将预测残差信号通过由逆映射变化 后的LPC系数构造的合成滤波器得到原始语音信号,简单而高效地恢复出原始信号。对加解 密两端的同步要求低,实用性较好,具有广泛的应用前景。
【附图说明】
[0064] 下面结合附图及实施例对本发明作进一步描述:
[0065] 图1为本发明语音加密装置的结构框图;
[0066] 图2为本发明语音解密装置的结构框图;
[0067] 图3为原始语音信号波形图;
[0068] 图4为加密语音信号波形图;
[0069]图5为解密语音信号波形图。
【具体实施方式】
[0070]为使本发明的目的、技术方案和优点更加清楚明了,下面结合【具体实施方式】并参 照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发 明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本 发明的概念。
[0071] 实施例:
[0072]如图1所示,待加密的信号为数字语音信号如图3所示,根据语音信号的短时平稳 性能,为了便于对语音信号特征参数的分析,需要对语音信号进行分帧,此处采用的分帧方 法为加窗分帧技术。与此同时,帧与帧之间平滑过渡,保证语音信号的连续性,分帧后的信 号为s(n)。
[0073]首先对语音信号帧s(n)作线性预测(LPC)分析,其p阶线性预测系数&1*Ι^ν?η 8〇η Durbin算法利用自相关函数求出。考虑到线性谱频率LSF系数具有良好的量化特性和插值 特性,并且线性谱频率LSF可以很好地与频谱保留的共振峰的位置和带宽相对应,因此在语 音处理中常常直接对LSF进行控制和处理,因此本文是直接对LSF系数映射转换。本文利用 Chebyshev法将求出的LPC系数转为线谱对LSF参数。按照给定的密钥选择合适的映射方式 对LSF系数映射,此处是语音加密的主要实现部分。最后将映射后的LSF转换为LPC系数,构 成语音加密合成滤波器,用于合成加密后的语音信号。
[0074] 另一方面,原始语音通过线性预测,得到预测残差信号e(n),最后将预测残差信号 e(n)通过由映射变换后的LPC系数所构造的语音加密合成滤波器得到加密后的语音信号。 至此,实现了原始语音信号的加密,加密后的语音波形图如图4所示。
[0075] 如图2所示,解密过程是加密过程的逆过程。解密端对加密后的数字语音信号线性 预测(LPC)分析,得到加密信号的LPC系数,然后将LPC系数转化为线性谱频率(LSF)系数,按 照提供的密钥对LSF系数逆映射,恢复出原始语音信号的LSF系数。为合成原始语音信号,需 要再将LSF系数转换为LPC系数,并构造出语音合成滤波器;与此同时,加密语音通过线性预 测,得到预测的残差信号,最后将预测残差信号通过由逆映射变化后的LPC系数构造的合成 滤波器得到原始语音信号,简单而高效地恢复出原始信号,波形图如图5所示。
[0076]具体实现方法:
[0077] 由于语音信号的短时平稳性,为了避免截断效应的产生,通常需要对输入的语音 信号加窗分帧处理,同时也需要保证语音信号帧与帧之间的连续性。
[0078] 分帧是用可以动的有限长度窗口进行加权的方法来实现的,即用窗函数w(n)乘以 s(n),使得加窗语音信号sw=s(n)*w(n) ·
[0079] 语音信号数字处理中常用的窗函数时矩形窗和汉明窗,表达式如下:
[0084]其中,N为帧长,η为自然数。
[0085] (1)线性预测分析
[0086]线性预测的基本思想是用过去ρ个样点值s(n)来预测现在或未来样点值S(n):
[0090] 其中,ai,i = 1,2,…,p为线性预测系数,可由Levinson-Durbin算法求出, Levinson-Durbin算法利用自相关矩阵的对称性和Toepltz性质提出了高效的递推算法。 [0091 ] 线性预测的Yule-Walker方程
[0093]从方程中可以看出,它共有ρ+l个方程,当1? = 0,1,2,···,ρ的已知时,可以解 得apk[k= 1,2,…,p]以及样p+1个未知量。Levinson-Durbin算法递推公式为:
[0097]由此可以求解出两阶线性预测的预测系数ai,i = 1,2,…,p,式中1为中间变量。 [0098] (2)LPC系数转换为LSF系数
[0099] 本文思想是将LPC系数转换为LSF系数,对LSF系数进行加密,再将加密后的LSF系 数转化为LPC系数,合成加密后的语音信号,保证合成后的加密语音信号包含有语音特性, 所以需要将LPC系数转换为LSF系数。
[0100] 第i阶线性预测误差滤波器传递函数的递推关系为:
[0101] Ai(z)=Ai_1(z)-kiZ_1A i_1(z_1) (9)
[0102] 则有p阶线性预测滤波器函数为:
[0104]定义:
[0105] P(z) =A(z)+z-(p+1)A(z-工)(ll)Q(z)=A(z)_z-(p+1)A(z-工)
[0106] 所以:
[0108] 可以证明,当A(z)的零点在Z平面单位圆内时,P(z)和Q(z)的零点都在单位圆上, 并且P(z)和Q(z)有共辄复根和零点沿着单位圆随ω的增加交替出现。P(z)必定有一个根z =-1( ω =jt),Q(z)必定有一个根z = _l。
[0109] 设P (z)的零点为#>\〇 (z)的零点为由于P (z)和Q (z)的零点都在单位圆上, 所以这些零点可以直接用频率来表示:
[0110] O<〇i<0i<---<Wp/2<0p/ 2<jT (13)
[0111] (^,,成对出现,反映了谱的特性,所以称之为线谱对(LSP),由于LSF参数是频域 参数,所以它和语音信号谱包络的峰有更紧密的联系。
[0112] 当阶数p为偶数时有
[0115] (14)
[0116] 当阶数p为奇数时有
[0117] P7 (z) =P(z)
[0119] (15)
[0120] P' (z)和Q' (z)为对称的偶次多项式,根为复值共辄对,只需确定位于上半圆的根 即可。设在上半圆1^(2)和吖(2)的根为6/^4 = 1,2,一,?,其线谱频率为根的角频率0〈《1 <π0
[0121] 当阶数ρ为偶数时令
[0122] Mi = p/2,M2 = p/2 (16)
[0123] 当阶数ρ为奇数时令
[0124] Mi=(p+l)/2,M2=(p-l)/2 (17)
[0125] 利用泰勒级数展开原理,将共辄零点对数分别为施和此对应的Κ (ζ)和V (ζ)展开, 有Μ1+Μ2 = ρ。用z = e#代入,并利用余弦定理转换有
[0126] Ρ/7( ω )=2cosMi〇+2P/ (l)cos(Mi-l) 〇+---+2?7 (Mi-1 )cos ω+P7 (Μι)
[0127] 〇^( ω )=2(3081^0+207 (l)cos(Mi-l) 0+...+2?7 (Mi-Dcosco+Q' (Μι)
[0128] (18)
[0129] 再令x = cos ω,将上式用Chebyshev多项式Tm(x) = cos(mx)展开有
[0132] 第邮介义的Chebyshev多项式Tm(x)满足递推Tm(x) = 2xTk-i(x)_Tk-2(x),初值To(x)= 1,
[0133] Ti(x) = x,利用搜索法求出LSF参数值。以上Chebyshev多项式解法实质是求x在 [1,-1 ]区间内,搜索P〃(X) = 〇和Q〃(X) = 〇的根植{xi},而对应的LSF的值即可由ω i = arccosxi来石角定。
[0134] LSF分析是用P个离散频率来表示语音信号频谱特性的一种方法,LSF系数偏差只 对该频率附近的语音频谱产生影响,而对其他频率上的LSF语音频谱影响不大。
[0135] (3)LSF映射变换
[0136] 根据提供的密钥对LSF系数映射变换即为加密的主要过程。数据映射包括线性映 射和非线性映射,其中线性映射可以分为平移映射、旋转映射、相似映射、反演映射等。
[0137] 本文主要根据对LSF系数ω 1的映射实现线谱频率的映射变换过程,其中密钥为映 射因子。由于LSF系数〇^在〇~π范围内,所以本文采用的是旋转映射,根据提供的密钥实现 对LSF系数的映射变换。
[0138] (4)LSF系数转化为LPC系数
[0139] 对于LSF转换成LPC,由LSF参数ω!和0!逆向推倒Chebyshev多项式来求解,LSF参数 值《k,令xk = cos C0k,k=l,2,…,p得中间式:
[0142] 按原推导过程对应关系,可以由P〃(x)逆推得Ρ'(ω)和Κ(ζ),同样由Q〃(x)逆推得 Q( ω )和Q(z)进而按方程(11)逆推导可得P(z)和Q(z),而有:
[0143] P(z) =P7 (z)*( 1+z-1)
[0144] q(z)=q'(z)*(i-z-!) (22)
[0145] 则有:
[0146] A(z) = (P(z)+Q(z))/2 (23)
[0147] 则由A(z)可得LPC参数ai和ki。
[0148] 应当理解的是,本发明的上述【具体实施方式】仅仅用于示例性说明或解释本发明的 原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何 修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨 在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修 改例。
【主权项】
1. 一种基于频谱映射的端到端语音加密方法,其特征在于,包括以下步骤: SO 1:对数字语音信号进行线性预测LPC分析得到LPC系数; S02:将LPC系数转换为线性谱频率LSF系数,对LSF系数按照给定的密钥进行映射变换, 再将映射后的LSF系数转换为LPC系数,并构造出加密语音合成滤波器; S03:原始数字语音信号通过线性预测,得到预测残差信号,最后将预测残差信号通过 由映射变换后的LPC系数所构造的加密语音合成滤波器得到加密后的语音信号。2. 根据权利要求1所述的语音加密方法,其特征在于,所述步骤SOl中的LPC系数通过以 下步骤得到: 线性预测LPC为用过去p个样点值s(n)来预测现在或未来样点值 顸涮误#由此可以求解出两阶线性预测的预测系数Ct1, i = l,2,…,ρ。3. 根据权利要求1所述的语音加密方法,其特征在于,所述将LPC系数转换为线性谱频 率LSF系数包括以下步骤: P阶线性预测滤波器函数为:定义,P(z) = A(z)+z-(p+1)A(z-工),Q(z)当阶数P为奇数时有: P' (Z)=P(Z)K (z)和V (z)为对称的偶次多项式,根为复值共辄对,只需确定位于上半圆的根即可, 设在上半圆P7 (ζ)和V (ζ)的根为= 1,2,…,ρ,其线谱频率为根的角频率0〈 ω Xjt; 当阶数P为偶数时令 Μι = ρ/2,Μ2 = ρ/2 当阶数P为奇数时令 Mi= (ρ+1)/2,Μ2= (ρ-1)/2 利用泰勒级数展开原理,将共辄零点对数分别为施和跑对应的K (ζ)和V (ζ)展开,有M1 +Μ2 = ρ,用z = eW代入,并利用余弦定理转换有:第111阶叉的Chebyshev多项式Tm(X)满足递推Tm(x) = 2xTk-i(x)_Tk-2(X),初值To(X) = I,Τι (X) = X,求X在[I,-1 ]区间内,搜索P〃(X) = O和Q〃(X) = O的根植{Xi},而对应的LSF的参数值 ω i由ω i = arccosxi来石角定。4. 根据权利要求1所述的语音加密方法,其特征在于,所述步骤S02的映射变换包括线 性映射和非线性映射,其中线性映射分为平移映射、旋转映射、相似映射、反演映射,非线 性映射即利用各类非线性算子实现映射。5. 根据权利要求3所述的语音加密方法,其特征在于,所述步骤S02中LSF系数转换为 LPC系数,包括以下步骤: 由LSF参数ω i逆向推导Chebyshev多项式来求解,LSF参数值ω k,令Xk= cos ω k,k= 1, 2,…,P得中间式按原推导过程对应关系,由P〃(X)逆推得K ( ω )和P' (z),同样由Q〃(X)逆推得Q( ω )和Q (ζ)进而逆推导可得P(Z)和Q(z): P(Z)=P7 (zXl+z-1) Q(z)=Q7 (z)*(l-z_1) 则有: A(z) = (P(z)+Q(z))/2 由A (ζ)可得LPC参数ai。6. 根据权利要求2所述的语音加密方法,其特征在于,在步骤SOl之前对输入的数字语 音信号加窗分帧处理,即用窗函数w(n)乘以s(n),使得加窗语音信号s w=s(n)*w(n)。7. -种语音解密方法,其特征在于,包括以下步骤: SI 1:将加密后的数字语音信号进行线性预测LPC分析得到LPC系数; Sl 2:将LPC系数转换为线性谱频率LSF系数,对LSF系数按照密钥进行逆映射变换,再将 逆映射后的LSF系数转换为LPC系数,并构造解密语音合成滤波器; S13:加密数字语音信号通过线性预测,得到预测残差信号,最后将预测残差信号通过 由逆映射变换后的LPC系数所构造的解密语音合成滤波器得到原始语音信号。
【文档编号】H04L9/06GK106024000SQ201610343431
【公开日】2016年10月12日
【申请日】2016年5月23日
【发明人】胡剑凌, 李杨, 张霞, 陈建荣, 张强庆, 方健
【申请人】苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1