一种基于dct的语音篡改恢复方法

文档序号:9548990阅读:473来源:国知局
一种基于dct的语音篡改恢复方法
【技术领域】
[0001] 本发明在给出了一种对语音内容真实性和完整性认证方法的同时,给出了对被攻 击信号进行篡改恢复的方法,保障了数字语音内容的安全性,对被攻击内容的恢复使语音 的内容更真实可靠。
【背景技术】
[0002] 数字语音信号作为一种信息载体广泛应用在电话通讯、新闻报导等方面,已经成 为人们日常生活不可分割的一部分。由于自身特点等原因,语音信号容易引起攻击者的兴 趣而被攻击,被攻击的信号表达的意义和原始信号会有很大区别,甚至完全相反。这些给人 们的生活带来了不便,增加了不和谐因素。于是,需要一种技术来对语音信号的真实性和完 整性进行认证。同时,对被攻击信号的篡改恢复,将给人们的生活带来诸多便利。因此,可 恢复的语音内容认证算法更具有研究意义和实用价值。
[0003] 文南犬 "Authenticity examination of compressed audio recordings using detection of multiple compression and encoders' identification" (Korycki R,Forensic Science International. Vol. 238, pp. 33-46, 2014)针对压缩的音频信号 提出了一种内容认证算法,基于MDCT系数的统计特征以及其它一些从压缩信号中提取 的参数来对音频内容进行取证。该方法提高了水印系统的鲁邦性。然而,由于认证过程 需要大量的样本进行训练,限制了其在实际生活中的应用。文献" Content-dependent watermarking scheme in compressed speech with identifying manner and location of attacks',(Chen 0 T-C, Chia-Yi, Chia-Hsiung Liu, IEEE Transactions on Audio, Speech, and Language Processing. Vol. 15, no. 5, pp. 1605-1616, 2007)基于压缩编 码技术提出了一种语音内容取证方法。一方面,该方法的水印信息在语音压缩过程中生成, 对于采用不同方法压缩的语音信号,或者未被压缩的信号,该方法没有取证能力。另一方 面,水印嵌入基于LSB的方法。由于LSB的水印嵌入方法是脆弱的,信号处理操作会被认 为是恶意攻击,于是该方法在应用中存在局限性。以上方法对于检测到的恶意攻击,都不具 有篡改恢复的能力。为此,研究具有篡改恢复能力的数字语音取证技术,不仅具有重要研究 意义和实用价值,对提高数字语音内容的可靠性也具有积极作用。

【发明内容】

[0004] 本发明的目的在于提供一种基于DCT的语音内容篡改恢复算法,该算法首先能够 对恶意攻击进行有效监测并定位,然后对监测到的被攻击内容进行篡改恢复,以此来实现 数字语音内容的真实性和完整性认证,并提高数字语音认证的可靠性。
[0005] 为实现这样的目的,本发明给出了基于DCT的数字语音压缩方法,利用压缩信号 来恢复被攻击的内容,设计了一种具有篡改恢复能力的数字语音取证方法。
[0006] -种基于DCT的数字语音篡改恢复方法,能够对恶意攻击进行有效监测并定位, 以此来实现对数字语音内容的真实性和完整性取证,并通过对被攻击内容的篡改恢复使取 证的结果更加真实可信,包括如下具体步骤:
[0007] (1)信号压缩:首先将原始语音信号A分为不重叠的P帧,第i帧记为A1;同时对A 进行重采样操作,重采样采用的采样频率F'小于原始信号采样频率F,采样后的信号记为 A';接着将A'分为不重叠的P帧,并对每帧进行DCT ;取前M个低频系数作为该帧的压缩 信号;将各帧的压缩信号置乱,置乱后第i帧A1对应的压缩信号记为C 1;
[0008] ⑵嵌入帧号和压缩信号:将Ai分为4段,记为Al 42;、六3;和A4 i;A ;对应的帧号 i作为第i帧的标识嵌入在AljP A2 i中;同时,第i帧A i对应的压缩信号C i嵌入到A3 4口 八4冲;嵌入后的信号记为WA ;
[0009] (3)内容认证:首先将待检测语音信号WA分为不重叠的P帧,第i帧记为1心;并 将每帧分为4段,分别记为WAlpWASpWASjP WA4 1;从WAl JP WA2 i中提取帧号,同时从WA3 i 和歡七中提取压缩信号。若从WAl JPWAS1中提取的帧号相同,同时,从WASjPWAl中提 取压缩信号也相同,则表明该帧的内容是真实的,并跳入第i+Ι帧WA 1+1进行内容认证操作; 否则,则说明该帧被恶意攻击;
[0010] (4)篡改恢复:在检测到被攻击的内容之后,搜索找到下一个能够通过认证的帧, 并提取该帧的帧号和上一个能通过认证的帧的帧号,两个帧号之差就是被攻击的信号;根 据压缩信号置乱的方法,找到被攻击帧的压缩信号嵌入的位置;提取压缩信号并恢复被攻 击的内容,来实现篡改恢复。
[0011] 与现有的语音内容取证算法相比,本发明首先通过各帧的帧号来监测被攻击的信 号,提高了篡改定位的精度;通过提取与被攻击信号对应的压缩信号,来恢复被攻击的内 容,提高了算法的篡改恢复能力,也确保了被攻击的信号的可读性和认可度。既能够篡改监 测有能够篡改恢复,有利于本发明在日常生活中的推广应用。
【附图说明】
[0012] 图1为语音信号压缩过程框图。
[0013] 图2为帧号和水印嵌入过程框图。
[0014] 图3为语音内容取证过程框图。
[0015] 图4为篡改定位和篡改恢复方法。
[0016] 图5为本发明选取的含水印语音信号。
[0017] 图6为删除攻击后的含水印语音信号。
[0018] 图7为替换攻击后的含水印语音信号。
[0019] 图8为删除攻击后的篡改定位结果。
[0020] 图9为替换攻击后的篡改定位结果。
[0021] 图10为删除攻击后的篡改恢复结果。
[0022] 图11为替换攻击后的篡改恢复结果。
[0023] 图12为样本值的分块方法图。
[0024] 图13为样本值分块方法举例图。
[0025] 图14为不同类型含水印语音信号的ODG值和SDG值图。
[0026] 图15为常规信号处理后水印提取的BER值图。
【具体实施方式】
[0027] 以下结合附图和实施例对本发明的技术方案作进一步描述。
[0028] 1、信号压缩:
[0029] (1)将原始语音信号A = {ai,1彡1彡L}分为P帧,第i帧记为A1, A1 = {blit,1彡t彡L/P},其中blit表示为A i的第t个样本。
[0030] (2)对A进行重采样操作,重采样的采样频率F'小于原始信号采样频率F,采样后 的信号记为^,其长度记为UU =L /F。将Y分为不重叠的P帧,第i帧记为 Ar ,,
[0031] (3)对A' i进行DCT,所得系数记为D1= 彡j彡L' /P};取前M个系数并 记为 Gi,Gi = {g i, j I gi, j = d i, jl < j < M},M < < L ' /P。Gi 既是弟 i 帧 A ;压缩后的{曰可。 信号压缩过程如图1所示。
[0032] 2、嵌入帧号和压缩信号:
[0033] (1)将 Aj为 4 段,分别记为 Al JPAS1 的长为 N,A3 JPA4^ 长为6M。将A3JP A4 i等分为M个子段,每个子段含有6个样本点,第j个子段记为33/和 AA: . I ^ j ^ M0
[0034] ⑵第i帧帧号i表示为Yi= {y ^ y2,…,yN} 作为第i帧的标识。Y i中的各元 素可以由下式得到:
[0035] i = Y1 · 10N ^y2IOn 2+··· +yN
[0036] 记Ali的前N个样本点为al ^al2, "·,α1Ν。用y^y;;,"·,γΝ依次代替这N个样本点 的倒数第二位的整数值,以此来完成Y 1的嵌入。用同样的方法将Y i嵌入到Α2 i中。
[0037] (3)对压缩信号G1 (1彡i彡P)采用混沌地址索引的方法进行置乱。混沌序列由 下式Logistic混沌映射生成,其中X。表示混沌序列的初值。
[0038] χ1+1= μ X J (I-X1), 3. 5699 μ 4
[0039] 记X = U11 I = 1, 2,…,Ρ},将X1Q彡1彡Ρ)按照下式从大到小排列,其中c(l)
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1