一种基于dct的语音篡改恢复方法

文档序号：9548990阅读：473来源：国知局

一种基于dct的语音篡改恢复方法
【技术领域】
[0001] 本发明在给出了一种对语音内容真实性和完整性认证方法的同时，给出了对被攻击信号进行篡改恢复的方法，保障了数字语音内容的安全性，对被攻击内容的恢复使语音的内容更真实可靠。
【背景技术】
[0002] 数字语音信号作为一种信息载体广泛应用在电话通讯、新闻报导等方面，已经成为人们日常生活不可分割的一部分。由于自身特点等原因，语音信号容易引起攻击者的兴趣而被攻击，被攻击的信号表达的意义和原始信号会有很大区别，甚至完全相反。这些给人们的生活带来了不便，增加了不和谐因素。于是，需要一种技术来对语音信号的真实性和完整性进行认证。同时，对被攻击信号的篡改恢复，将给人们的生活带来诸多便利。因此，可恢复的语音内容认证算法更具有研究意义和实用价值。
[0003] 文南犬 "Authenticity examination of compressed audio recordings using detection of multiple compression and encoders' identification" （Korycki R，Forensic Science International. Vol. 238, pp. 33-46, 2014)针对压缩的音频信号提出了一种内容认证算法，基于MDCT系数的统计特征以及其它一些从压缩信号中提取的参数来对音频内容进行取证。该方法提高了水印系统的鲁邦性。然而，由于认证过程需要大量的样本进行训练，限制了其在实际生活中的应用。文献" Content-dependent watermarking scheme in compressed speech with identifying manner and location of attacks'，（Chen 0 T-C, Chia-Yi, Chia-Hsiung Liu, IEEE Transactions on Audio, Speech, and Language Processing. Vol. 15, no. 5, pp. 1605-1616, 2007)基于压缩编码技术提出了一种语音内容取证方法。一方面，该方法的水印信息在语音压缩过程中生成，对于采用不同方法压缩的语音信号，或者未被压缩的信号，该方法没有取证能力。另一方面，水印嵌入基于LSB的方法。由于LSB的水印嵌入方法是脆弱的，信号处理操作会被认为是恶意攻击，于是该方法在应用中存在局限性。以上方法对于检测到的恶意攻击，都不具有篡改恢复的能力。为此，研究具有篡改恢复能力的数字语音取证技术，不仅具有重要研究意义和实用价值，对提高数字语音内容的可靠性也具有积极作用。

【发明内容】

[0004] 本发明的目的在于提供一种基于DCT的语音内容篡改恢复算法，该算法首先能够对恶意攻击进行有效监测并定位，然后对监测到的被攻击内容进行篡改恢复，以此来实现数字语音内容的真实性和完整性认证，并提高数字语音认证的可靠性。
[0005] 为实现这样的目的，本发明给出了基于DCT的数字语音压缩方法，利用压缩信号来恢复被攻击的内容，设计了一种具有篡改恢复能力的数字语音取证方法。
[0006] -种基于DCT的数字语音篡改恢复方法，能够对恶意攻击进行有效监测并定位，以此来实现对数字语音内容的真实性和完整性取证，并通过对被攻击内容的篡改恢复使取证的结果更加真实可信，包括如下具体步骤：
[0007] (1)信号压缩：首先将原始语音信号A分为不重叠的P帧，第i帧记为A1;同时对A 进行重采样操作，重采样采用的采样频率F'小于原始信号采样频率F，采样后的信号记为 A';接着将A'分为不重叠的P帧，并对每帧进行DCT ;取前M个低频系数作为该帧的压缩信号；将各帧的压缩信号置乱，置乱后第i帧A1对应的压缩信号记为C 1;
[0008] ⑵嵌入帧号和压缩信号：将Ai分为4段，记为Al 42;、六3;和A4 i;A ;对应的帧号 i作为第i帧的标识嵌入在AljP A2 i中；同时，第i帧A i对应的压缩信号C i嵌入到A3 4口八4冲；嵌入后的信号记为WA ;
[0009] (3)内容认证：首先将待检测语音信号WA分为不重叠的P帧，第i帧记为1心;并将每帧分为4段，分别记为WAlpWASpWASjP WA4 1;从WAl JP WA2 i中提取帧号，同时从WA3 i 和歡七中提取压缩信号。若从WAl JPWAS1中提取的帧号相同，同时，从WASjPWAl中提取压缩信号也相同，则表明该帧的内容是真实的，并跳入第i+Ι帧WA 1+1进行内容认证操作；否则，则说明该帧被恶意攻击；
[0010] (4)篡改恢复：在检测到被攻击的内容之后，搜索找到下一个能够通过认证的帧，并提取该帧的帧号和上一个能通过认证的帧的帧号，两个帧号之差就是被攻击的信号；根据压缩信号置乱的方法，找到被攻击帧的压缩信号嵌入的位置；提取压缩信号并恢复被攻击的内容，来实现篡改恢复。
[0011] 与现有的语音内容取证算法相比，本发明首先通过各帧的帧号来监测被攻击的信号，提高了篡改定位的精度；通过提取与被攻击信号对应的压缩信号，来恢复被攻击的内容，提高了算法的篡改恢复能力，也确保了被攻击的信号的可读性和认可度。既能够篡改监测有能够篡改恢复，有利于本发明在日常生活中的推广应用。
【附图说明】
[0012] 图1为语音信号压缩过程框图。
[0013] 图2为帧号和水印嵌入过程框图。
[0014] 图3为语音内容取证过程框图。
[0015] 图4为篡改定位和篡改恢复方法。
[0016] 图5为本发明选取的含水印语音信号。
[0017] 图6为删除攻击后的含水印语音信号。
[0018] 图7为替换攻击后的含水印语音信号。
[0019] 图8为删除攻击后的篡改定位结果。
[0020] 图9为替换攻击后的篡改定位结果。
[0021] 图10为删除攻击后的篡改恢复结果。
[0022] 图11为替换攻击后的篡改恢复结果。
[0023] 图12为样本值的分块方法图。
[0024] 图13为样本值分块方法举例图。
[0025] 图14为不同类型含水印语音信号的ODG值和SDG值图。
[0026] 图15为常规信号处理后水印提取的BER值图。
【具体实施方式】
[0027] 以下结合附图和实施例对本发明的技术方案作进一步描述。
[0028] 1、信号压缩：
[0029] (1)将原始语音信号A = {ai，1彡1彡L}分为P帧，第i帧记为A1, A1 = {blit，1彡t彡L/P}，其中blit表示为A i的第t个样本。
[0030] (2)对A进行重采样操作，重采样的采样频率F'小于原始信号采样频率F，采样后的信号记为^，其长度记为UU =L /F。将Y分为不重叠的P帧，第i帧记为 Ar ,,
[0031] (3)对A' i进行DCT，所得系数记为D1= 彡j彡L' /P};取前M个系数并记为 Gi，Gi = {g i, j I gi, j = d i, jl < j < M}，M < < L ' /P。Gi 既是弟 i 帧 A ;压缩后的{曰可。信号压缩过程如图1所示。
[0032] 2、嵌入帧号和压缩信号：
[0033] (1)将 Aj为 4 段，分别记为 Al JPAS1 的长为 N，A3 JPA4^ 长为6M。将A3JP A4 i等分为M个子段，每个子段含有6个样本点，第j个子段记为33/和 AA： . I ^ j ^ M0
[0034] ⑵第i帧帧号i表示为Yi= {y ^ y2,…，yN} 作为第i帧的标识。Y i中的各元素可以由下式得到：
[0035] i = Y1 · 10N ^y2IOn 2+··· +yN
[0036] 记Ali的前N个样本点为al ^al2, "·，α1Ν。用y^y；；，"·，γΝ依次代替这N个样本点的倒数第二位的整数值，以此来完成Y 1的嵌入。用同样的方法将Y i嵌入到Α2 i中。
[0037] (3)对压缩信号G1 (1彡i彡P)采用混沌地址索引的方法进行置乱。混沌序列由下式Logistic混沌映射生成，其中X。表示混沌序列的初值。
[0038] χ1+1= μ X J (I-X1), 3. 5699 μ 4
[0039] 记X = U11 I = 1, 2,…，Ρ}，将X1Q彡1彡Ρ)按照下式从大到小排列，其中c(l)

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张帆;刘正辉;王静;何俊杰;祁传达;
技术所有人：信阳师范学院;
我是此专利的发明人

上一篇：一种基于智能终端的实时变声方法
上一篇：使用对齐的前瞻部分将音频信号编码及解码的装置与方法