一种基于量化特性的语音篡改定位检测方法_3

文档序号：9930284阅读：来源：国知局

频谱系数大量减少，因此非零频谱系数的个数就无法体现量化特性，进而不能进行帖偏移的检测。在本发明的检测方法中深入分析量化环节:每一帖进行量化时会使用一个Stepsize(量化步长），对每一个频线量化过程都是一致的。而频线的分布是按照低到高排列，运是因为在编码的时候能够W区域编码（即大值区，小值区，零值区），因此在频线的后部分基本都是零值区，而频谱系数的零值在量化过程无法体现量化特性，因而只需考虑频线前部分的低频部分的量化特性。在本发明的测试中取前面16个频带，刚好是整个频线总数的一半。如图4所示左边是码率为128kbps时，可W看出在删除位置的前部分仍然是保持在零值附近波动，在篡改位置之后也发生了较大的偏离，可W很明显的辨别篡改位置;在19化bps压缩时也能反映出该特征，也可W很清楚的辨别篡改位置。然后将两者对比会发现，码率越高偏离零值位置越近，运种差异性会减少。正如前述的分析随着码率增加编码使用的比特数会越多，会保留更多的频谱细节，使得频谱系数的值更精确，从而使得该特征的量化特性表现的越来越不明显。
[0041] 本发明的检测方法描述为了能够简便的检测篡改位置，本发明将检测过程描述如下：步骤一、选取给定的包含L个样本的语音信号X，将X划分为每帖1152个样本，每帖有 50%的重叠，因此一共有
帖，
，其中F表示lame3.99.5编码器中分帖和加窗函数操作；步骤二、应用滤波器组和MDCT到每一帖，W获取其频谱系数
其中ir表示lame3.99.5编码器中滤波器组和MDCT，年i表示第If帖的频谱，每帖包含576个频谱系数；
其中r表示提取每帖频谱系数中值为O和±i矿S的个数，记为；% 步骤S、对的每一个频谱系数用取按適，进行如下公式量化：
書表示第击帖中第/个频谱系数，麵说表示量化的第若帖第/个频谱系数，用货i 表示第1帖的量化频谱系数；步骤四、将获取的量化频谱系数耶，应用护函数获取每帖中值为O的个数记为好印，终二巧單)；j二化2，...，iv-1，并计算
步骤五、最后计算
其中find函数表示浆中值不等于加时返回索引值;冉表示设置的阔值，在实验中设置为 4,也即表示返回没有连续出现4个值为O值的位置，其中设置检测时滑动框数量为6个单位，表示检测的精度在6/2帖的范围，也即检测误差为3帖，经过计算并最终确认语音文件的篡改定位。
[0042]实验结果分析 1.样本库和实验环境本发明的测试的环境是在化Z820计算机上，处理器为Xeon(R) CPU E5-2609 V2 2.50G化内存64G 64位操作系统;MATLAB2012版64位。样本库来自600个3s长的wav语音片段，采样率为44 . IkHz，单声道。使用LAME3.99.5对运些语音片段进行编码，编码码率为 3化bps，64k:bps，9化bps，128kbps，19化bps，25化bps。设置300个正样本和300个负样本，分别对300个负样本进行删除、插入、拼接篡改操作。篡改的位置点使用MA化AB自带的rand函数随机产生，并记录篡改的位置。应用本发明的检测方法进行篡改位置的定位检测。同时，本发明定义虚警率为将未篡改的判断为篡改语音的比例，漏检率为将篡改的认为是未篡改语音的比例，分别记为./；和。正确检测率A喊日下公式计算：
式中， f,--虚警率为将未篡改的判断为篡改语音的比例； L一一漏检率为将篡改的认为是未篡改语音的比例。
[0043] 2.检测准确率实际的检测结果如表2所示，表2.不同码率下不同篡改操作的检测准确率
从表2中可W看出前面码率在32-192化PS时检测的准确率基本都在99%W上，而码率在 256化PS时却出现了明显的降低，运和本发明前面的分析一样，随着码率的增加 Ac-Qc之间的差异随着减小，因此会导致当压缩码率达到一定程度时会出现检测率下降的情况。
[0044] 3.对比实验检测准确率的对比本发明将自建的样本库应用帖偏移进行篡改定位，对篡改定位的准确性进行测试，测试结果如表3所示，从表3中可W看出实际准确率基本都在90%W上，而且准确率波动的范围也较大，分析其原因是因为篡改位置是随机产生，而本发明观察造成检测错误的原因是由于篡改的位置在开始端前几帖，起始位置在实验中往往W奇异值存在，对帖偏移量的检测有一定的干扰，因此造成定位的错误；另外，帖偏移进行篡改定位在码率达到12別寸就无法检测，其原因是因为当码率达到一定程度时，非零频谱系数间的差异很小，使得帖偏移的检测出现错误，在帖偏移不准确的情况下，就无法利用帖偏移进行定位检测。
[0045] 表3.化ng帖偏移检测篡改的准确率
算法复杂度上对比为了比较两种方法在计算的复杂度的区别，将检测过程如图5所示描述： 1.化ng的帖偏移检测复杂度近似为：
5%/i:表示样本应用576个不同的偏移量；巧拉,表示对576个样本进行MDCT并提取MDCT 系数；576.f;两个分别表示对576个样本进行非零频谱个数的统计和计算实际帖的偏移量，《4表示应用帖偏移进行篡改定位。
[0046] 2.本发明的检测方法的复杂度近似为：
4表示进行经过MDCT和量化并提取频谱系数和量化频谱系数；表示计算Ac和化。^ 表示定位篡改位置。
[0047] 从理论上分析对比两者的复杂度，帖偏移的方法整体上近似是本发明检测方法的 576倍，但是本发明多了一个量化过程，因此实际复杂度应略小于576倍。然而本发明分别统计其实际运行时间;化ng运行时间为628.917s，本发明的运行时间为1.314s，可W知道Yang 的运行时间是本发明的478.628倍，与本发明前面的理论分析时间相近。运说明本发明的检测方法在效率上明显优于帖偏移方法。
[004引最后，本发明提出的检测方法是在帖偏移的方法的原理上进行改进，运用零值样本量化特性体现帖偏移的量化特征，其实验结果表明本发明的检测方法在检测率上也非常高，更为突出的贡献是进一步解决了帖偏移无法检测的高码率情况。其次在算法的复杂度上也极大的降低，因为无需进行帖偏移检测，可W避免应用不同的偏移量区检测实际偏移量。
【主权项】
1. 一种基于量化特性的语音篡改定位检测方法，其特征在于该语音篡改定位检测方法包括如下步骤：步骤一、选取给定的包含L个样本的语音信号X，将X划分为每帧1152个样本，每帧有50% 的重叠，因此一共有闲57S J-1帧， [.? s ，?…] = H，其中F表示分帧和加窗函数操作；步骤二、应用滤波器组和MDCT到每一帧，以获取其频谱系数 ^ = Mix：} i = 友-i，其中JT表示滤波器组和MDCT，A表示第?帧的频谱，每帧包含576个频谱系数； = Ti S^ i 二.0，1,. 2.,…，?￥ - 1，其中Γ表示提取每帧频谱系数中值为0和的个数，记为；步骤三、对A的每一个频谱系数用_;>，进行如下公式量化：g篇表示第f帧中第/个频谱系数，相^:表示量化的第i]帧第/个频谱系数，用#,表示第i帧的量化频谱系数；步骤四、将获取的量化频谱系数?，应用土'函数获取每帧中值为〇的个数记为你,-，〇?=γ(^ι bau..-ν-ι，并计算（二」- pc:; 步骤五、最后计算其中find函数表示;；r中值不等于0时返回索引值;政表示设置的阈值，在实验中设置为 4,也即表示返回没有连续出现4个值为0值的位置，其中设置检测时滑动框数量为6个单位，表示检测的精度在6/2帧的范围，也即检测误差为3帧，经过计算并最终确认语音文件的篡改定位。2. 根据权利要求1所述的一种基于量化特性的语音篡改定位检测方法，其特征在于所述的语音篡改定位检测方法的ιΗ确检测率AR桉照如下公式i+筧：式中， fP一一虚警率为将未篡改的判断为篡改语音的比例； ./；.一一漏检率为将篡改的认为是未篡改语音的比例。
【专利摘要】本发明公开了一种基于量化特性的语音篡改定位检测方法，主要是基于现有技术中帧偏移的MP3篡改定位检测算法进行的深入研究，并提出一种更新的检测方法用于描述量化特性，这种检测方法无需进行帧偏移检测，故能避免计算帧偏移带来的计算复杂性，极大降低了计算的复杂度，同时还解决了帧偏移无法检测的高码率情况，实验结果表明这种检测方法具有较高的检测准确率。
【IPC分类】G10L25/48
【公开号】CN105719660
【申请号】CN201610038523
【发明人】王让定, 陶表犁, 严迪群, 金超, 周劲蕾
【申请人】宁波大学
【公开日】2016年6月29日
【申请日】2016年1月21日

完整全部详细技术资料下载

当前第3页1 2 3