一种基于量化特性的语音篡改定位检测方法_3

文档序号:9930284阅读:来源:国知局
频谱系数大量减少,因此非零频谱系数的个数就无法体现量化 特性,进而不能进行帖偏移的检测。在本发明的检测方法中深入分析量化环节:每一帖进行 量化时会使用一个Stepsize(量化步长),对每一个频线量化过程都是一致的。而频线的分 布是按照低到高排列,运是因为在编码的时候能够W区域编码(即大值区,小值区,零值 区),因此在频线的后部分基本都是零值区,而频谱系数的零值在量化过程无法体现量化特 性,因而只需考虑频线前部分的低频部分的量化特性。在本发明的测试中取前面16个频带, 刚好是整个频线总数的一半。如图4所示左边是码率为128kbps时,可W看出在删除位置的 前部分仍然是保持在零值附近波动,在篡改位置之后也发生了较大的偏离,可W很明显的 辨别篡改位置;在19化bps压缩时也能反映出该特征,也可W很清楚的辨别篡改位置。然后 将两者对比会发现,码率越高偏离零值位置越近,运种差异性会减少。正如前述的分析随着 码率增加编码使用的比特数会越多,会保留更多的频谱细节,使得频谱系数的值更精确,从 而使得该特征的量化特性表现的越来越不明显。
[0041] 本发明的检测方法描述 为了能够简便的检测篡改位置,本发明将检测过程描述如下: 步骤一、选取给定的包含L个样本的语音信号X,将X划分为每帖1152个样本,每帖有 50%的重叠,因此一共有
帖,
,其中F表示lame3.99.5编码器中分帖和加窗函数操 作; 步骤二、应用滤波器组和MDCT到每一帖,W获取其频谱系数
其中ir表示lame3.99.5编码器中滤波器组和MDCT, 年i表示第If帖的频谱,每帖包含576个频谱系数;
其中r表示提取每帖频谱系数中值为O和±i矿S的个数,记为;% 步骤S、对的每一个频谱系数用取按適,进行如下公式量化:
書表示第击帖中第/个频谱系数,麵说表示量化的第若帖第/个频谱系数,用货i 表示第1帖的量化频谱系数; 步骤四、将获取的量化频谱系数耶,应用护函数获取每帖中值为O的个数记为好印, 终二巧單);j二化2,...,iv-1,并计算
步骤五、最后计算
其中find函数表示浆中值不等于加时返回索引值;冉表示设置的阔值,在实验中设置为 4,也即表示返回没有连续出现4个值为O值的位置,其中设置检测时滑动框数量为6个单位, 表示检测的精度在6/2帖的范围,也即检测误差为3帖,经过计算并最终确认语音文件的篡 改定位。
[0042]实验结果分析 1.样本库和实验环境 本发明的测试的环境是在化Z820计算机上,处理器为Xeon(R) CPU E5-2609 V2 2.50G化内存64G 64位操作系统;MATLAB2012版64位。样本库来自600个3s长的wav语音片 段,采样率为44 . IkHz,单声道。使用LAME3.99.5对运些语音片段进行编码,编码码率为 3化bps,64k:bps,9化bps,128kbps,19化bps,25化bps。设置300个正样本和300个负样本,分 别对300个负样本进行删除、插入、拼接篡改操作。篡改的位置点使用MA化AB自带的rand函 数随机产生,并记录篡改的位置。应用本发明的检测方法进行篡改位置的定位检测。同时, 本发明定义虚警率为将未篡改的判断为篡改语音的比例,漏检率为将篡改的认为是未篡改 语音的比例,分别记为./;和。正确检测率A喊日下公式计算:
式中, f,--虚警率为将未篡改的判断为篡改语音的比例; L一一漏检率为将篡改的认为是未篡改语音的比例。
[0043] 2.检测准确率 实际的检测结果如表2所示, 表2.不同码率下不同篡改操作的检测准确率
从表2中可W看出前面码率在32-192化PS时检测的准确率基本都在99%W上,而码率在 256化PS时却出现了明显的降低,运和本发明前面的分析一样,随着码率的增加 Ac-Qc之间 的差异随着减小,因此会导致当压缩码率达到一定程度时会出现检测率下降的情况。
[0044] 3.对比实验 检测准确率的对比 本发明将自建的样本库应用帖偏移进行篡改定位,对篡改定位的准确性进行测试,测 试结果如表3所示,从表3中可W看出实际准确率基本都在90%W上,而且准确率波动的范围 也较大,分析其原因是因为篡改位置是随机产生,而本发明观察造成检测错误的原因是由 于篡改的位置在开始端前几帖,起始位置在实验中往往W奇异值存在,对帖偏移量的检测 有一定的干扰,因此造成定位的错误;另外,帖偏移进行篡改定位在码率达到12別寸就无法 检测,其原因是因为当码率达到一定程度时,非零频谱系数间的差异很小,使得帖偏移的检 测出现错误,在帖偏移不准确的情况下,就无法利用帖偏移进行定位检测。
[0045] 表3.化ng帖偏移检测篡改的准确率
算法复杂度上对比 为了比较两种方法在计算的复杂度的区别,将检测过程如图5所示描述: 1.化ng的帖偏移检测复杂度近似为:
5%/i:表示样本应用576个不同的偏移量;巧拉,表示对576个样本进行MDCT并提取MDCT 系数;576.f;两个分别表示对576个样本进行非零频谱个数的统计和计算实际帖的偏移量, 《4表示应用帖偏移进行篡改定位。
[0046] 2.本发明的检测方法的复杂度近似为:
4表示进行经过MDCT和量化并提取频谱系数和量化频谱系数;表示计算Ac和化。^ 表示定位篡改位置。
[0047] 从理论上分析对比两者的复杂度,帖偏移的方法整体上近似是本发明检测方法的 576倍,但是本发明多了一个量化过程,因此实际复杂度应略小于576倍。然而本发明分别统 计其实际运行时间;化ng运行时间为628.917s,本发明的运行时间为1.314s,可W知道Yang 的运行时间是本发明的478.628倍,与本发明前面的理论分析时间相近。运说明本发明的检 测方法在效率上明显优于帖偏移方法。
[004引最后,本发明提出的检测方法是在帖偏移的方法的原理上进行改进,运用零值样 本量化特性体现帖偏移的量化特征,其实验结果表明本发明的检测方法在检测率上也非常 高,更为突出的贡献是进一步解决了帖偏移无法检测的高码率情况。其次在算法的复杂度 上也极大的降低,因为无需进行帖偏移检测,可W避免应用不同的偏移量区检测实际偏移 量。
【主权项】
1. 一种基于量化特性的语音篡改定位检测方法,其特征在于该语音篡改定位检测方法 包括如下步骤: 步骤一、选取给定的包含L个样本的语音信号X,将X划分为每帧1152个样本,每帧有50% 的重叠,因此一共有闲57S J-1帧, [.? s ,?…] = H,其中F表示分帧和加窗函数操作; 步骤二、应用滤波器组和MDCT到每一帧,以获取其频谱系数 ^ = Mix:} i = 友-i,其中JT表示滤波器组和MDCT,A表示第?帧的频 谱,每帧包含576个频谱系数; = Ti S^ i 二.0,1,. 2.,…,?¥ - 1, 其中Γ表示提取每帧频谱系数中值为0和的个数,记为; 步骤三、对A的每一个频谱系数用_;>,进行如下公式量化:g篇表示第f帧中第/个频谱系数,相^:表示量化的第i]帧第/个频谱系数,用#,表 示第i帧的量化频谱系数; 步骤四、将获取的量化频谱系数?,应用土'函数获取每帧中值为〇的个数记为你,-, 〇?=γ(^ι bau..-ν-ι,并计算(二」- pc:; 步骤五、最后计算其中find函数表示;;r中值不等于0时返回索引值;政表示设置的阈值,在实验中设置为 4,也即表示返回没有连续出现4个值为0值的位置,其中设置检测时滑动框数量为6个单位, 表示检测的精度在6/2帧的范围,也即检测误差为3帧,经过计算并最终确认语音文件的篡 改定位。2. 根据权利要求1所述的一种基于量化特性的语音篡改定位检测方法,其特征在于所 述的语音篡改定位检测方法的ιΗ确检测率AR桉照如下公式i+筧:式中, fP一一虚警率为将未篡改的判断为篡改语音的比例; ./;.一一漏检率为将篡改的认为是未篡改语音的比例。
【专利摘要】本发明公开了一种基于量化特性的语音篡改定位检测方法,主要是基于现有技术中帧偏移的MP3篡改定位检测算法进行的深入研究,并提出一种更新的检测方法用于描述量化特性,这种检测方法无需进行帧偏移检测,故能避免计算帧偏移带来的计算复杂性,极大降低了计算的复杂度,同时还解决了帧偏移无法检测的高码率情况,实验结果表明这种检测方法具有较高的检测准确率。
【IPC分类】G10L25/48
【公开号】CN105719660
【申请号】CN201610038523
【发明人】王让定, 陶表犁, 严迪群, 金超, 周劲蕾
【申请人】宁波大学
【公开日】2016年6月29日
【申请日】2016年1月21日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1