一种与时长相关的相同码率mp3双压缩检测方法

文档序号:9752209阅读:595来源:国知局
一种与时长相关的相同码率mp3双压缩检测方法
【技术领域】
[0001] 本发明涉及一种语音双压缩检测技术,尤其是涉及一种与时长相关的相同码率 mp3双压缩检测方法。
【背景技术】
[0002] 随着数字技术和互联网技术的飞速发展,数字多媒体在日常生活中得到了广泛的 应用,人们可以很便捷的获得自己想要的多媒体。但是,任何先进的技术都存在两面性,数 字技术亦如此,它虽然丰富了人们的精神文化生活,方便了人们之间的交流沟通,让人们因 掌握了新的技术而受益,但是由于数字技术容易被人们有意无意地操纵,这样就会导致一 些人利用数字技术进行信息的篡改,从而给社会造成伤害,因此数字取证技术孕育而生。数 字语音作为数字多媒体重要的一部分,在数字取证技术中占有重要地位。数字语音取证技 术中较为突出的是数字语音篡改取证技术,数字语音篡改取证对数字语音内容的完整性和 真实性验证具有重要意义。然而,如果数字语音发生了篡改操作,则不可避免的会产生数字 语音的双压缩。因此,数字语音的双压缩检测也具有重要意义。
[0003] mp3语音是目前最为流行的语音格式之一,mp3语音采用MPEG-ι第三层语音标准压 缩,从其发展至今的十多年来,以其近CD的音质、高压缩比、开放性和易用性深受好评,在因 特网上广为流行,相应的编解码软件和硬件设备也不断涌现,深深地冲击着数字语音压缩 领域。mp3语音文件的篡改会经历双压缩过程,因为mp3语音文件进行篡改前必须将原始的 mp3语音解压到时域,然后在时域对语音数据进行一些篡改操作,例如插入、删除、拼接等操 作,最后将进行篡改过的时域数据再次压缩成mp3语音,如图1所示。
[0004] 如果原始的mp3语音是经过一次压缩形成的,那么篡改过的mp3语音就经历了双压 缩。因此,如果有方法能够对mp3语音的双压缩进行检测,那么也就能够检测出这种mp3语音 可能经过了篡改。
[0005] 在图像和视频的双压缩检测方面有很多学者进行了大量的研究,对mp3音频的双 压缩检测研究也有学者做了一些工作,通常他们研究的背景是为了检测假音质问题,也即 检测原始低码率的音频以高码率压缩的情况。如:Yang R, Shi Y Q,Huang J. Defeating fake-quality MP3[J].Mm&Sec Proceedings of Acm Workshop on Multimedia& Security ,2009:117-124(杨锐,黄继武.假音质MP3检测[J]. ACM多媒体安全与研讨会 .2009 :117-124)提出了一种检测假音质的方法,其首先通过分析低码率音频非零MDCT (modified discrete cosine transform,修正离散余弦变换)系数较少的特征,提出一种 统计MDCT系数中值为0, ±1,±2, ±3, ±4的个数作为特征,运用机器学习的方法进行分类, 结果表明该方法具有较好的检测效果。又如:Yu X,Wang R,Yan D,et al .Detecting Fake-Quality MP3based on Huffman Table Index[J]· Journal of Software, 2014,9(4)( 余先 敏,王让定,严迪群.基于哈夫曼码表索引的假音质检测.软件期刊,2014.9(4))提出了一种 利用哈夫曼码表索引的假音质检测方法,该方法也具有较好的检测效果。
[0006] Yang R,Shi Y Q,Huang J.Detecting double compression of audio signal.
[J] .Proc Spie,2010,7541: 75410K-75410K-10(杨锐,黄继武·双压缩音频信号检测[J] ? SPIE会议.2010,7541:75410K-75410K-10)提出的一种双压缩检测通过二次压缩语音的 MDCT系数在(-1~1)间的个数要少于单次压缩语音,利用Benford定律以及帧偏移来检测语 音信号是否经过双压缩,结果显示该方法对低码率向高码率转换的mp3二次压缩具有较高 的检测效果,然而当高码率向低码率转换或者相同码率下的检测效果较差。Liu Q,Sung A H,Qiao Μ.Detection of Double MP3Compression[J].Cognitive Computation,2010,2 (4) :291-296(Liu Q,Sung A H,Qiao M.MP3双压缩检测[J]认知计算,2010,2(4) :291-296) 提出了用非零MDCT系数的数量、它们之间的平均距离、零系数和非零系数的分布作为特征 来区分单次压缩和双压缩,该方法对高码率转低码率,或者低码率转高码率都有较好的检 测效果。Da Luo,Weiqi Luo,Rui Yang,J iwu Huang.Compression history identification for digital audio signal[C]IEEE International Conference on Acoustics,Speech and Signal Processing,2012:1733-1736(罗达,胳伟棋,杨锐,黄继 武.数字音频信号压缩历史检测[J]. IEEE国际声学会议,语音信号处理,2012:1733-1736) 提出的音频压缩历史检测通过提取MDCT系数的零值个数和梅尔倒谱系数(MFCC)作为特征 对wav音频的压缩历史进行检测,检测其是否经过mp3压缩,并能检测其压缩的比特率。
[0007] 目前,语音的双压缩检测基本都是集中在不同码率压缩的检测研究上,然而在对 语音内容的真实性研究中,篡改者对语音内容进行篡改伪造操作之后往往都以原始相同的 码率保存,这样使得伪造的程度更高,检测的难度越大。因此实际中对相同码率的双压缩检 测具有重要意义。当前,只有少量的工作针对相同码率压缩的检测。如:余先敏,王让定,严 迪群,等.基于相同压缩速率下的MP3双压缩检测方法[J].计算机工程与应用,2013,第12期 (12) :93-96中提出的一种相同码率的双压缩检测方法,其利用相邻两次压缩过程中QMDCT (量化的修正离散余弦变换)系数不相同的个数作为依据,并将多次做差的值作为特征利用 支持向量机进行分类,实验结果表明该方法具有较好的检测效果。又如:Ma P F,Wang R, Yan D,et al.Detecting Double-compressed MP3with the Same Bit-rate[J].Journal of Software,2014,9(10)(马鹏飞,王让定,严迪群.相同码率的MP3双压缩检测[J].软件期 刊,2014.9(10))提出的一种利用比例因子特征的mp3相同码率双压缩检测方法,其将mp3编 码过程中长窗的比例因子带矩阵作为特征送到训练好的支持向量机中进行检测,结果表明 该方法具有较好的检测效果。上述两种方法虽然对相同码率双压缩具有一定的检测效果, 但是这两种方法仅仅考虑了检测准确率与压缩码率的关系,研究的对象过于单一,并没有 考虑到语音长度也是影响检测准确率的重要因素,而实验表明不同时长的语音的检测准确 率存在明显差异,这两种方法都忽略了双压缩检测的一个重要因素,因此有必要研究一种 考虑时长的语音双压缩检测技术。

【发明内容】

[0008] 本发明所要解决的技术问题是提供一种检测准确率高且检测复杂性低的与时长 相关的相同码率mp3双压缩检测方法。
[0009] 本发明解决上述技术问题所采用的技术方案为:一种与时长相关的相同码率mp3 双压缩检测方法,其特征在于包括以下步骤:
[00?0]①获取一个待检测的mp3语音,记为fr;
[0011] ②获取fr的时长和压缩码率,对应记为f和br,其中,f的单位为秒,br的单位为 kbps ;
[0012] ③利用具有编解码功能的mp3编码器对fr进行解码,得到wav语音,同时在解码过 程中提取出QMDCT系数矩阵,记为q1;
[0013]④利用步骤③中的mp3编码器以fr的压缩码率br对步骤③得到的wav语音进行编 码压缩,得到mp3语音,同时在编码压缩过程中提取出QMDCT系数矩阵,记为q2;
[0014]⑤计算qi与q2的差值矩阵,记为D,D = qi_
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1