一种面向mp3数字音频文件的重压缩检测方法

文档序号：2827647阅读：454来源：国知局

一种面向mp3数字音频文件的重压缩检测方法
【专利摘要】本发明公开了一种面向MP3数字音频文件的重压缩检测方法，采用模式分类技术进行MP3数字音频文件特征的提取，采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测。本发明提出基于校准的重压缩检测方法，利用原始音频与校准音频的平均每帧量化MDCT系数等于0~9值的个数的差值作为特征进行检测，实验结果表明，能够在很大程度上解决同比特率重压缩以及从高到低比特率重压缩检测的难题。不仅能够鉴别数字音频文件是否被压缩过，还能较准确地判定其原始压缩码率。从而为音频篡改检测提供依据。
【专利说明】一种面向MP3数字音频文件的重压缩检测方法

【技术领域】
[0001] 本发明属于数字媒体处理【技术领域】，涉及一种鉴定MP3数字音频信号是否经过重压缩的检测方法。技术背景：
[0002] 多媒体技术的数字化以及各式各样传输技术的进步，使得数字媒体应用迅速增长。这其中，录音设备的广泛使用更使得录音资料越来越多的出现在诉讼、维权、新闻报道和商业谈判等多个领域。由于只需使用普通的计算机就能方便地对音频信息加以修改，因此为保证录音的真实性，音频篡改检测技术便成为很多案例中引入音频证据的必要步骤。
[0003] 目前的数字音频取证技术是指通过分析数字音频的统计特性从而检测该数字音频所包含内容的真实性和完整性，其包括主动取证技术和被动取证技术。主动取证技术是通过预先向原始数字音频信息中嵌入验证信息来实现的，这些验证信息在现阶段主要指数字音频水印。被动取证不需要预先嵌入水印信息，对录音设备的要求大大降低，具有更强的实用性，发展空间更大。
[0004] 典型的音频篡改方式是使用功能强大的音频编辑软件将音频文件打开，然后进行某些处理，再重新保存。此过程经历了解码、篡改、压缩这三个步骤。若音频的格式是MP3 有损压缩格式，则这样的篡改方式会导致二次编码压缩。重压缩检测方法是针对数字音频信号压缩历史的分析方法，属于被动取证。它的目标是判断之前的音频是否被压缩过，可以作为一种判别音频原始性的辅助手段，与其他检测方法一起实现对音频篡改的鉴定。
[0005] 目前对MP3文件的重压缩检测算法在低比特率向高比特率重压缩时的情况，检测正确率较高；但是，当MP3文件是同比特率重压缩或者从高比特率向低比特率压缩时，其检测正确率较低。

【发明内容】

[0006] 为了解决上述的技术问题，本发明提供了一种面向MP3数字音频文件的重压缩检测方法。
[0007] 本发明所采用的技术方案是：一种面向MP3数字音频文件的重压缩检测方法，其特征在于：采用模式分类技术进行MP3数字音频文件特征的提取，采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测。
[0008] 作为优选，所述的采用模式分类技术进行MP3数字音频文件特征的提取，具体实现包括以下子步骤：
[0009] 步骤1. 1 :将MP3数字音频文件作为原始音频A，提取原始音频A的所有帧的量化后MDCT系数值XR ;
[0010] 步骤1.2:对原始音频A进行校准，得到校准音频A'，并提取校准音频A'的所有帧的量化后MDCT系数值XR';
[0011] 步骤1. 3 :将MP3数字音频文件的平均每帧量化MDCT系数等于0?9值的个数与其校准MP3数字音频文件的平均每帧量化MDCT系数等于0?9值的个数相减，其差值作为该MP3数字音频文件的特征。
[0012] 作为优选，所述的采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，具体实现包括以下子步骤：
[0013] 步骤2. 1 :提取训练音频样本特征，构造分类器模型，具体实现包括以下子步骤：
[0014] 步骤2. 1. 1 :输入训练样本集，训练样本集中的训练音频包括一次压缩音频和重压缩音频，对训练样本集中的所有音频都进行特征提取；
[0015] 步骤2. 1. 2 :利用LIBSVM对训练样本集中的重压缩音频及其所对应的一次压缩音频的特征进行二分类训练，此二分类训练使用的重压缩音频和一次压缩音频满足以下条件：在样本的放置中，重压缩音频的BR test等于一次压缩音频的BRtest，其中BRtest表示音频的当前码率；
[0016] 步骤2. 2 :利用分类器对待测MP3数字音频文件做是否重压缩鉴定，具体实现包括以下子步骤：
[0017] 步骤2. 2. 1 :提取待测音频十维特征；
[0018] 步骤2. 2. 2 :将该特征放入分类器训练过程得到的所对应的二分类器Model中进行分类预测，输出待测结果。
[0019] 作为优选，所述的采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测，具体实现包括以下子步骤：
[0020] 步骤3. 1 :提取训练音频样本特征，构造分类器模型；具体实现包括以下子步骤：
[0021] 步骤3. 1. 1 :输入训练样本集，训练样本集中的训练音频包括一次压缩音频和重压缩音频，对训练样本集中的所有音频都进行特征提取；
[0022] 步骤3. 1. 2 :利用LIBSVM多分类选取样本集中的重压缩音频和一次压缩音频特征做分类；
[0023] 步骤3. 2 :利用分类器对待测MP3数字音频文件做原始压缩码率判定，具体实现包括以下子步骤：
[0024] 步骤3. 2. 1 :提取待测音频十维特征；
[0025] 步骤3. 2. 2 :将该特征放入分类器训练过程得到的所对应的多分类器Model中进行原始码率的预测，输出待测结果。
[0026] 本发明根据现有被动检测算法针对数字压缩音频篡改检测的不足，提出了一种面向MP3数字音频文件的重压缩检测方法，可满足个人、集体等对MP3音频篡改的检测需求，保证音频内容的真实性和完整性，为司法中音频证据的有效性提供技术支持。
[0027] 与现有技术相比，本发明的优越性在于：提出基于校准的重压缩检测方法，利用原始音频与校准音频的平均每帧量化MDCT系数等于0?9值的个数的差值作为特征进行检测，实验结果表明，能够在很大程度上解决同比特率重压缩以及从高到低比特率重压缩检测的难题。不仅能够鉴别数字音频文件是否被压缩过，还能较准确地判定其原始压缩码率。从而为音频篡改检测提供依据。

【专利附图】

【附图说明】
[0028] 图1 :是本发明现有技术的MP3编解码流程图；
[0029] 图2 :是本发明实施例的流程图；
[0030] 图3 :是本发明实施例的本发明的特征提取流程图；
[0031] 图4-1 :是本发明实施例的原始音频（32kbps->96kbps)重压缩校准前重压缩直方图；
[0032] 图4-2 :是本发明实施例的原始音频（32kbps->96kbps)重压缩校准后重压缩直方图；
[0033] 图4-3 :是本发明实施例的原始音频（32kbps->96kbps)重压缩校准前后直方图差值曲线；
[0034] 图5-1 :是本发明实施例的原始音频（96kbps)单次压缩校准前直方图；
[0035] 图5-2 :是本发明实施例的原始音频（96kbps)单次压缩校准后直方图；
[0036] 图5-3 :是本发明实施例的原始音频（96kbps)单次压缩校准前后直方图差值曲线。

【具体实施方式】
[0037] 为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。
[0038] 首先，对本技术方案中出现的相关术语进行如下统一解释：
[0039] 压缩音频：指经过有损压缩的音频，如MP3、WMA文件均为有损压缩；
[0040] 一次压缩MP3 :指由原始PCM信号经MP3编码器一次编码压缩的MP3音频文件；
[0041] 重压缩MP3 :原始MP3音频解压为PCM信号，再以相同码率或不同码率重新压缩为 MP3音频的过程；
[0042] 量化后MDCT系数：通过量化处理后的MDCT系数值，在MP3解码过程中提取，位于哈夫曼解码之后；
[0043] MP3校准：将原始MP3音频经过MP3解码器解压为WAV数据，删除起始200个采样点，再用MP3编码器重新压缩为与原始码率相同的MP3的过程；
[0044] LIBSVM多分类：米用一对一法（one-versus-one，简称Ι-ν-lSVMs)进行多类分类。其做法是在任意两类样本之间设计一个SVM，因此k个类别的样本就需要设计k (k-1) /2 个SVM。当对一个未知样本进行分类时，最后得票最多的类别即为该未知样本的类别。
[0045] 本发明的重压缩检测方法是基于MPEG-lAudio Layer3(MP3)标准的压缩过程，请见图1，为MP3的编解码原理；编码时，输入的声音信号经过32个子带滤波器并进行MDCT 变换。压缩过程根据心理声学模型的规则对MDCT系数进行量化。量化过程导致连续分布的MDCT系数值变为离散分布的MDCT系数值。这个过程会把不同频段的系数进行压缩，通常部分高频和中高频段的系数会压缩的更明显，使得这部分会出现更多零的系数。量化编码使用一个三层迭代循环模型来实现比特分配和量化。这三层包括：帧循环，外层循环和内层循环。哈夫曼编码对量化的最大值进行限制，若超过限制，则增大量化步长重新进行量化。解码是编码的反过程，具体过程可概括为：哈夫曼解码、逆量化处理、頂DCT变换、子带合成、PCM信号输出。本发明的量化后MDCT系数即是在MP3的哈夫曼解码过程中提取。
[0046] 请见图2,本发明所采用的技术方案是：一种面向MP3数字音频文件的重压缩检测方法，采用模式分类技术进行MP3数字音频文件特征的提取，采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测。
[0047] 请见图3,本实施例的提出了基于校准的量化后MDCT系数统计特性的重压缩检测特征，采用模式分类技术进行MP3数字音频文件特征Λ F的提取，具体实现包括以下子步骤：
[0048] 步骤1. 1 :将MP3数字音频文件作为原始音频Α，提取原始音频Α的所有帧的量化后MDCT系数值XR ;
[0049]

【权利要求】
1. 一种面向MP3数字音频文件的重压缩检测方法，其特征在于：采用模式分类技术进行MP3数字音频文件特征的提取，采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测。
2. 根据权利要求1所述的面向MP3数字音频文件的重压缩检测方法，其特征在于：所述的采用模式分类技术进行MP3数字音频文件特征的提取，具体实现包括以下子步骤：步骤1. 1 :将MP3数字音频文件作为原始音频A，提取原始音频A的所有帧的量化后 MDCT系数值XR ; 步骤1. 2 :对原始音频A进行校准，得到校准音频A'，并提取校准音频A'的所有帧的量化后MDCT系数值XR'; 步骤1. 3 :将MP3数字音频文件的平均每帧量化MDCT系数等于0?9值的个数与其校准MP3数字音频文件的平均每帧量化MDCT系数等于0?9值的个数相减，其差值作为该 MP3数字音频文件的特征。
3. 根据权利要求1所述的面向MP3数字音频文件的重压缩检测方法，其特征在于：所述的采用分类器训练和重压缩判定进行MP3数字音频文件重压缩检测，具体实现包括以下子步骤：步骤2. 1 :提取训练音频样本特征，构造分类器模型，具体实现包括以下子步骤：步骤2. 1. 1 :输入训练样本集，训练样本集中的训练音频包括一次压缩音频和重压缩音频，对训练样本集中的所有音频都进行特征提取；步骤2. 1. 2 :利用LIBSVM对训练样本集中的重压缩音频及其所对应的一次压缩音频的特征进行二分类训练，此二分类训练使用的重压缩音频和一次压缩音频满足以下条件：在样本的放置中，重压缩音频的BRtest等于一次压缩音频的BR test，其中BRtest表示音频的当前码率；步骤2. 2 :利用分类器对待测MP3数字音频文件做是否重压缩鉴定，具体实现包括以下子步骤：步骤2. 2. 1 :提取待测音频十维特征；步骤2. 2. 2 :将该特征放入分类器训练过程得到的所对应的二分类器Model中进行分类预测，输出待测结果。
4. 根据权利要求1所述的面向MP3数字音频文件的重压缩检测方法，其特征在于：所述的采用分类器训练和原始码率判定进行MP3数字音频文件原始码率检测，具体实现包括以下子步骤：步骤3. 1 :提取训练音频样本特征，构造分类器模型；具体实现包括以下子步骤：步骤3. 1. 1 :输入训练样本集，训练样本集中的训练音频包括一次压缩音频和重压缩音频，对训练样本集中的所有音频都进行特征提取；步骤3. 1. 2 :利用LIBSVM多分类选取样本集中的重压缩音频和一次压缩音频特征做分类；步骤3. 2 :利用分类器对待测MP3数字音频文件做原始压缩码率判定，具体实现包括以下子步骤：步骤3. 2. 1 :提取待测音频十维特征；步骤3. 2. 2 :将该特征放入分类器训练过程得到的所对应的多分类器Model中进行原始码率的预测，输出待测结果。
【文档编号】G10L15/10GK104123935SQ201410338396
【公开日】2014年10月29日申请日期:2014年7月16日优先权日:2014年7月16日
【发明者】任延珍, 范梦迪, 高雄智, 吴兴超, 赵思寒申请人:武汉大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：任延珍;范梦迪;高雄智;吴兴超;赵思寒
技术所有人：武汉大学
我是此专利的发明人

上一篇：一种基于稀疏分解的音频噪声实时检测方法
上一篇：语音识别方法、装置和蓝牙耳的制造方法