一种mp3音频压缩历史检测方法

文档序号:9351142阅读:698来源:国知局
一种mp3音频压缩历史检测方法
【技术领域】
[0001] 本发明涉及一种数字音频取证方法,尤其是涉及一种MP3音频压缩历史检测方 法。
【背景技术】
[0002] 随着多媒体技术的不断发展,各种多媒体编辑软件应运而生,例如CoolEditPro、 GoldWave等。这些多媒体编辑软件的产生对完善多媒体信息、增强多媒体信息的视听效果 具有重要意义。但是,多媒体编辑软件给人们生活带来便利的同时也带来了一些负面的影 响,例如一些不法分子为达到不可告人的目的,通过操作多媒体编辑软件对多媒体信息进 行各种篡改和伪造,由于这些篡改和伪造往往具有恶意性且不易被察觉,因此会对个人乃 至国家的安全造成威胁,会严重影响社会稳定。
[0003] 音频是多媒体信息中的重要组成部分,它具有易获取、便于存储等特点。MP3作为 当今网络上最流行的音频格式,判定MP3音频是否被篡改是目前急需解决的问题。由于音 频的篡改必须在非压缩域的格式中才能有效进行,因此对压缩域音频如MP3音频的篡改就 必须先将其解压成非压缩域的WAV音频,然后才能对该WAV音频进行增加、删除、剪切、拼接 等其他篡改操作,最后再将篡改后的WAV音频压缩成MP3音频。从这一系列的篡改操作过 程中可以发现,被篡改的MP3音频必然经历过多次压缩解压的过程,因此通过研究MP3音频 的压缩历史,可以有效推测MP3音频是否有被篡改。而目前压缩历史检测研究主要针对图 像领域,且音频压缩历史检测研究主要针对MP3音频双压缩检测,对MP3音频两次以上的压 缩历史检测关注甚少。

【发明内容】

[0004] 本发明所要解决的技术问题是提供一种MP3音频压缩历史检测方法,其能够有效 地检测出MP3音频的压缩历史,即能够准确地确定待测MP3音频是经过一次、二次或者是三 次压缩的MP3音频。
[0005] 本发明解决上述技术问题所采用的技术方案为:一种MP3音频压缩历史检测方 法,其特征在于包括以下步骤:
[0006] ①选取N个风格不同且未压缩的WAV音频样本,其中,N彡10 ;
[0007] ②获取与每个未压缩的WAV音频样本对应的一次压缩MP3音频样本,具体过程为: 利用MP3编码器对每个未压缩的WAV音频样本进行压缩编码,得到每个未压缩的WAV音频 样本经过一次压缩后形成的一次压缩MP3音频样本;
[0008] ③获取与每个未压缩的WAV音频样本对应的二次压缩MP3音频样本,具体过程为: ③-1、利用MP3编码器对每个未压缩的WAV音频样本进行压缩编码,得到每个未压缩的WAV 音频样本经过一次压缩后形成的一次压缩MP3音频样本,再利用MP3解码器将得到的每个 一次压缩MP3音频样本解压成WAV音频样本;③-2、利用MP3编码器对步骤③-1中解压成 的每个WAV音频样本进行压缩编码,得到与每个未压缩的WAV音频样本对应的二次压缩MP3 音频样本;
[0009] 其中,所述的步骤③-1和所述的步骤③-2中使用的MP3编码器均与所述的步骤 ②中使用的MP3编码器相同,且所述的步骤③-1中的MP3编码器的编码比特率与所述的步 骤②中的MP3编码器的编码比特率相同或不相同,所述的步骤③-2中的MP3编码器的编码 比特率与所述的步骤②中的MP3编码器的编码比特率相同;
[0010] ④获取与每个未压缩的WAV音频样本对应的三次压缩MP3音频样本,具体过程为: ④-1、利用MP3编码器对每个未压缩的WAV音频样本进行压缩编码,得到每个未压缩的WAV 音频样本经过一次压缩后形成的一次压缩MP3音频样本,再利用MP3解码器将得到的每个 一次压缩MP3音频样本解压成WAV音频样本;④-2、利用MP3编码器对步骤④-1中解压成 的每个WAV音频样本进行压缩编码,得到与每个未压缩的WAV音频样本对应的二次压缩MP3 音频样本,再利用MP3解码器将得到的每个二次压缩MP3音频样本解压成WAV音频样本; ④-3、利用MP3编码器对步骤④-2中解压成的每个WAV音频样本进行压缩编码,得到与每 个未压缩的WAV音频样本对应的三次压缩MP3音频样本;
[0011] 其中,所述的步骤④-1、所述的步骤④-2和所述的步骤④-3中使用的MP3编码 器均与所述的步骤②中使用的MP3编码器相同,所述的步骤④-1和所述的步骤④-2中使 用的MP3解码器均与所述的步骤③-1中使用的MP3解码器相同,且所述的步骤④-1中的 MP3编码器的编码比特率与所述的步骤③-1中的MP3编码器的编码比特率相同,所述的步 骤④-2和所述的步骤④-3中的MP3编码器的编码比特率均与所述的步骤③-2中的MP3 编码器的编码比特率相同;
[0012] ⑤将每个一次压缩MP3音频样本标记为-1,将每个二次压缩MP3音频样本标记为 〇,将每个三次压缩MP3音频样本标记为1,再将所有的一次压缩MP3音频样本、所有的二次 压缩MP3音频样本及所有的三次压缩MP3音频样本构成一个训练样本集合,其中,训练样本 集合中的每个子样本为一次压缩MP3音频样本或为二次压缩MP3音频样本或为三次压缩 MP3音频样本;
[0013] ⑥提取出训练样本集合中的每个子样本的47个特征值,并将训练样本集合中的 每个子样本的47个特征值构成一个行向量,将训练样本集合中的第k个子样本的47个特 征值构成的行向量记为Fk;然后采用min-max归一化方法对训练样本集合中的每个子样本 的47个特征值进行归一化处理,得到训练样本集合中的每个子样本的47个归一化处理后 的特征值;其中,k的初始值为1,I<k<K,K表示训练样本集合中包含的子样本的总个 数,K= 3N;
[0014] ⑦利用LibSVM分类器对训练样本集合中的所有子样本各自的47个归一化处理后 的特征值进行训练,得到训练模板;其中,训练过程中采用交叉验证方式在[2 5, 25]区间内 选取最佳惩罚参数c和最佳RBF核参数g,其余参数均使用默认值;
[0015] ⑧任意选取M个待检测MP3音频,其中,M多1,每个待检测MP3音频为一次压缩 MP3音频或为二次压缩MP3音频或为三次压缩MP3音频,且每个待检测MP3音频的获取过程 中最后一次压缩编码所使用的MP3编码器的编码比特率与训练样本集合中的子样本的获 取过程中最后一次压缩编码所使用的MP3编码器的编码比特率相同;然后按照步骤⑥中提 取出训练样本集合中的每个子样本的47个特征值的过程,以相同的方式提取出每个待检 测MP3音频的47个特征值;接着采用min-max归一化方法对每个待检测MP3音频的47个 特征值进行归一化处理,得到每个待检测MP3音频的47个归一化处理后的特征值;再将每 个待检测MP3音频的47个归一化处理后的特征值输入到训练模板中进行检测,如果训练模 板的输出结果为-1,则确定对应的待检测MP3音频为一次压缩MP3音频,如果训练模板的输 出结果为〇,则确定对应的待检测MP3音频为二次压缩MP3音频,如果训练模板的输出结果 为1,则确定对应的待检测MP3音频为三次压缩MP3音频。
[0016] 所述的步骤⑥中Fk的获取过程为:
[0017] ⑥-1、将训练样本集合中的第k个子样本中利用长窗编码方式进行处理的帧定义 为长窗编码帧;然后利用步骤③-1中所使用的MP3解码器对训练样本集合中的第k个子样 本中的每帧进行解码处理,得到训练样本集合中的第k个子样本解码后的WAV音频,在解码 处理过程中,提取出训练样本集合中的第k个子样本中的每帧长窗编码帧的位置;接着根 据训练样本集合中的第k个子样本中的每帧长窗编码帧的位置,获取训练样本集合中的第 k个子样本中的所有长窗编码帧的位置的比例因子矩阵,记为Sfa,其中,如果训练样本集合 中的第k个子样本为单声道音频,则奸3的维数为2wX21,如果训练样本集合中的第k个子 样本为双声道音频,则维数为4wX21,w表示训练样本集合中的第k个子样本中的长 窗编码帧的总帧数;
[0018] ⑥-2、利用步骤②中所使用的MP3编码器对步骤⑥-1中得到的解码后的WAV音频 进行编码处理,得到新的MP3音频,在编码处理过程中,根据步骤⑥-1中提取出的训练样本 集合中的第k个子样本中的每帧长窗编码帧的位置,获取步骤⑥-1中得到的解码后的WAV 音频在编码处理过程中的所有长窗编码帧的位置的比例因子矩阵,记为sfb,其中,本步骤 中的MP3编码器的编码比特率与训练样本集合中的第k个子样本的获取过程中最后一次压 缩编码所使用的MP3编码器的编码比特率相同,如果训练样本集合中的第k个子样本为单 声道音频,则Sfb的维数为2wX21,如果训练样本集合中的第k个子样本为双声道音频,则 8&的维数为4wX21 ;
[0019] ⑥-3、计算sfa中的比例因子1至5转移为sfb中的比例因子0至3的转移概率矩 阵,记为P,其中,P的维数为5X4,P中的第1行第1列元素的值为sfa中的比例因子1转 移为sfb中的比例因子0的转移概率,P中的第1行第2列元素的值为sfa中的比例因子1 转移为Sfb中的比例因子1的转移概率,P中的第1行第3列元素的值为sfa中的比例因子 1转移为sfb中的比例因子2的转移概率,P中的第1行第4列元素的值为sfa中的比例因 子1转移为sfb中的比例因子3的转移概率,依次类推,P中的第5行第4列元素的值为sfa 中的比例因子5转移为sfb中的比例因子3的转移概率;然后将P中的20个元素的值按序 作为训练样本集合中的第k个子样本的前20个特征值;
[0020] ⑥_4、计算sf!^勺差值矩阵,记为Asf,Asf=sfa_sfb;然后计算Asf中 的所有元素的值的均值,将该均值作为训练样本集合中的第k个子样本的第21个特征值;
[0021] ⑥_5、计算sfa中的比例因子0至8的概率分布向量,记为。,其中,Aa的维数为 IX9, 4中的第1个元素的值为Sfa中的比例因子0的概率分布,仏中的第2个元素的值 为Sfa中的比例因子1的概率分布,依次类推,仏中的第9个元素的值为Sfa中的比例因子
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1