一种针对MP3Stego隐写后的音频的隐写检测方法

文档序号：2827832阅读：437来源：国知局

一种针对MP3Stego隐写后的音频的隐写检测方法
【专利摘要】本发明公开了一种针对MP3Stego隐写后的音频的隐写检测方法，其先将未隐写的MP3压缩音频和隐写MP3压缩音频构成样本库；然后对每个样本进行重压缩编码，获得每个样本的载体估计；接着提取每个样本中的每帧的量化后的MDCT系数，获取每个样本对应的第一系数矩阵，同样提取每个载体估计中的每帧的量化后的MDCT系数，获取每个载体估计对应的第二系数矩阵；再通过计算对应的第一系数矩阵与第二系数矩阵中对应列之间的Hausdorff距离值，得到每个样本的最终隐写分析特征行向量；之后通过SVM分类器训练得到训练模板；最后利用训练模板对待检测的MP3压缩音频进行检测；优点是能很准确地确定MP3压缩音频是否经过MP3Stego隐写，尤其在隐秘信息嵌入率较低的情况下依然能获得很高的检测效率。
【专利说明】-种针对MP3Stego隐写后的音频的隐写检测方法

【技术领域】
[0001] 本发明涉及一种隐写检测方法，尤其是涉及一种针对MP3Stego隐写后的音频的隐写检测方法。

【背景技术】
[0002] 隐写术是一种结合公开传播的多媒体文件的自身特点，将要传递的隐秘信息通过隐写算法隐藏到多媒体文件中的技术。隐写后的多媒体文件具有良好的不可感知性，在传输的过程中一般较难被检测出其携带的隐秘信息，只有隐写者指定的特定人群才能够从隐写后的多媒体文件中提取出隐秘信息。为防止不法分子将隐写术用于危害公共安全，需利用隐写检测技术对公开传播的多媒体文件进行检测，来判断公开传播的多媒体文件是否经过隐写。
[0003] 作为隐写载体的多媒体文件的格式主要有图像、文本、视频、音频等。音频文件因其近年来在互联网上广泛流传，已成为隐写者与隐写检测者关注的热点。MP3Stego是目前最典型并且应用最广泛的音频隐写工具。针对MP3Stego隐写音频，目前已有很多检测算法，但大多数针对MP3Stego隐写音频的检测算法都是直接提取作为隐秘信息嵌入点的音频中的每一帧的编码块长度或者其他编码参数，通过分析这些编码参数变化特点来检测音频是否经过MP3Stego隐写，然而由于音频风格变化存在多样性，因此会影响编码块长度或其他编码参数的变化，从而会对隐写检测工作造成干扰，最终影响检测准确率。近年来，出现了一些对待检测音频进行消除隐写痕迹的操作如去噪，从而得到对原始音频的估计，然后将估计得到的音频与待检测音频相减从而消除音频本身风格变化的影响，提高了检测率，然而这些方法对原始音频的估计操作不能很好的消除隐写痕迹，因此得到的对原始音频的估计不够精确，导致在音频嵌入较少隐秘信息的情况下，检测效果不够理想。

【发明内容】

[0004] 本发明所要解决的技术问题是提供一种针对MP3Stego隐写后的音频的隐写检测方法，其在隐秘信息嵌入率较低的情况下，依然能够获得很高的检测效率。
[0005] 本发明解决上述技术问题所采用的技术方案为：一种针对MP3Stego隐写后的音频的隐写检测方法，其特征在于包括以下步骤：
[0006] ①选取N个变化风格各不相同且未压缩的WAV音频，其中，N > 100 ;然后利用MP3 音频8HZ编码器对每个WAV音频进行压缩编码，得到每个WAV音频对应的MP3压缩音频；并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息，得到每个WAV音频对应的隐写MP3压缩音频；再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库；
[0007] ②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩，得到样本库中的每个音频样本对应的WAV音频，在解压缩过程中，对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正；然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码，得到样本库中的每个音频样本对应的载体估计；
[0008] ③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩，提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数，以每个音频样本中的每帧的 576个量化后的MDCT系数作为一行，将样本库中的每个音频样本对应的所有量化后的MDCT 系数构成一个第一系数矩阵，将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为4

【权利要求】
1. 一种针对MP3Stego隐写后的音频的隐写检测方法，其特征在于包括以下步骤： ① 选取N个变化风格各不相同且未压缩的WAV音频，其中，N3 100 ;然后利用MP3音频 8HZ编码器对每个WAV音频进行压缩编码，得到每个WAV音频对应的MP3压缩音频；并利用 MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息，得到每个WAV 音频对应的隐写MP3压缩音频；再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库； ② 利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩，得到样本库中的每个音频样本对应的WAV音频，在解压缩过程中，对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正；然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码，得到样本库中的每个音频样本对应的载体估计； ③ 利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩，提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数，以每个音频样本中的每帧的576个量化后的MDCT系数作为一行，将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵，将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记戈
其中，1彡i彡2N，Xi的维数为iV/x576，表示样本库中的第i个音频样本中包含的帧的总数，对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数，x2;1、x2,2、x2, 575、x2, 576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数，\ a' ,575、对应表示样本库中的第i个音频样本中的第iV/帧的第1个、第2个、第575个、第576个量化后的MDCT系数；同样，利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩，提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT 系数，以每个载体估计中的每帧的576个量化后的MDCT系数作为一行，将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵，将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为
其中，1彡i彡2N，Xi'的维数为7V/ x576，iV/表示样本库中的第i个音频样本中包含的帧的总数，亦表示样本库中的第i个音频样本对应的载体估计中包含的帧的总数，X' 1;1、X' 1;2、X' 1; 575、X' 1; 576对应表示样本库中的第i个音频样本对应的载体估计中的第1帧的第1个、第2个、第575个、第 576个量化后的MDCT系数，x'2;1、x'2,2、x' 2, 575、义' 2, 576对应表示样本库中的第i个音频样本对应的载体估计中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数， X'W x'<.575、x'<,57 6对应表示样本库中的第i个音频样本对应的载体估计中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数； ④ 计算样本库中的每个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵中的每一列与该音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵中对应列之间的Hausdorff距离值，将样本库中的每个音频样本对应的576个 Hausdorff距离值构成一个初级隐写分析特征行向量，将样本库中的第i个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量记为FpFi = [hdi hd2*"hdk… hd575 hd576]，其中，1彡i彡2N，hdk表示Xi中的第k列与X/中的第k列之间的Hausdorff 距离值，1彡k彡576 ; ⑤ 根据样本库中的每个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量，获取样本库中的每个音频样本对应的最终隐写分析特征行向量，将样本库中的第i个音频样本对应的最终隐写分析特征行向量记为F/，F/ = mi 〇i Pi Si]，其中，1彡i彡2N，ii i表示Fi中的所有元素的均值，
，mi表示Fi中的所有元素中的最大值，mi = maxOidi, hd2，…，hdk,…，hd576)，max()为取最大值函数，〇 i表示匕中的所有元素的方差
Pi表示匕中的所有元素的峰度系数，
\表示匕中的所有元素的三阶中心距，
⑥ 对样本库中的每个音频样本对应的最终隐写分析特征行向量进行标记，对于样本库中的第i个音频样本，如果该音频样本为MP3压缩音频，则将该音频样本对应的最终隐写分析特征行向量标记为-1，如果该音频样本为隐写MP3压缩音频，则将该音频样本对应的最终隐写分析特征行向量标记为+1，其中，1 < i < 2N ;然后将所有标记后的最终隐写分析特征行向量输入SVM分类器进行训练，得到训练模板； ⑦ 对于任意一个待检测的MP3压缩音频，按照步骤②至步骤⑤的过程，以相同的方式获取该MP3压缩音频对应的最终隐写分析特征行向量，然后利用训练模板对该MP3压缩音频对应的最终隐写分析特征行向量进行检测，以确定该MP3压缩音频是否经过MP3Stego音频隐写工具隐写。
2.根据权利要求1所述的一种针对MP3Stego隐写后的音频的隐写检测方法，其特征在于所述的步骤②中对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正的具体过程为： ②-1、将样本库中当前待处理的第i个音频样本定义为当前音频样本，其中， 1 ^ i ^ 2N ； ②-2、假设当前音频样本中包含有帧，且帧序号从1开始编，并将当前音频样本中当前待处理的第j帧定义为当前帧，其中; ②-3、如果当前帧的帧序号j为奇数，则保持当前帧的编码参数量化步长不变，然后执行步骤②-4 ;如果当前帧的帧序号j为偶数，则将前一帧的编码参数量化步长作为当前帧的编码参数量化步长，完成对当前帧的编码参数量化步长的修正，然后执行步骤②-4 ; ②-4、令j = j+1，然后将当前音频样本中下一帧待处理的帧作为当前帧，再返回步骤 ②-3继续执行，直至当前音频样本中的所有帧处理完毕，其中，j = j+1中的"="为赋值符号； ②-5、令i = i+1，然后将样本库中下一个待处理的音频样本作为当前音频样本，再返回步骤②-2继续执行，直至样本库中的所有音频样本处理完毕，其中，i = i+1中的"="为赋值符号。
3.根据权利要求1或2所述的一种针对MP3Stego隐写后的音频的隐写检测方法，其特征在于所述的步骤④中\中的第k列与X/中的第k列之间的Hausdorff距离值hdk的获取过程为： ④-1、将\中的第k列记为Cu，将X/中的第k列记为C' u ; ④-2、将Ci;k中当前待处理的第j个元素定义为当前元素，其中，; ④-3、计算当前元素与C' i;k中的每个元素之间的欧氏距离，得到当前元素对应的iV/ 个欧氏距离，然后获取当前元素对应日W个欧氏距离中的最小欧氏距离值； ④-4、令j = j+1，然后将Ci;k中下一个待处理的元素作为当前元素，再返回步骤④-3 继续执行，直至Cu中的所有元素处理完毕，得到Cu中的每个元素对应的一个最小欧氏距离值，其中，j = j+1中的"="为赋值符号； ④-5、获取Cu对应的< 个最小欧氏距离值中的最大值，然后将该最大值作为\中的第k列与X/中的第k列之间的Hausdorff距离值，记为hdk。
【文档编号】G10L19/018GK104282310SQ201410502396
【公开日】2015年1月14日申请日期:2014年9月26日优先权日:2014年9月26日
【发明者】王让定, 羊开云, 严迪群, 金超, 孙冉, 周劲蕾申请人:宁波大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王让定;羊开云;严迪群;金超;孙冉;周劲蕾
技术所有人：宁波大学
我是此专利的发明人