一种基于C-MAC特征的AACHuffman域隐写分析方法

文档序号:9811920阅读:298来源:国知局
一种基于C-MAC特征的AACHuffman域隐写分析方法
【技术领域】
[0001] 本发明属于数字媒体信息内容安全技术领域,特别涉及一种判别AAC音频是否经 过秘密信息隐写的方法。 技术背景:
[0002] 在移动通信中,各类音频和语音会话业务已经占据了巨大比例。3GPP组织指定采 用AAC(Advanced Audio Coding,高级音频编码)作为移动互联网的音频压缩编码标准之 一,使得AAC压缩音频数据在网络上被大量的传播,同时面向AAC音频的隐写算法也逐渐涌 现,给音频隐写分析带来了新的挑战。与MP3相比,AAC的压缩性能更加高效,已经被各大平 台所支持,如YouTube,iPhone等。AAC的隐写嵌入域主要包括MDCT系数、量化参数以及 Huff man域等。AAC音频Huffman编码过程是对量化后MDCT系数进行无损压缩编码,通过对 MDCT系数进行比例因子带划分和分区合并,为每个比例因子带选择合适的码书进行编码, 实现数据的高效压缩。通过对已有的针对Huffman域的隐写算法进行分析发现,平均嵌入容 量可达到0.6Kb/s。由于隐写算法仅对码书的选择进行调整,且Huffman编码是无损编码,因 此通过对Huffman码书的修改不会对听觉感知造成影响,具有良好的隐蔽性和嵌入容量。
[0003] 目前针对AACHuffman域的隐写分析方法还未见公开文献。由于Huffman域隐写算 法仅对比例因子带码书进行修改,并没有改变相应的MDCT系数值,因此现有的针对AAC音频 MDCT系数的隐写分析方法并不适用。
[0004] 在AAC首频Huffman编码过程中,码书的选择是以编码后比特数最少为目标的,而 针对Huffman域的隐写方法通过对码书的控制性选择,一定会导致码书之间的相关统计特 性发生变化。基于以上考虑,采用基于帧内相邻比例因子带码书的Markov转移概率矩阵作 为隐写分析特征,可实现针对Huffman域码书选择的隐写方法的有效检测。为了减少音频内 容对码书转移概率的影响,使特征更加稳定,引入重压缩校准机制来提高隐写分析特征的 敏感性。

【发明内容】

[0005] 本发明针对目前面向AAC隐写分析方法相对缺少的问题,本发明提出了一种C-MAC 特征的AAC Huffman域隐写分析方法。
[0006] 本发明所采用的技术方案是:一种基于C-MAC特征的AACHuffman域隐写分析方法, 其特征在于:针对AAC音频Huffman域的两种修改比例因子带码书的隐写算法,提出基于重 压缩校准的相邻比例因子带码书间转移概率的AAC隐写分析特征,采用支持向量机进行分 类预测,实现了面向AAC Huffman域的隐写分析;其具体实现包括以下步骤:
[0007] 步骤1:获得待测AAC音频片段此的码率R;
[0008] 步骤2:针对此中每个数据帧提取其比例因子带的码书序号,构建码书序列0:,计算 序列 Dj^MAC 特征 MAC-Fi;
[0009] 步骤3:对仏片段进行R码率重压缩,即对Ml进行解码,获得解码后的WAV音频,再对 WAV音频采用施的编码码率R进行AAC编码压缩获得校准后AAC音频M2;
[0010] 步骤4:对M2音频提取MAC特征MAC-F2;
[0011] 步骤5:计算MAC-F^MAC-F2的差值,获得施音频片段的C-MAC隐写分析特征;
[0012] 步骤6:分类器训练;
[0013]步骤7:隐写分析检测。
[0014] 作为优选,步骤2的具体实现过程为:
[0015] 将AAC音频帧中所有比例因子带码书序号记为S={C1. . .Cj. . .CN},其中表示按 时序顺序排列在第j个位置的码书序号,W e [ 1,10];采用一阶Markov链对帧内比例因子带 码书序号S进行建模,用状态转移概率对码书出现的相关性进行量化表示;以码书的序号作 为Markov链的状态,则相邻码书之间状态的转移概率为:
[0017] 其中Pra/e表示当第j个码书序号是β时,第j+Ι个码书序号为α的概率:
[0018] 根据公式1,对于码书序列S,可获得一个102维的状态转移矩阵A1J:
[0020] 其中元素 eij表示序列S中第i个码书转移到第j个码书的概率,通过提取AAC音频中 帧内比例因子带Huffman码书Markov转移概率矩阵,即MAC特征矩阵,作为对Huffman码书修 改隐写分分类特征;
[0021] 作为优选,步骤5的具体实现包括以下子步骤:
[0022] 步骤5.1:引入重压缩校准机制构建C-MAC特征矩阵;
[0023] 将待测音频重压缩前后的MAC特征矩阵进行差值计算所获得的校准后MAC特征,即 C-MAC特征;
[0024] 步骤5.2:基于长短帧分布的特征融合;
[0025] 将AAC数据帧分为2个集合:长帧集合Fi和短帧集合Fs,对其分别构造 C-MAC特征矩 阵Μι和Ms,其中,M, = …,…,, = {s的,s圬sb/,...,5的},为长 帧集合Fi中第i个比例因子带码书序号,N为内比例因子带数量,为短帧集合Fs中第j 个比例因子带码书序号,Μ为匕帧内比例因子带数量;在构建隐写分析特征时,对长帧集合h 和短帧集合Fs分别进行处理,提取总共2*10*10 = 200维隐写分析特征矩阵。
[0026] 作为优选,步骤6的具体实现包括以下步骤:
[0027] 步骤6.1:输入WAV样本,分别生成cover样本和对应的stego样本,并按照步骤5.1 中的方法提取C-MAC分类特征;
[0028] 步骤6.2:经过步骤6.1过程后,得到训练集样本和数量相等的两种不同嵌入算法 的载密样本,然后随机选择不同数量的stego样本和cover样本使用SVM分类器训练隐写分 析模型。
[0029] 作为优选,步骤7的具体实现包括以下步骤:
[0030] 步骤7.1:提取待测样本的隐写分析特征集合;
[0031 ]步骤7.2:将特征输入构建好的隐写分析模型,得到样本的隐写判断结果。
[0032]相对于现有技术,本发明的有益效果为:
[0033]根据目前调研结果,针对AAC Huffman域的隐写分析方法还未见公开文献,本发明 针对AAC Huffman域提出了一种新的隐写分析方法,针对基于Huffman码书的隐写方法具有 较好的检测效果,针对文献[1]和文献[2]的隐写算法,在相对嵌入率达到50%时,检测正确 率可达95%以上。并且,本发明提出的隐写分析方法具有较好的鲁棒性,不受编码码率及编 码器类型的影响。
[0034] [文献1 ] Zhu J,Wang R,Li J,et al · A Huffman coding sect ion-based steganography for AAC audio[J]. Information Technology Journal.2011,10(10): 1983-1988.
[0035] [文南犬 2]Tang B T , Guo L , Liu Z H. An information hiding method in advanced audio coding(AAC)[J].Technical Acoustics,2008,27(4):533-538.
【附图说明】
[0036] 图1是本发明现有技术的AAC编解码流程图;
[0037] 图2是本发明实施例的载体音频与载密音频的MAC特征(96kbps,文献[1 ]算法);
[0038] 图3是本发明实施例的载体音频与载密音频的MAC特征(96kbps,文献[2]算法);
[0039] 图4是本发明实施例的载体音频与载密音频的C-MAC特征(96kbps,文献[1 ]算法);
[0040] 图5是本发明实施例的载体音频与载密音频的C-MAC特征(96kbps,文献[2]算法);
[0041] 图6是本发明实施例的隐写分析特征提取流程图。
【具体实施方式】
[0042]为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发 明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不 用于限定本发明。
[0043]本发明的隐写分析检测方法基于AAC音频,在
【发明内容】
陈述之前需要对AAC的编解 码原理进行介绍。
[0044] 请见图1,为AAC编码原理示意图,其编码过程包括5个主要步骤:心理声学模型分 析、滤波器MDCT变换、TNS预测等可选编码模块、MDCT系数量化和Huffman编码;其中MDCT变 换和量化过程是AAC编码的核心处理过程。AAC采用时域混叠编码方式,对输入的脉冲编码 调制时域信号进行分帧操作,每帧1024个抽样信号,与前一帧共同构成2048个抽样信号,对 这2048个抽象信号进行加窗操作和MDCT变换获得1024个MDCT系数。心理声学模型与滤波器 并行工作,通过对输入的时域信号进行临界频带间的掩蔽效应计算,得到相应的感知熵 (PE)以确定加窗操作中的窗类型,并确定每次进行MDCT变换的长度。对得到的1024个MDCT 数据进行时域噪声整形(TNS)、预测、量化、Huffman编码等过程生成音频压缩码流,通过AAC 格式标准格式封装成AAC压缩数据,进行实时传输或存储;相关术语解释如下表1;
[0045]表1相关术语解释
[0046]
[0047] 基于上述理论,本发明提供的一种基于C-MAC特征的AACHu f f man域隐写分析方法, 其特征在于:针对AAC音频Huffman域的两种修改比例因子带码书的隐写算法,提出基于重 压缩校准的相邻比例因子带码书间转移概率的AAC隐写分析特征,采用支持向量机进行分 类预测,实现了面向AAC Huffman域的隐写分析;
[0048] 请见图6,本发明的具体实现包括以下步骤:
[0049] 步骤1:获得待测AAC音频片段此的码率R;
[0050] 步骤2:针对此中每个数据帧提取其比例因子带的码书序号,构建码书序列0:,计算 序列 Dj^MAC 特征 MAC-Fi;
[0051 ] 步骤3:对仏片段进行R码率重压缩,即对Ml进行解码,获得解码后的WAV音频,再对 WAV音频采用此的编码码率R进行AAC编码压缩获得校准后AAC音频M2;
[0052] 步骤4:对M2音频提取MAC特征MAC-F2;
[0053] 步骤5:计算MAC-F^MAC_F2的差值,获得此音频片段的C-MAC隐写分析特征;
[0054]步骤6:分类器训练;
[0055] 步骤7:隐写分析检测。
[0056]以下结合具体实施例对本发明做进一步的阐述;
[0057] 1:特征提取方法;
[0058] 1.1:特征提取;
[0059] 1.1.1:构建一次压缩帧内比例因子带码书矩阵;
[0060] 将AAC音频帧中所有比例因子带码书序号记为S={C1. . .Cj. . .cN},其中表示按 时序顺序排列在第j个位置的码书序号。在AAC的Huffman编码过程中,共包含12个码书,码
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1