一种基于局部学习的信息隐藏检测方法

文档序号:8922971阅读:231来源:国知局
一种基于局部学习的信息隐藏检测方法
【技术领域】
[0001] 本发明涉及图像及视频被动盲取证领域,特别涉及针对图像、视频信息隐藏检测 进行的基于局部学习的信息隐藏检测方法。
【背景技术】
[0002] 信息隐藏利用人类感觉器官对数字信号的感觉冗余,将一组秘密信息(授权序列 号,消息或版权信息等)隐藏到载体信息中,在不影响宿主信号的感觉效果和使用价值的 情况下,使得可能的攻击者难以从中判断秘密信息是否存在,更加难以截获,从而保证信息 传递的安全性。信息隐藏已成为网络环境下安全、可靠地传递政治、军事、经济等信息的基 本通信方式之一。当前已经有充分的证据证明信息隐藏已经被恐怖组织、犯罪团伙以及谍 报人员应用利用。随着信息隐藏技术门槛的不断降低,越来越多的不法分子开始使用这种 技术。因此,开展信息隐藏检测方面的研宄具有重要的理论价值和现实意义。
[0003] 信息隐藏检测(Steganalysis,文献中也常称作隐写分析),则是信息隐藏的对抗 技术,主要研宄如何区分载密对象与非载密对象的技术。通过信息隐藏检测,可以发现隐蔽 通信信道,阻止敌方的隐蔽通信。目前,信息隐藏检测最常用的手段是使用基于模式识别的 方法,将信息隐藏检测看成载密对象与非载密对象两类的模式分类问题。主要方法步骤包 括特征提取和学习分类两部分:在每个对象上提取具有一定判别能力的特征,然后使用机 器学习的方法在训练集上学习出一个分类器作为信息隐藏检测器,对待检测样本进行检测 分类。
[0004] 本发明主要关注于特征提取后的分类器学习。在分类器学习上,当样本数量较少 时通常使用SVM(SupportVectorMachine),当样本量较大、特征维度较高的时候,目前最 流行的方法是采用集成分类器。在使用这些分类器时,现有方法通常是在所有训练样本上 学习一个全局的分类模型,问题是信息隐藏检测面临着类内散布大而类间差别小的难点, 学到的全局分类模型经常由于复杂度过高而导致泛化性能低下,很多现有方法仅在实验条 件下才能取得较好的检测效果。另外,现有全局学习方法通常需要对每一种信息隐藏算法、 每个嵌入率分别训练分类器,检测时需要预先知道待检测样本所使用的嵌入算法和嵌入 率,实用性很低。与全局学习不同,局部学习方法将整个全局问题分解成局部子问题,然后 在每个子问题上学习局部的分类规则。由于局部子问题的复杂度明显降低,学到的局部模 型在局部区域很容易达到较好的分类效果,因此本发明引入局部学习的方法,提出一种更 有效,更鲁棒,通用性更强的信息隐藏检测方法。

【发明内容】

[0005] 本发明的目的是提供一种基于局部学习的信息隐藏检测方法,实现高效、鲁棒的 信息隐藏检测。
[0006] 本发明提出的一种基于局部学习的信息隐藏检测方法,包括以下步骤:
[0007] 步骤S1,构建训练样本数据库:获取原始图像或视频作为负样本,对每个负样本 进行多种方法的信息隐藏并对应生成多个正样本,所有正负样本的合集构成训练样本数据 库;
[0008] 步骤S2,对每个样本提取可用于信息隐藏检测的且对于正负样本有区分能力的特 征,并将所述特征用向量形式表示作为每个样本的表达;
[0009] 步骤S3,对于一个待检测样本,通过近邻搜索算法在训练样本数据库中搜索与待 检测样本最相似的K个负样本;
[0010] 步骤S4,对所述步骤S3中得到每个负样本匹配对应的多个正样本,然后所述的正 样本中选择距离待检测样本最近的正样本,与对应负样本配对,获得K对正负样本对,构成 局部训练集;
[0011] 步骤S5,依据步骤S4中得到的局部训练集及正、负样本的配对关系,对分类器进 行训练学习,获得最优分类器;
[0012] 步骤S6 :使用所述步骤S5中得到的最优分类器对待检测样本进行判别分类,得到 所述待检测样本是否经过信息隐藏的检测结果;
[0013] 步骤S7:重复步骤S3-S6,直到对所有待检测样本完成检测。
[0014] 优选的,步骤S5中所述对分类器进行训练学习是针对每个待检测样本构建局部 训练集,在局部训练集上学习最优分类器。
[0015] 优选的,步骤S3中所述K个负样本的选取方法为:对于任意一个待检测样本\,计 算\与训练样本数据库中每个负样本的距离,然后按照距离大小对所有负样本进行升序排 序,前K个负样本即为所选负样本。
[0016] 优选的,步骤S5中对分类器进行训练学习过程中,在优化目标函数时加入正负样 本成对这一约束,使成对的样本在投影后尽量分得开些。
[0017] 优选的,所述优化目标函数具体为寻找投影方向a。
[0018] 优选的,步骤5中对分类器进行训练学习的过程为最大化如下目标函数:
[0022] (cuGBk (xt),i= 1, 2, ???,k.
[0023] 其中Xj为第j类样本的集合,Uj为其样本均值,SW为类内散布矩阵;SP为反映正负 样本对分离程度的矩阵;BK(xt)是由K对近邻正负样本对构成的局部训练集,(ci,Si) 为一对正负样本。
[0024] 优选的,K的取值为200。
[0025] 本发明方法可以用于鉴定图像或视频是否含有隐藏信息,监控重要数据是否出现 外流情况等。在基于模式识别的信息隐藏检测中,本发明方法侧重于机器学习与分类阶段, 可以与现有各种图像、视频信息隐藏检测特征提取算法结合使用,具有较高的通用性。
【附图说明】
[0026] 图1是本发明基于局部学习的信息隐藏检测方法流程示意图。
【具体实施方式】
[0027] 为了使本发明的技术方案和优点更加易于理解,以下结合具体实施案例和附图, 对本发明作进一步的详细说明。
[0028] 如图1所示,本发明提出的一种基于局部学习的信息隐藏检测方法包括以下步 骤:
[0029] 步骤S1,通过拍摄或从网络下载获得图像或视频作为负样本,然后对每个负样本 使用多种信息隐藏算法、每种算法使用多种不同嵌入率进行信息隐藏,因此每个负样本有 多个对应的正样本,所有正负样本的合集构成训练样本数据库;
[0030] 本发明构建训练样本数据库时使每个负样本有多个对应的正样本是为了使得到 的信息隐藏检测器能够具有更高的通用性,能够检测使用不同隐藏算法,不同嵌入率的待 检测对象。
[0031] 在本实施例中,从图片分享网站中下载10万张JPEG格式图片,使用F5, nsF5,J-UNIWARD三种JPEG域图像信息隐藏算法进行信息隐藏,每种算法采用4种不同的嵌 入率:〇?l,〇. 2,0. 3,0. 4bpnc(bitpernon-zeroACcoefficient);
[0032] 步骤S2,对每个样本提取可用于信息隐藏检测且对于正负样本有区分能力的特 征,并将所述特征用向量形式表示作为每个样本的表达。以特征作为样本表示的训练样本 数据库Atrain,定义式(1)所示:
[0034] 其中,q为第i个负样本的特征,#为与之对应的M个正样本的特征。下 述所有"样本"均指以特征向量形式表示的样本。
[0035] 在本实施例中,提取548维的CC-PEV特征,该特征提取方法是针对JPEG域信息隐 藏的常用检测特征。
[0036] 步骤S3,对于任意一个待检测样本xt,通过近邻搜索算法在训练样本数
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1