基于参数拟合安全容量的自适应批量隐写方法与流程

文档序号:12126064阅读:219来源:国知局
本发明涉及一种基于参数拟合安全容量的自适应批量隐写方法,属于信息安全
技术领域
:中的信息隐藏技术子领域。
背景技术
::隐写是一种隐蔽通信的技术。它在载体信号的数据冗余中嵌入隐蔽信息,达到掩盖通信事实的目的。随着计算机、智能设备和互联网络技术的发展与普及,多媒体(如:图像、音频和音视频等)被广泛使用。图像、音频的数据表达的精度已经远远高过人类感官能察觉的程度,因而冗余度较高,可以用来隐藏信息,不易被第三者察觉。直接从多媒体采集到的载体称为原文,如:从相机拍摄到的JPEG图像等。原文载体经过具体隐写算法嵌入隐蔽信息得到的新文件称为隐文。一般衡量隐写的程度时,隐蔽信息占原文可嵌入位置的比例称为嵌入率,原文所有可嵌入位置在隐写中被修改的比例称为改动率。隐写方法与保护通信内容的传统密码学结合,可以起到掩盖通信事实的作用,可用于个人隐藏私密信息,或企业隐藏商业秘密。相应地,隐写分析(Steganalysis)是指判断给定样本是否藏有隐蔽信息或藏有隐蔽信息程度的技术,一般通过提取特征、训练分类器和预测等统计模式识别方法实现。隐写行为一旦被识别出来,则隐写失败,隐蔽通信无法继续。虽然当前最为有效的隐写分析方法可以检测高隐蔽性隐写方法的低嵌入率水平,但其准确率并非100%,且存在一定的错误率。由于隐写对原文修改量轻微的特点,嵌入率或改动率很少的隐写很难被隐写分析算法完全准确识别。由此,定义安全容量为一种阈值,嵌入量在安全容量以下,最有效的隐写分析算法仍存在较大的(如:20%以上)错误率(参考文献:Filler,T.,andJ.Fridrich."GibbsConstructioninSteganography."InformationForensics&SecurityIEEETransactionson5.4(2010):705-720.)。在隐写方面存在多种方法,早期的算法主要基于最低有效位(LeastSignificantBit,LSB)、量化索引调制(QuantizationIndexModulation,QIM)和扩频水印(SpreadSpectrum,SS)等。在这些方法的基础上,衍生出一些增强隐蔽性的手段,包括:通过口令随机置乱嵌入位置,借助编码学方法在少量的矩阵里,通过内容自适应技术结合综合征网格码(SyndromeTrellisCodes,STC)手段选择纹理复杂的位置做嵌入。目前高隐蔽性隐写算法大多结合上述特点,达到比基本隐写算法高出约7倍以上的安全容量。事实上,隐写者有能力获得多幅图像,并将隐蔽信息分散在多个原文中嵌入。最直接的方法有集中嵌入于一个原文、均匀地分散嵌入在各个原文中(参考文献:Ker,AndrewD."BatchSteganographyandPooledSteganalysis."InternationalConferenceonInformationHiding2006,Springer-Verlag,2006:265-281.)。然而,图像之间是具有属性区别的,研究人员认为,可嵌入位置和图像的纹理属性对安全容量有很大影响(参考文献:Rainer.AssessmentofSteganalyticMethodsUsingMultipleRegressionModels.InternationalConferenceonInformationHiding.SpringerBerlinHeidelberg,2005:278--295.)。然而,目前在载体选择方面存在无知识、部分知识和全知识三类(参考文献:Kharrazi,Mehdi,H.T.Sencar,andN.Memon."CoverSelectionforSteganographicEmbedding."InternationalConferenceonImageProcessingIEEE,2006:117-120.)。其中,无知识和部分知识的方法没有利用分类器输出结果的信息,虽然实现较为简单,但优选载体并不够精准。全知识类的载体选择,定性地看,主要选择较难被分析的原文用于嵌入;而定量地分析则是预测安全容量,用以控制嵌入率或改变率不被隐写分析算法察觉。本发明人认为,隐写安全容量是可以通过实验计算的,而且,原文的属性(以图像为例,如:尺寸、可嵌入位置、纹理度量等)存在指示隐写安全容量的可行性。首先,原文可以依据其属性分类,并使用特定的隐写算法随机嵌入定量的信息,用当前最有效的隐写分析算法统计其分类器的错误率,在阈值临界线附近的嵌入率或改变率度量值即为安全容量。第二,上述因素可以和该安全容量进行函数拟合或分布拟合,在一定精准程度上可以用于预测安全容量。例如,图像大小的平方根和安全容量近似成正比的递增关系。专利申请号为2013106908364的中国专利“基于MCUU模型下的DCT域图像隐写容量的评估方法”公开了一种基于MCUU(MaximizeCapacityunderundetectable)模型下的DCT域图像隐写容量的评估方法。该专利方法提出MCUU模型,通过对原文进行隐写时不断增加隐写嵌入量并进入隐写分析计算准确率的方式获得图像的隐写容量,得出隐写容量与图像大小、嵌入强度和图像复杂度之间的关系。该专利方法主要给出验证隐写容量与图像属性具有关系的方法,局限于DCT域图像,目的在于对图像各属性与隐写容量影响关系的揭示。此外,该专利缺乏具体预测模型来拟合图像属性与安全容量之间的关系,对于未来采集到新图像需要隐写时,并不能定量指示其安全容量。专利申请号为2015106454411的中国专利“基于智能移动终端的图像隐写系统”公开了一种基于智能移动终端的图像隐写系统。该专利的方法包括图像采集、存储、提取、类型识别、类型转换、预处理、模块、发送和秘密信息提取模块,最终将隐写图像发给接收方。该专利方法描述了在移动终端下的图像隐写分析系统的隐写流程,但需要指出的是,虽然专利提出了图像隐写系统需要的构成模块,但并未涉及长度较大的隐蔽信息如何在多个载体中分配嵌入量或嵌入率的问题,也未进行安全容量的预估,在使用时有可能会大大超过安全容量而丧失隐蔽性。技术实现要素:本发明的目的在于提供一种基于参数拟合安全容量的自适应批量隐写方法,用于在隐写者有能力制备多个样本时,在多样本间调整嵌入率,从而降低隐写分析者判断的准确率。为此,本发明采用的具体方案如下:本发明的基本流程是:1)构造样本库与样本属性知识库。大量制备原文库并制备对应不同嵌入率的密文库,放入特定的隐写分析算法里做预测。同时,构造样本属性的知识库,即对样本属性度量的函数库(例如:包括样本尺寸或可嵌入位置数量,样本信号的纹理复杂度等),计算得到样本的属性度量。2)预估已有样本安全容量。将以上步骤1)得到的样本属性度量值按照特定的粒度(如:图像可嵌入位置按每个数量级分级)分类。分别统计每类中的样本在以上步骤1)得到的隐写分析预测结果的准确率。根据用户设定的准确率阈值得到安全容量。3)建立模型和参数拟合。将以上步骤1)得到的样本属性度量值和以上步骤2)得到的安全容量,用常用的曲线(或曲面)模型或概率分布模型做拟合,选用拟合度高的模型,并使用样本属性度量值与安全容量估计所选模型的参数。4)预测新样本安全容量。在实用阶段,制备得到一组样本,将该样本提取与步骤1)相同的属性,并放入步骤3)得到的预测模型中做预测,如果隐蔽信息比安全容量预测结果的总和大,则应继续制备样本,或按安全容量的比例关系依次提高嵌入率。其中,以上步骤1)—3)为学习阶段,得到估计模型和参数,步骤4)为实用阶段,学习阶段得到的模型和参数可以多次使用,不需要每次重新计算模型,因而便于在便携设备上计算。只有在新的隐写算法和更有效的隐写分析算法出现的时候更新预测结果。相应地,在隐写提取时,只要设置嵌入消息的长度、偏移量和校验码等,原文提取时因为校验失败而被忽略。将提取的信息分片按其偏移量合并,即可以有效恢复出原信息。本发明所采用的隐写方法总体包括如下步骤(所有步骤都由计算机软件在用户的配置参数下完成):S1、构造样本库与样本属性知识库,并计算样本属性度量值;S2、通过隐写分析算法预估已有样本安全容量;S3、以步骤S1得到的样本属性度量值和步骤S2得到的安全容量为依据建立安全容量模型并拟合该安全容量模型的参数;S4、用步骤S3得到的安全容量模型及其参数来预测新样本的安全容量,根据用户选取的隐蔽信息与所预测的安全容量的比较结果调整嵌入率、确定最终隐写容量并进行嵌入,从而完成批量隐写。进一步地,所述步骤S1包括以下子步骤:S11、构造样本库,使用多媒体采集设备采集或制备大量原文集C={c1,c2,...,cn},遍历嵌入率由0至1,通过嵌入长度为rj的隐蔽信息得到隐文集其中E为隐写嵌入方法,k为算法所需的密钥;S12、将样本放入隐写分析算法D里做预测,得到预测值{y=D(x)},其中x为原文集C或隐文集S的成员;S13、构建对样本属性度量的函数库M={m},其中,m包括但不限于样本尺寸、可嵌入位置数量或样本信号的纹理复杂度;S14、计算得到样本的属性度量其中,ci来自原文集C。所述步骤S2包括以下子步骤:S21、将所述步骤S14得到的样本属性度量值集合V(m)按照该属性取值范围确定适合的粒度分类,得到各类的样本集S22、分别统计每类中的样本在所述步骤S12得到的隐写分析预测结果的准确率其中,为类中的元素个数,为中的元素,E(c,r,k)为对原文c以k为参数嵌入长度为r的隐蔽信息得到的隐文,根据用户设定的准确率阈值pT得到安全容量使得为满足的最小r值。进一步地,所述步骤S3包括以下子步骤:S31、将每类样本属性度量值的均值与所述步骤S22得到的安全容量用曲线模型或概率分布模型φ做拟合;S32、对步骤S31的所有模型计算拟合优度,优先选择使用拟合度高的模型φ,并使用所述样本属性度量值{vi}与所述安全容量来估计所选模型的参数θ,使得r'=φ(v),以预测出与相近的安全容量预测值。进一步地,所述曲线模型包括但不限于线性模型、多项式模型或多项式相除模型,所述概率分布模型包括但不限于二项式分布模型、正态分布模型、泊松分布模型或拉普拉斯分布模型。进一步地,所述步骤S4包括以下子步骤:S41、制备一组原文样本{xi},选取需要嵌入的一段长度为a的隐蔽信息;S42、计算样本集{xi}的属性值{vi},并将该样本属性值代入所述步骤S32获得的安全容量模型ri'=φ(vi)中,计算获得样本安全容量S43、如果a>∑ri',则增加制备原文样本直到a≤∑ri';在条件不允许增加制备原文样本的情况下,则按照确定新的嵌入量分配;S44、将已有的隐蔽信息按照步骤S43得到的嵌入量{ri'}进行分片,并将长度为ri'的隐蔽信息分片嵌入到原文样本xi中,从而完成批量隐写。至此,基于参数拟合安全容量的自适应批量隐写方法已经获得,可以投入运行,得出使隐写分析难以检测的嵌入率分布。其中,步骤S3得到的模型φ和参数θ可以一次获得,多次用于实际场景即步骤S4中,因而,步骤S4可以独立运行。本发明具有的有益效果是:(1)降低了批量隐写被隐写分析系统发现的准确率。本发明采用的建模和参数拟合的方法,根据大量样本学习得到用于预测新样本安全容量的预测模型,确保实用中预测得到的安全容量能够尽量降低隐写分析者的准确率,即降低隐写分析者分析结果的可靠性。(2)有效提升了隐写系统整体的隐蔽性。本发明采用建立数学模型的方法预测安全容量,结果更加准确。隐写系统是长期使用的,如果隐写者某次未意识到其采用的嵌入率超过安全容量,则容易被隐写分析识别出来,而导致隐蔽通信无法继续。(3)实用阶段计算量小易于在便携设备上实现。本发明在学习阶段得到的模型及参数,可以并在实用阶段多次使用,不需要在每次预测安全容量时做一次提取特征,降低了实用阶段的运行时间。附图说明图1是本发明的基于参数拟合安全容量的自适应批量隐写方法的流程图;图2是本发明构造样本库和样本属性知识库并预估已有图库安全容量的流程图;图3是本发明建立模型和拟合参数的流程图;图4是本发明预测新样本安全容量的流程图。具体实施方式为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。现结合附图和具体实施方式对本发明进一步说明。本发明提出的基于参数拟合安全容量的自适应批量隐写方法,适用于将较长的隐蔽信息分片嵌入到一组图像中的情形,兼容于将少量信息嵌入到单个文本的情形,用于控制嵌入量不超过安全隐写容量。其主要过程框架包括:构造样本库和样本属性知识库、预估已有样本安全容量、建立模型和参数拟合、预测新样本安全容量。通过本发明,隐写使用者在学习阶段可以构造样本库和样本知识库,计算样本的属性度量,预估样本库中样本的安全容量并以属性度量和安全容量为依据建立模型、拟合其参数,在实用阶段,可以制备样本并计算其属性值,利用上述学习阶段得到的模型预测样本的安全容量并实施隐写。下面结合附图和示例,以将300KB隐蔽信息文件分散地嵌入到10幅4MB级别的JPEG图像中为例,对本发明的技术框架流程做详细描述。图1描述了本发明的整体流程,包括4个过程:S1、构造样本库和样本属性知识库,计算样本属性度量值等为后续步骤做准备;S2、通过隐写分析算法预估已有样本安全容量,用于模型的建立和参数的拟合;S3、以样本属性度量值和已有图库的安全容量为依据建立安全容量模型并拟合其参数;S4、根据建立好的模型和其参数预测新样本的安全容量并根据实际情况进行调整嵌入率、确定最终隐写容量。参照图2,描述构造样本库及样本属性知识库并预估已有样本安全容量的过程S1、S2,可分为3个流程:1、构造样本库;2、样本属性度量值计算;3、已有图库安全容量预估。在构造样本库时,首先使用多媒体采集设备(如:手机相机、录音机和录像机等)采集或制备大量(能支持后续按属性分类每类在100个样本以上)原文集C={c1,c2,...,cn},然后遍历嵌入率由0至1,通过嵌入长度为rj的隐蔽信息得到隐文集其中E为隐写嵌入方法,k为算法所需的密钥等其它参数。在一实例中,用手机拍照得到500幅图像(1000万像素,约300万可嵌入位置),遍历嵌入率由0至1,根据经验可知JPEG图像安全的嵌入率一般在0~0.4bpac(每非零AC系数嵌入比特数)之间,每隔0.05bpac采样,得到9种嵌入率。遍历上述嵌入率,随机产生长度为0~0.4*3,000,000/8的字节数组为模拟的隐蔽信息,使用J-UNIWARD隐写工具对上述500幅图像依次嵌入得到500*9=4,500幅隐写图像。在样本属性度量值计算时,首先构建对样本属性度量的函数库M={m},其中m包括但不限于:样本尺寸和可嵌入位置数量,样本信号的纹理复杂度等方法。不同样本格式(图像、音频、音视频等)的样本属性不同。由于样本尺寸在本情况已固定,该实例仅考虑线性预测误差模型(LPE)方法。然后计算样本属性度量值其中ci来自原文集C。在已有样本安全容量预估时,首先将样本放入特定的隐写分析算法D里做预测,得到预测值{y=D(x)},其中x为原文集C或隐文集S的成员。然后分别统计每类中的样本在以上步骤1c)得到的隐写分析预测结果的准确率其中为类中的元素个数,为中的元素,E(c,r,k)为对原文c以k为参数嵌入长度为r的隐蔽信息得到的隐文。根据用户设定的准确率阈值pT得到安全容量使得为满足的最小r值。在该实例中,将样本载体与上述以嵌入率划分的9种隐写图分别成对放入特定的隐写分析算法D里做预测,如:使用经过训练的JPEG富模型(JSRM)特征的线性分类器,得到预测值{y=D(x)},如:-1、-1、+1、……等;将样本属性度量值计算阶段得到的样本属性度量值按照特定的粒度分类,得到B1,B2,...,BN,如:将所有线性预测误差(LPE)值按照大小排列共划分为10个等级;分别统计每类中的样本在的隐写分析预测结果的准确率根据用户设定的准确率阈值pT得到安全容量rsec使得rsec为满足的最小r值。如根据设定阈值为0.80,得到在每一类中的值。参照图3,描述建立模型和参数拟合的过程S3。主要分为3个过程:1、构建模型集合;2、筛选模型;3、参数拟合。在构建模型集合时,选取常见的曲线(或曲面)模型和概率模型构建待拟合的模型集合Φ,曲线(或曲面)模型包括但不限于:线性模型、多项式模型、多项式相除模型等,如线性模型为:y=bx+a;概率模型包括但不限于:二项式分布模型、正态分布模型、泊松分布模型和拉普拉斯分布模型等。在筛选模型时,将每类样本属性度量值的均值与安全容量用集合Φ中的每一个元素做拟合,计算其拟合优度。以线性模型φ1:y=bx+a(x、y可以为标量,也可以为向量)为例,以样本判定系数R2作为拟合优度,R2越大,拟合优度越高。计算公式如下:其他模型的拟合优度也可以采用相应的方法计算得出。计算出各个元素的拟合优度后,优先选择使用拟合度高的模型φ∈Φ,并使用上述样本属性度量值v与安全容量估计所选模型的参数θ。使得:r'=φ(v,θ)可以预测出与相近的安全容量预测值。例如,筛选得到的模型为线性模型φ1:y=bx+a(x、y可以为标量,也可以为向量),经过构造样本库及样本属性知识库和预估已有图库安全容量的过程,现已获得足够多组一一对应的样本属性度量值均值和安全容量的散点数据,以样本属性度量值均值为自变量x,安全容量为因变量y,采用线性回归的方法,计算参数集合θ1{b,a}中元素的值:从而拟合获得了模型φ1:y=bx+a的参数集合θ1,即:{b,a}。其他模型的参数集合也可以采用相应的方法计算得出。参照图4,描述预测新样本容量的过程S4。主要分为4个过程:1、样本制备;2、安全容量预测;3、嵌入量调整;4、实际嵌入。在样本制备时,制备一组原文样本{xi},样本由用户制备,例如通过手机拍照得到10幅大小约为4MB的JPEG图像作为载体图;用户选取需要嵌入的一段长度为a的隐蔽信息,如300KB。在安全容量预测时,计算样本属性值vi=m(xi),这里属性值的计算方式应与构造样本库和样本属性知识库时计算样本属性值的方式相同;将属性值作为自变量代入安全容量模型r′i=φ(vi)中,计算获得因变量r′i,即预测的样本安全容量在嵌入调整阶段时,如果a>∑ri',则用户应增加制备原文样本直到a≤∑ri'以保证安全性;在条件不允许增加制备原文样本的情况下,或a≤∑ri'时,则按照确定新的嵌入量分配,以尽量降低被隐写分析发现的概率。在实际嵌入时,将已有的300KB隐蔽信息按照上述步骤得到的嵌入量{ri'}进行分片,并将长度为ri'的隐蔽信息分片对应嵌入到上述图像xi中,得到10幅隐写图像。本发明方法通过计算机程序自动估算已有样本的隐写安全容量,自适应地将样本的属性(如:可嵌入位置数量)和安全容量之间建立模型,利用曲线拟合或分布拟合技术得到经验公式,并将该经验公式用于预测将来使用中制备得到的原文样本,估算其安全容量。尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1