一种图像内容感知的鲁棒通用隐写分析方法与流程

文档序号:13761146阅读:266来源:国知局
一种图像内容感知的鲁棒通用隐写分析方法与流程

本发明涉及网络信息安全,具体来说涉及一种图像内容感知的鲁棒通用隐写分析方法。



背景技术:

隐写分析技术是网络信息安全的重要组成部分,它的最根本问题是判断数字载体是否携带秘密信息。隐写分析是信息隐藏的对抗技术,是对隐写术的数据变换攻击,目的是为了检测隐写术中秘密消息的存在,提取秘密信息从而识别并破坏保密通信。但现有通用盲检测方法大多没有考虑图像内容对隐写分析性能的影响,且没有考虑在攻击条件下的隐藏信息盲检测方式,为此,本发明要解决的技术问题是:

(1)针对空域的不同图像内容(如纹理和平滑部分),提出了一种新的压缩感知(Compressive Sensing,CS)CS域的通用隐写分析方法。该方法通过对图像内容的感知处理,解决了数字图像不同内容的结构性分类问题。

(2)发明不同图像内容的冗余字典,并通过该字典更新对图像内容的平滑、锐化、缩小、剪切和再压缩等攻击进行处理,解决了图像通用隐写分析的鲁棒性检测问题。

隐写分析主要包括两个方面:专用隐写分析和通用隐写分析。专用隐写分析针对已知隐写算法提出的分析方法,它需要首先确定含密图像中使用何种隐写术才能作出判断,准确率较高,但适用范围有限。通用隐写分析是在未知原始载体对象和隐写术的基础上对检测图像是否含密进行判断的一种分析方法。由于通用盲检测方法不需要有关隐写算法细节的先验信息,并且随着特征提取有效性和分类器能力的提高,通用盲检测方法的检测性能逐渐提高,现已成为隐写分析研究的主流。通用盲检测方法主要采用基于机器学习的方法,其关键是寻找能有效区分载体和载密图像的特征,因此各方法的差别也在于所提取的分类特征不同。

但由于实际网络环境下的隐蔽通信检测系统中,获得的图像信源往往包含多种多样的图像内容,这与实验室环境下较单一图像内容的隐写分析算法研究有着明显的差别,会造成通用盲检测分类器在训练阶段和测试阶段的载体图像信源统计特性的“失配”问题,从而降低了检测算法的检测效果,这给网络异构图像环境下的隐藏信息检测带来困。

因此,目前,基于数字图像内容感知的鲁棒通用隐写分析方法在国内外还是空白。类似的方法是Amirkhani等[AMIRKHANI H,RAHMATI M.New framework for using image contents in blind steganalysis systems[J].Journal of Electronic Imaging,2011,20(1):1-14.]针对不同图像内容提出的一种通用盲检测框架;另一种方法是Hashemipour等[HASHEMIPOUR E M,RAHMATI M.A statistical blind image steganalysis based on image multi-classification[C]//Proceedings of the 2012Eighth International Conference on Intelligent Information Hiding and Multimedia Signal Processing.Piscataway,NJ:IEEE Press,2012:150-153.]提出的一种基于图像多分类器的盲检测框架。图1(a)和1(b)为这两种方法的综合实现原理图。这两种方法的局限性在于:

(1)通用盲检测框架的隐写分析:该方法所提分类方法假设载体和相应的载密图像复杂度相等。但实际上,秘密消息的嵌入改变了图像相邻像素之间的相关性,因此也改变了图像的复杂度,载体和相应的载密图像有可能不在同一类;且用平均分类的分类方法只是简单地按照图像复杂度的范围和要分成的类别进行平均分类,它不能保证每一类别所得到的检测性能最优。

(2)多分类器盲检测框架的隐写分析:该方法仅仅利用JPEG图像非零交流(Alternating Current,AC)系数比例作为图像多分类特征,不能很好地刻画图像内容的多样性,更不能确定载密图像中秘密信息所在的位置。

压缩感知理论(Compressed Sensing,CS)是信号处理和数学领域中新出现的重要理论,本质是对稀疏或可压缩信号(如图像),能够以高概率由少量测量数据恢复整个信号。其主要思想是采用过完备字典代替传统的正交基函数揭示信号的内在结构,并能够通过稀疏表示、非相干测量和重构算法(目前主要是凸优化算法和贪婪算法)恢复原始信号。

由于数字图像内容的通用隐写分析的重点在于结构分析和特征提取,而CS技术具有采样数据量少、结构特征明显和高概率恢复信号的特性,所以,适合高隐蔽性下对图像信号的数据处理、秘密信息提取的要求。

基于此,本发明从隐写分析的检测内容和鲁棒性的角度出发,提出了“一种图像内容感知的鲁棒通用隐写分析方法”,从隐写分析的数据处理、字典学习以及内容分析的根本问题上为信息安全探索一种新的发明成果。



技术实现要素:

本发明的目的在于提供一种图像内容感知的鲁棒通用隐写分析方法,本发明的方法能够更好地利用CS技术处理数字图像的优点,进一步提高隐写分析的数据处理效率和分类判断精度。

本发明的目的可通过以下的技术措施来实现:

(1)设定数字图像X的大小N,分块大小B和测量值大小M;

(2)确定9/7-Haar DWT稀疏矩阵Ψ:

(3)确定BCS的哈达玛测量矩阵ΦB

(4)把数字图像分成B×B块,并根据哈达玛测量矩阵ΦB计算第i个图像块的测量向量yi和整个图像X的测量数据Y:

其中,yi=ΦB·xi,i=1,2,...,B2

则整个图像X的测量数据Y为:

(5)根据BCS测量值每个图像块的能量i=1,2,…,B×B,计算并判断第i个图像块的测量向量yi是否大于或小于阈值T=0.4E,从而把图像分为平滑部分和非平滑部分作为感知结果;

(6)训练过程;

(7)分类过程;

(8)判断、分析过程;

(9)重复迭代搜索,直到检测完整个图像数据。

所述步骤(6)训练过程的具体步骤如下:

(6.1)根据步骤(5)的不同数字内容感知结果,确定RDWT字典和正交DCT字典:形成字典D=[D1,D2,…,D13];

字典D中2级RDWT字典形式为:

其中,符号表示内积运算,是一种矩阵间元素相乘的运算;

正交DCT字典的形式为:

(6.2)计算得到字典稀疏初始值并计算图像块xi初始值:

所述图像块xi初始值的具体计算过程如下:设di为中字典Di的原子,Ri为迭代参差:Ri=||ΦBxiBxi-1||2=||yiBxi-1||2,字典稀疏初始值是字典原子di和迭代参差Ri的内积,符号的上标0表示第0个值,也就是初始值;

这样得到,图像块xi初始值形式为:

其中,n是数据矢量长度和字典大小,i=1,2,…,n;符号的上标0表示第0个值,也就是初始值;

(6.3)计算图像块xi=Diαi,并按照公式:Ri=||ΦBxiBxi-1||2=||yiBxi-1||2迭代训练更新字典D;

计算过程类似步骤(6.2),实现形式如下:

所述步骤(7)分类过程的具体步骤如下:

(7.1)根据公式yi=ΦB·xi,计算第i个图像块的测量值yi,及其能量并结合能量与阈值的关系确定数字图像不同内容的数据范围;

(7.2)计算每个图像块的能量大小:设分别为图像的最大能量和最小能量,计算图像的测试次数Em为图像能量均值;

(7.3)根据公式确定第i个图像块的测量值yi在第j个字典的稀疏系数其中j=1,2,…,13;

的实现形式如下:

(7.4)迭代计算,得到图像稀疏表示系数其中i=1,2,…,3136;按照数字图像非平滑块和平滑块的不同内容,按照由大到小的顺序排列图像稀疏表示系数α。。

所述步骤(8)的具体步骤如下:

(8.1)根据公式yi=ΦB·xi和分别计算第i个图像块的测量向量yi和整个图像X的测量数据Y;根据公式计算第i个图像块的能量,并结合其能量大小与阈值的关系确定第i个图像块的数据范围:如果Ei≤T,则属于数字图像的平滑块;如果Ei>T,则属于数字图像的非平滑块;

(8.1.1)图像X的测量数据Y的计算过程如下:

第i个图像块的测量向量yi为:yi=ΦB·xi,其中i=1,2,...,B2

则整个图像X的测量数据Y为:

(8.1.2)确定数字图像非平滑块和平滑块过程如下:

根据BCS测量值yi,计算第i个图像块的能量其中i=1,2,…,B×B(B为分块大小),并根据把图像分为平滑部分和非平滑部分;

(8.2)寻找与xi相似的L个图像块,得到用L个相似块的线性组合表示对当前图像块xi的估计值xi′:

其中,表示相似块的计算系数,它的取值与图像在该区域内的噪声方差成正比,所述噪声方差用稳健中值算子估计;

(8.3)把哈达玛测量矩阵ΦB代入公式:

其中β为迭代参数,其取值范围为|Ri-Ri|<β,0<β<1,更新当前检测图像的分块计算值k为迭代优化次数;

(8.4)根据公式用Lasso算法求解得到αi的初始解并代入公式更新图像块冗余字典系数,并代入以下公式:

求检测图像块的稀疏逼近系数

其中,ΦB为分块哈达玛测量矩阵,y是测量值,d是字典D中的原子,R为迭代计算的误差,α是字典系数,i=1,2,…,n,n=3136;

(8.5)分析判决输出:如果则第i个图像块在第j块字典中含秘密数据,其秘密数据位置为xi;如果则第i个图像块在第j块字典中不含秘密数据,为干净的原始图像块。

本发明提出的基于CS技术进行数字内容选择与分类的通用隐写分析方法的优点为:

(1)利用分块哈达玛测量矩阵对数字图像进行随机投影测量,并根据测量数据的能量统计分布把图像划分为平滑和非平滑的不同部分内容。这种划分能够充分表示了图像的纹理结构和平滑结构特征信息,提高数据的处理效率。

(2)按照不同部分的数字内容,把自然图像库中的图像块按其方向性从0°到180°建立12类RDWT(冗余离散小波变换)字典和一类正交DCT(离散正交变换)字典,形成3136个原子的冗余字典D。该字典中的正交DCT字典可以表示图像块中的各向同性特征,而RDWT字典可以表示图像中的角度和方向。本发明的字典增强了对不同数字图像内容隐写分析的分类适应性。(3)通过对检测图像的不同数字内容的相似性估计及其字典稀疏系数的逼近函数,实现了含密数字图像的精确判断和位置输出。运用数字图像内容的相似性估计与字典稀疏系数的逼近技术,提高了隐写分析的判断精度,确定了含密图像的秘密位置。

附图说明

图1(a)和1(b)是现有技术基于图像内容的隐写分析实现方案原理图;

图2本发明基于图像内容感知的通用隐写分析方法流程图;

图3(a)和3(b)是根据不同图像内容学习构造的字典D;

图4为图像库中通过本方法实现对不同图像的字典表示的实验结果;

图5为图像库中对含密图像通过本方法字典学习能够确定的秘密图像位置的实验结果示意图。

具体实施方式

本发明利用CS分块哈达玛矩阵对图像块进行随机投影,再根据观测向量的能量大小将观测图像分为非平滑和平滑两部分进行训练分类,最后根据分类字典迭代更新检测图像是否含有秘密信息并确定秘密信息的位置。

本发明的图像内容感知的鲁棒通用隐写分析方法基于CS技术原理,分为数字图像内容测试训练和数字图像内容分类判断过程,基于CS技术原理包括如下内容:

(1)图像的压缩感知分块处理:

设数字图像信号X∈RN为从M个采样信号中获得的长度为N的信号,且M<<N。那么,到测量信号Y:

Y=AX (1)

其中,Y的长度为M,而A为M×N测量矩阵(也称为观测矩阵),且具有子采样率S=M/N。如果X在某个变换矩阵Ψ下是稀疏的,即有:

X=Ψα,||α||0<K (2)

这里,变换矩阵Ψ采用9/7-Haar DWT稀疏矩阵,α为稀疏系数,||α||0表示0-范数,即稀疏系数非0的个数。这时,(1)式变为:

Y=AΨα (3)

当测量维数满足K<M<N时,信号X可以通过解决0-范数或1-范数下的优化问题从M=O(KlogN)个测量数据中高概率重构。

对于二维图像信号,由于N的长度非常大。为此,本发明采用分块CS技术(Block-based CS,BCS)[Gan L.Block compressed sensing of natural images[C].In Proceedings of the International Conference on Digital Signal Processing,Cardiff,UK,July 2007,pp.403–406.]对图像进行分块感知处理。在BCS中,一个图像被分成B×B块,并使用一个近似大小的测量矩阵进行采样。假设xi表示图像X通过Z行扫描输入的第i个图像块的向量,那么有:

yi=ΦB·xi (4)

其中,ΦB为B×B大小的测量矩阵。这样图像X的测量数据为:

整个图像X的采样子率为S=MB/B2。这时,(1)式中图像X的测量矩阵A具有对角型结构性矩阵A=diag(Φ),其形式为:

测量矩阵A采用分块哈达玛矩阵BHM(Block Hadamard Matrix)实现图像数据观测。n阶BHM的构造形式如下:

当图像分块大小B=2n时,公式(6)的测量矩阵A为:

则哈达玛矩阵ΦB的实现形式为:

为了高精度提取图像数据,根据BCS值yi的能量大小及其确定的阈值T,把BCS测量数据按照(10)式划分为平滑部分和纹理部分:

其中,T=0.4Em,而为观测值能量的均值。

(2)图像分块的字典学习

根据CS技术,由于冗余字典能以更稀疏的方式表示图像,所以,稀疏表示将信号的能量集中于少量的原子,这些原子包含了图像的主要结构特征。因此,结合平滑图像块和非平滑图像块的结构特征不同,本发明对平滑块和非平滑块选用不同的分类字典。其中,非平滑图像块选用冗余(Redundant Discrete Wavelet Transform,RDWT)字典[Fowler J.E.,“The redundant discrete wavelet transform and additive noise,”[J],IEEE Signal Processing,2005,12(9):629-632.],而平滑图像块的结构特征比较简单,选用正交DCT字典。

将自然图像库中的图像块按其方向性从0°到180°共分为12类,每类数据分别用K-SVD(K-Singular Value Decomposition)方法训练一类字典[M Aharon,M Elad,A Bruckstein.K-SVD:An algorithm for designing over complete dictionaries for sparse representation[J].IEEE Transaction.on Signal Processing,2006,54(11):4311-4322.],每类字典包括256个原子,另外再加上正交DCT字典一共形成包括3136个原子的冗余字典D。正交DCT字典可以表示图像块中的各向同性特征,而RDWT字典可以表示图像中的角度和方向。

在CS投影域,设图像X的第i个图像块和第(i-1)个图像块的测量数据分别为xi,xi-1,Ri为迭代参差,则Ri迭代过程如下:

Ri=||ΦBxiBxi-1||2=||yiBxi-1||2 (11)

当|Ri-Ri|<β,0<β<1时,字典D迭代停止。图3(a)和3(b)是根据不同图像内容学习构造的Lena图像的字典结果。

(3)图像内容的分类

设计一个与特征相适应、与图像结构吻合的、具有最大识别率(也就是最小的虚警率和漏警率)的分类器也是一个至关重要的步骤。

设αi为基于字典Di∈D的稀疏表示系数向量,为在字典Di中分类检测的稀疏表示系数向量,利用Lasso(Least Absolute Shrinkage and Selection Operator)算法[Dong Wei-sheng,Zhang Lei,Shi Guang-ming,Wu Xiao-lin.Image deblurring and super-resolution by adaptive sparse domain selection and adaptive regularization[J].IEEE Transactionson Image Processing,2011,20(7):1838-1857.]实现图像块在D中每个字典下的稀疏表示系数如公式(12):

式中Dj为D中第j(j=1,…,13)个字典,ρ为权重系数,ρ=max{|(ΦBDj)Tyi|}。将待检测图像在冗余字典下的稀疏表示系数进行l1范数最小化处理,并把字典迭代最小误差β作为约束条件,加入到分类检测过程中,可得稀疏逼近函数为:

其中,λ为权重系数,x′i利用相似图像块得到的含密图像块的秘密信息估计值。根据CS技术令xi=Diαi,通过交替迭代优化k次求解的方法求解式(13)得到:

(14)式中的第一项是为了满足观测方程yi=ΦBxi,第二项为了确定含密信息的存在位置。(15)式中的第一项是为了与式(14)的求解结果最接近,第二项是为了满足图像块在字典下的表示系数最稀疏的原理。采用梯度下降算法对式(14)求解:

式(17)的迭代需要先确定初始值用Lasso算法求解下面优化问题可得到αi的初始解:

再通过稀疏逆变换得到图像块xi初始值:

根据以上原理,如图2所示流程,本发明的图像内容感知的鲁棒通用隐写分析方法包括如下步骤:

(1)设定数字图像X的大小N,分块大小B和测量值大小M;

(2)确定9/7-Haar DWT稀疏矩阵Ψ:

(3)确定BCS的哈达玛测量矩阵ΦB

(4)把数字图像分成B×B块,并根据哈达玛测量矩阵ΦB计算第i个图像块的测量向量yi和整个图像X的测量数据Y:

其中,yi=ΦB·xi,i=1,2,...,B2

则整个图像X的测量数据Y为:

(5)根据BCS测量值每个图像块的能量i=1,2,…,B×B,计算并判断第i个图像块的测量向量yi是否大于或小于阈值T=0.4E,从而把图像分为平滑部分和非平滑部分作为感知结果;

(6)训练过程:

(6.1)根据步骤(5)的不同数字内容感知结果,确定RDWT字典和正交DCT字典:形成字典D=[D1,D2,…,D13];

字典D中2级RDWT字典形式为:

其中,符号表示内积运算,是一种矩阵间元素相乘的运算;

正交DCT字典的形式为:

(6.2)计算得到字典稀疏初始值并计算图像块xi初始值:

所述图像块xi初始值的具体计算过程如下:设di为中字典Di的原子,Ri为迭代参差:Ri=||ΦBxiBxi-1||2=||yiBxi-1||2,字典稀疏初始值是字典原子di和迭代参差Ri的内积,符号的上标0表示第0个值,也就是初始值;

这样得到,图像块xi初始值形式为:

其中,n是数据矢量长度和字典大小,i=1,2,…,n;符号的上标0表示第0个值,也就是初始值;

(6.3)计算图像块xi=Diαi,并按照公式:Ri=||ΦBxiBxi-1||2=||yiBxi-1||2迭代训练更新字典D;

计算过程类似步骤(6.2),实现形式如下:

(7)分类过程:

(7.1)根据公式yi=ΦB·xi,计算第i个图像块的测量值yi,及其能量并结合能量与阈值的关系确定数字图像不同内容的数据范围;

(7.2)计算每个图像块的能量大小:设分别为图像的最大能量和最小能量,计算图像的测试次数Em为图像能量均值;

(7.3)根据公式确定第i个图像块的测量值yi在第j个字典的稀疏系数其中j=1,2,…,13;

的实现形式如下:

(7.4)迭代计算,得到图像稀疏表示系数其中i=1,2,…,3136;按照数字图像非平滑块和平滑块的不同内容,按照由大到小的顺序排列图像稀疏表示系数α0

(8)判断、分析过程:

(8.1)根据公式yi=ΦB·xi和分别计算第i个图像块的测量向量yi和整个图像X的测量数据Y;根据公式计算第i个图像块的能量,并结合其能量大小与阈值的关系确定第i个图像块的数据范围:如果Ei≤T,则属于数字图像的平滑块;如果Ei>T,则属于数字图像的非平滑块;

(8.1.1)图像X的测量数据Y的计算过程如下:

第i个图像块的测量向量yi为:yi=ΦB·xi,其中i=1,2,...,B2

则整个图像X的测量数据Y为:

(8.1.2)确定数字图像非平滑块和平滑块过程如下:

根据BCS测量值yi,计算第i个图像块的能量其中i=1,2,…,B×B(B为分块大小),并根据把图像分为平滑部分和非平滑部分;

(8.2)寻找与xi相似的L个图像块,得到用L个相似块的线性组合表示对当前图像块xi的估计值xi′:

其中,表示相似块的计算系数,它的取值与图像在该区域内的噪声方差成正比,所述噪声方差用稳健中值算子估计;

(8.3)把哈达玛测量矩阵ΦB代入公式:

其中β为迭代参数,其取值范围为|Ri-Ri|<β,0<β<1,更新当前检测图像的分块计算值k为迭代优化次数;

(8.4)根据公式用Lasso算法求解得到αi的初始解并代入公式更新图像块冗余字典系数,并代入以下公式:

求检测图像块的稀疏逼近系数

其中,ΦB为分块哈达玛测量矩阵,y是测量值,d是字典D中的原子,R为迭代计算的误差,α是字典系数,i=1,2,…,n,n=3136;

(8.5)分析判决输出:如果则第i个图像块在第j块字典中含秘密数据,其秘密数据位置为xi;如果则第i个图像块在第j块字典中不含秘密数据,为干净的原始图像块;

(9)重复迭代搜索,直到检测完整个图像数据。

本发明经过实验、模拟,具体实现过程如下:

(1)实验条件和参数

本实验使用的图像库中有4000多幅原始彩色图像,其中BMP、GIF空域格式的图像各1000多幅,JPEG图像2000多幅。用表1列出10种(5种空域隐写工具,5种DCT域隐写工具)不同隐写工具嵌入信息后得到掩密图像各1000幅。训练时采用空域图像1000幅干净图像(其中BMP、GIF各500幅),2500幅用5种空域隐写工具嵌入秘密所得的掩密图像;同样地,DCT域图像1000幅干净图像和2500幅用5种DCT域隐写工具嵌入秘密信息后所得的掩密图像用作训练,剩余图像用作测试图像,并用Photoshop制作了空域图像和DCT域图像经平滑去噪、锐化、缩小、剪切(只做空域图像)、再压缩(只做JPG图像)各100幅,以供测试。

实验时利用的一些检测性能指标的概念说明如下:

阳性检测PD(Positive Detect ion):正确地识别含密图像。

阴性检测ND(Negat ive Detect io n):正确地识别原始图像。

假阳性(或虚警)FP(False Posit ive):将原始图像误判为含密图像。

假阴性(或漏警)FN(False Negat iv e):将含密图像误判为原始图像。

表1隐写工具与嵌入率

表2列出对不同隐写算法实现的隐写分析结果。表中的操作域那一项中,空域阳性检测率就是5种空域隐写方式的平均阳性检测率.同样,DCT域阳性检测率是5种DCT域隐写方式平均的阳性检测率。

表2不同隐写方式、不同操作域、不同处理和原始图像的平均PD、ND、FN和FP率

表3列出对不同隐写算法条件下实现含密和不含密图像的判断结果。表3说明,其中含密图像的秘密像素位置都能够在被检测的图像块中具体标定,说明了本发明隐写分析的精度达到了像素级。

表3不同隐写算法条件下对含密和不含密图像的判断位置结果

图4为图像库中通过本方法实现对不同图像的字典表示的实验结果。以及,图5为图像库中对含密图像通过本方法字典学习能够确定的秘密图像位置的实验结果示意图。

本发明的实施方式不限于此,在本发明上述基本技术思想前提下,按照本领域的普通技术知识和惯用手段对本发明内容所做出其它多种形式的修改、替换或变更,均落在本发明权利保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1