基于同态加密系统的文本信息隐藏安全检测方法

文档序号：6335883阅读：438来源：国知局

专利名称：基于同态加密系统的文本信息隐藏安全检测方法
技术领域：
本发明属于信息安全技术领域，具体涉及一种基于同态加密系统的文本信息隐藏安全检测方法。
背景技术：
文本信息隐藏方法可以在文本载体中嵌入隐秘信息，这种被嵌入隐秘信息后得到的新文本被称为生成文本。利用生成文本隐秘地传输信息的方法可以达到隐藏通信信道和逃避监控的目的。与此相对，文本信息隐藏检测方法的目的在于检测文本是否是含有隐藏信息，区分含有隐藏信息的生成文本和正常文本。在自然语言中，正常文本有很多固有的统计特性，是生成文本所无法具备的。对于正常文本，每个句子中的词语之间往往都有很强的相关性；生成文本中的词间相关性则大大的减弱了，因为生成文本往往不像正常文本那样语义连贯、自然、完整。基于这些特性，文献[陈志立，黄刘生等，“文本信息隐藏的统计监测算法”，2008]提出了文本信息隐藏的统计检测方法。该方法定义，在一个句子中距离小于N的两个词为一个 N窗词对，词间的距离是它们之间的单词个数加一；两个具体的词语χ和y的N窗互信
,、 CC
息为7(x，y) = 1叩27^，这里c为文本段中出现的ν窗词对总次数，cv cjn cy分别 cX "S
为N窗词对“xy”、“X ”和“？ y”出现的次数(其中“？”表示一个任意词)。
常用词词典D的词条数为M，根据该词典D，求得训练语料库(将整个训练语料库当作一个大的训练文本段对待)的N窗互信息矩阵为Tmxm，其中每个元素ty(i，j = l， 2，…，Μ)为词典D中第i个词语和第j个词语在训练语料库中的N窗互信息；类似地，待测样本的N窗互信息矩阵为Smxm，其中每个元素、(i，j = 1, 2，…，M)为词典D中第i个词语和第j个词语在待测样本中的N窗互信息。据此，待测样本的方差定
义为厂二Σ二( -。最后，利用样本方差和一个预定的判定阈值Vtl进行比
较，以自动区分生成文本和正常文本。如果V > Vtl,则待测样本判定为含有隐藏信息的生成文本，否则判定为正常文本。实验证实该方法的正确率达到96.3%。然而，该方法并没有考虑保护隐私的概念。如果训练语料库和预定的判定阈值 V。为检测服务提供方(记为Alice)的私有信息，待测样本是另外的检测服务使用方(记为Bob)的私有资料，他们希望在互不泄漏私有数据的情况下使Bob得到检测结果，那么上述检测方法就无法进行。因此，其应用范围有一定的局限性。

发明内容
本发明目的在于提供一种基于同态加密系统的文本信息隐藏安全检测方法，解决了缺乏信任或强调隐私保护的检测服务提供方和服务使用方之间无私有数据泄漏的隐藏信息的检测。CN 102012980 A
说明书
2/7页为了解决现有技术中的这些问题，本发明提供的技术方案是—种基于同态加密系统的文本信息隐藏安全检测方法，用于服务提供方对服务使用方的文本隐藏信息进行检测，其特征在于所述方法包括以下步骤(1)服务提供方、服务使用方分别对自身私有信息进行预处理，训练得到自身的 N窗互信息矩阵，通过N窗互信息矩阵生成包含私有信息的私有向量a，bk；(2)服务提供方加密自身私有向量a形成向量c，形成同态加密系统；服务提供方将同态加密系统的加密公钥和向量c递交给服务使用方；(3)服务使用方生成w个随机私有数据，通过随机私有数据、私有向量bk、公钥和向量C获得样本的第一变化结果；并将样本的第一变化结果反馈给服务提供方；(4)服务提供方根据样本的第一变化结果通过同态加密系统的私钥进行解密获得变化的私有数据；通过变化的私有数据、预定的判定阈值和训练语料库的N窗互信息矩阵得到服务提供方比较数；服务使用方根据w个随机私有数据和待测样本的N窗互信息矩阵得到服务使用方比较数；(5)服务提供方和服务使用方合作执行安全比较协议，根据服务提供方和服务使用方的比较数的大小判定文本信息是否含有隐藏信息。优选的，所述方法具体按照如下步骤进行(a)服务提供方建立自身私有训练语料库的N窗互信息矩阵Tmxm= [ty]MXM;服务使用方根据w个待检测文本TB1, TB2,…，TBw获得包含自身私有信息的N窗互信息矩阵SL*,.",S^m，其中SLw =WLxm (免=1,2，…，w);(b)服务提供方根据矩阵Tmxm生成向量a = (a1 a2,…，O ,其中η = Μ2，向量a的每个元素都是整数，其中aM(1_lH= IO4XtljG, j = 1，2，…，Μ)；服务使用方根据矩阵S^m生成向量& =^AV..，心…= I,2,...,—，其中η = Μ2，向量bk的每个元素都是整数，其中蜷=10、4 (/,i=l,2,-,M)；(C)服务提供方通过基于同态加密的安全协议获得私有的整数Ul，U2,…，uw；服务使用方通过基于同态加密的安全协议获得私有的整数V1, V2,…，Vw,其中Uk = a · bk+vk,且 0 <
(d)服务提供方根据其私有的数据Ul，U2, …，uw,预定的判定阈值Vtl和训练语料库的N窗互信息矩阵Tmxm = [ ]ΜΧΜ,得到整数 VkA=YlXMM{\0A^2-Iuk-IQ"MX^xW2M2 ；同时服务使用方根据其私有的数据V1，V2，…，Vw和待测样本的N窗互信息矩阵S^m，S2mxm ,…,S^m得到整数 (e)服务提供方和服务使用方合作执行安全比较协议，使服务使用方根据Fj和 G (Α二1,2，···,ν!；)的大小判定文本信息是否含有隐藏信息。优选的，所述方法中如果Fj >0，服务使用方判定待测文本TBk为含有隐藏信息的生成文本，否则服务使用方判定TBk为正常文本。优选的，所述方法中服务提供方生成一对同态的公钥加密系统的密钥对 (pk, sk),使得密文空间为^，其中pk和sk分别是公钥和私钥，In = IO12XM2;加密a,得到C1 = Epk(a) (i = 1，2， …，η),并将C1, C2, …，cn和公钥pk发送给服务使用方；服务使用方生成w个随机正整数Vl，V2,…，vw,使得0<vk < IO12M2Oc= 1，2，…，w)，并计算 Λ 二五沐(\)]"1二4 (免=1,2,…，发送 y”
y2，…，7 给服务提供方；利用私钥sk，服务提供方解密^得到变化的私有数据 uk = Dsk (yk)α对二 a. b左 (免=1,2,…，w)。优选的，所述方法是利用计算机进行完成。本发明目的在于解决文本信息隐藏检测服务提供方(记为Alice)和检测服务使用方(记为Bob)，在合作完成文本信息隐藏检测时将会造成私有信息泄露的问题，本发明提出一种文本信息隐藏安全检测方法。通过本发明的设计，检测服务使用方Bob只可以得到其私有的待测样本的判定结果；检测服务提供方Alice得不到Bob的任何私有信息，包括每个待测文本的判定结果。本发明目的中所要解决问题的具体设置环境可以为检测服务使用方Bob拥有 w个私有文本TB1, TB2,…，TBW；检测服务提供方Alice拥有文本信息隐藏检测方法，并秘密持有方法的各个参数和私有的训练语料库。他们需要通过合作计算，利用Alice的检测方法判断出Bob的每个私有文本是否含有隐藏信息，检测结果只有Bob知道，同时保证双方的私有信息不会泄漏。通过相互独立的服务提供方对服务使用方传递非私有信息来完成文本信息隐藏的检测，双方采用同态加密系统和执行安全比较协议，根据服务提供方和服务使用方的比较数的大小判定文本信息是否含有隐藏信息。本发明的目的通过以下技术方案实现通过对样本方差进行等价转化，使得检测服务提供方Alice和服务使用方Bob 各自计算出样本方差的部分信息，这一过程他们需要共同执行基于同态加密系统[Pascal Paillier, "Public-Key Cryptosystems Based on Composite Degree Residuosity Classes”， EUROCRYPT' 99]的安全过程，然后他们合作执行安全的比较过程，使得Bob得到待测样本的判定结果。包括以下步骤预处理.根据常用词词典D，服务提供方Alice计算出其私有的训练语料库的N窗互信息矩阵Tmxm = [ ]ΜΧΜ ；检测服务使用方Bob分别求出w个待检测文本TB1, TB2, …，TBw WN窗互信息矩阵S^xm,…,S；；* ,其中
SL^ =[<]MxM G = I,2,···,—』窗互信息矩阵中每个元素都保留四位小数。步骤1.根据矩阵Tmxm，Alice生成向量a= (a1; a2,…，O ,其中η = Μ2。向量a的每个元素都是整数，其中aM(1_lH= IO4XtyG, j = l，2，…，Μ)。步骤2.根据矩阵S^m，Bob生成向量1^ =树劣,…次)(众=1,2，…,W)，其中n = Μ2。向量bk的每个元素都是整数，其中圮(M)+, =IO4X^ (i,j = 1,2,-Μ) ο步骤3.Alice和Bob通过基于同态加密的安全协议分别获得私有的整数Ul， u2,…，uw*Vl，v2,…，vw,使得 uk = a · bk+vk，且 0 < vk < 1012M2(k = 1， 2， …，w)，具体过程如下步骤3.1.Alice生成一对同态的公钥加密系统的密钥对(pk，sk),使得密文空间为2 ，其中pk和sk分别是公钥和私钥，m= IO12XM2;加密％得到￡；1 = &(&1)(丨=1， 2，…，η),并将C1, C2, …，Cn和公钥pk发送给Bob。
步骤3.2.Bob生成w个随机正整数V1, V2,…，Vw,使得0 < vk < IO12M2 (k = 1，2，…，w)，并计算凡= (Κ)]! ' 0 = 1,2,、—，发送71，y2，…，7 给 Alice0步骤3.3.禾Ij 用私钥 sk，Alice 解密 yk 得到 uk=Dsk(yk) +工二以对二3.1^+、^ = 1，2，…，)。步骤4.根据其私有的数据Ul，u2, …，uw, V0(预定的判定阈值)和训练语料库的N窗互信息矩阵Tmxm = [ ]ΜΧΜ, Alice计算出整数
vA = Σμ Σ μ °4 )2 - -108 M2F0 + 3 χ 1012 M2 ；同时，根据其私有的数据 Vl，
v2,…，Vw和待测样本的N窗互信息矩阵SLxm,8^χΜ,···，8:Μ，Bob计算出整数
^ =SxlO2M2(免=1,2,·.·,w)。步骤5.Alice和Bob合作执行安全比较协议[秦静，张振峰等，“无信息泄漏的比较协议”，2004]，使得只有Bob获得Fj和U 0 = 1,2,···,W)的大小比较结果，并保证比较过程不泄漏双方的任何私有信息。如果G > VkB，Bob判定待测文本TBk为含有隐藏信息的生成文本，否则Bob判定TBk为正常文本。相对于现有技术中的方案，本发明的优点是本发明的突出的实质性特点和显著地进步主要体现在本发明可以使得文本信息隐藏的检测服务使用方Bob得到每个待检测文本段的准确检测结果，同时保证了服务提供方Alice和服务使用方Bob的私有信息都不会因为该服务的执行而发生泄漏。本发明使得文本信息隐藏的检测服务可以在相互缺乏信任的独立方合作展开。由此可见，本发明为本技术领域的进步拓展了空间，具有实用效果。

下面结合附图及实施例对本发明作进一步描述图1为本发明基于同态加密系统的文本信息隐藏安全检测方法的流程图。
具体实施例方式以下结合具体实施例对上述方案做进一步说明。应理解，这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整，未注明的实施条件通常为常规实验中的条件。实施例文本信息隐藏安全检测实现本实施例的文本信息隐藏安全检测方法，利用基于同态加密系统[Pascal Paillier, "Public-Key Cryptosystems Based on Composite Degree Residuosity Classes”， EUROCRYPT' 99]的安全变换过程，对样本方差进行等价转化，使得检测服务提供方 Alice和服务使用方Bob以和(差)的形式共享各个待测文本的方差，然后通过安全比较协议[秦静，张振峰等，“无信息泄漏的比较协议”，2004]，使得Bob得到待测样本的判定结果。其特别之处在于，利用安全设计，使得私有待测文本的持有者Bob独自获得判定结果，而不会引起任何私有数据的泄漏。
具体来说，在各自生成N窗互信息矩阵后，安全检测过程分为两个阶段。第一个阶段(包括步骤1到步骤3)是，利用同态加密方法，Alice和Bob合作计算出每个待测文本的方差，结果以和的形式由双方共享，计算过程不会泄漏双方的N窗互信息矩阵中的任何值。在这一阶段中，Alice和Bob将预处理阶段得到的各自私有的 N窗互信息矩阵Tmxm = [ty]MXM和轧
权利要求
1.一种基于同态加密系统的文本信息隐藏安全检测方法，用于服务提供方对服务使用方的文本隐藏信息进行检测，其特征在于所述方法包括以下步骤(1)服务提供方、服务使用方分别对自身私有信息进行预处理，训练得到自身的N窗互信息矩阵，通过N窗互信息矩阵生成包含私有信息的私有向量a，bk；(2)服务提供方加密自身私有向量a形成向量c，形成同态加密系统；服务提供方将同态加密系统的加密公钥和向量c递交给服务使用方；(3)服务使用方生成w个随机私有数据，通过随机私有数据、私有向量bk、公钥和向量c获得样本的第一变化结果；并将样本的第一变化结果反馈给服务提供方；(4)服务提供方根据样本的第一变化结果通过同态加密系统的私钥进行解密获得变化的私有数据；通过变化的私有数据、预定的判定阈值和训练语料库的N窗互信息矩阵得到服务提供方比较数；服务使用方根据w个随机私有数据和待测样本的N窗互信息矩阵得到服务使用方比较数；(5)服务提供方和服务使用方合作执行安全比较协议，根据服务提供方和服务使用方的比较数的大小判定文本信息是否含有隐藏信息。
2.根据权利要求1所述的方法，其特征在于所述方法具体按照如下步骤进行(a)服务提供方建立自身私有训练语料库的N窗互信息矩阵Tmxm= [ ]ΜΧΜ ；服务使用方根据w个待检测文本TB1, TB2,…，TBw获得包含自身私有信息的N窗互信息矩阵SL^SLw,".,si;xM，其中=KLxm (众二1，2’...,妁；(b)服务提供方根据矩阵Tmxm生成向量a=(ai，a2,…，O，其中n = M2，向量 a的每个元素都是整数，其中aM(1_lH = IO4XtljG, j = 1，2，…，Μ)；服务使用方根据矩阵成向量1/=树劣,..·,心(众二I,2,.··,—，其中η = M2，向量bk的每个元素都是整数，其中(/,7=1,2,-·,Μ);(c)服务提供方通过基于同态加密的安全协议获得私有的整数Ul，U2,…，Uw; 服务使用方通过基于同态加密的安全协议获得私有的整数Vl，V2,…，Vw,其中Uk = a · bk+vk,且 0 < vk < IO12M2 (k = 1，2，…，w)；(d)服务提供方根据其私有的数据U1,U2, …，Uw,预定的判定阈值Vtl和训练语料库的N窗互信息矩阵Tmxm = [ ]ΜΧΜ,得到整数Vj = Σ二Σ二(10\)2 _2仏-10sM2V0+3x\0uM2 ；同时服务使用方根据其私有的数据Vl，V2,…，Vw和待测样本的N窗互信息矩阵S^xm,S^M，···,S^m得到整数 ” =3xl02M2-2Vi_nX (众=1,2,...，+(e)服务提供方和服务使用方合作执行安全比较协议，使服务使用方根据巧和 G 0 = 1,2,…,W)的大小判定文本信息是否含有隐藏信息。
3.根据权利要求2所述的方法，其特征在于所述方法中如果^^> Vke，服务使用方判定待测文本TBk为含有隐藏信息的生成文本，否则服务使用方判定TBk为正常文本。
4.根据权利要求2所述的方法，其特征在于所述方法中服务提供方生成一对同态的公钥加密系统的密钥对(pk，sk),使得密文空间为^^，其中pk和sk分别是公钥和私钥，m=IO12XM2;加密年得到 C1 = Epk (a) (i= 1，2，…，η),并将 C1, C2,…，Cn 和公钥 pk发送给服务使用方；服务使用方生成w个随机正整数Vl，V2,…，vw,使得0<vk < IO12M2Oc= 1，2，…，w)，并计算凡(Vt)JXl1 cf (k = 1，2，…，w)
5.根据权利要求2所述的方法，其特征在于所述方法是利用计算机进行完成。
全文摘要
本发明公开了一种基于同态加密系统的文本信息隐藏安全检测方法，用于服务提供方对服务使用方的文本隐藏信息进行检测，通过相互独立的服务提供方和服务使用方交互传递非私有信息来完成文本信息隐藏的检测，双方采用同态加密系统和执行安全比较协议，根据服务提供方和服务使用方的比较数的大小判定文本信息是否含有隐藏信息。该方法使得文本信息隐藏的检测服务可以在相互缺乏信任的独立方之间进行。
文档编号G06F21/00GK102012980SQ20101054464
公开日2011年4月13日申请日期2010年11月16日优先权日2010年11月16日
发明者朱友文, 杨威, 陈志立, 黄刘生申请人:中国科学技术大学苏州研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱友文;黄刘生;杨威;陈志立
技术所有人：中国科学技术大学苏州研究院
我是此专利的发明人

上一篇：基于价格走势唯一分解的多周期三类买卖点证券投资方法
上一篇：人机交互方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。