一种基于关键词替换的文本密写方法

文档序号:6552751阅读:364来源:国知局
专利名称:一种基于关键词替换的文本密写方法
技术领域
本发明属信息安全领域,涉及一种基于关键词替换的文本密写方法。
背景技术
Meganography (密写术、隐写术)是一门关于信息隐藏的技巧与科学,所谓信息隐藏(informationhiding)指的是不让除预期的接收者之外的任何人知晓信息的传递事件或者信息的内容。现代的密写技术主要是依靠在图像、音频、视频等大容量的文件中隐藏信息。还有一种特殊的信息隐藏技术,是1983年Simmons提出的阈下信道(subliminal channel),狭义的阈下信道主要采用数字签名等来实现消息隐匿,但是阈下信道可以被封闭,并且利用数字签名传输的阈下消息往往很短。可见,目前的信息隐藏技术要么需要依靠大文件作为载体,要么只能传输很短消息,伪装文本(载体,covertext)利隐秘文本 (stegotext,这里称为原文)相比较大很多,信道利用率不高。一旦被禁止发送图片音频、 视频等大容量的文件,不允许进行数字签名的情况下,秘密消息的隐匿就无法实现,而信息隐藏利阈下信道问题往往是针对被监视的因犯之类的背景的,监管入完全可以禁止任何可能隐匿消息的行为。我们也曾经设计了一种采用流密码来控制子密钥的文本密写方法,但是,得到的伪装文本虽然具有误导性,但是由于是流密码产生的密钥序列,伪装文本是根据密钥序列产生的,不能随意去设置伪装文本,本发明设计了一种可以任意误导对方的密写方法。

发明内容
本发明旨在克服现有密写方法冗余量大,依赖于图像、语音数据的缺点,提供一种对文本进行密写的方法,并且可以具有误导的功能。与加密不一样,密写的伪装文本直接进行传递,对方会以为是明文,所以可以直接去误导对方。为具备误导功能,在本发明中,设计了采用类似完形选抒题密写的方式,它需要有一个关键词数据库,在数据库中,把相似、相近、相反或者可以替代的关键词放在一个相同的组中。密写的时候,打开文件,读取文本的内容,密写时候把关键词替换成为具有相同性质的关键词,这一个关键词与原关键词意义相近、相反或者具有替代性。密写的时候,密写系统将这一组中的所有的同一组中的关键词显示出来,密写则可以进行选择,将文本中的关键词按照顺序替换为自己选择的关键词,并且依据替换的位置差异而生成一个密钥,便于提取原文本的时候能够正确还原。由于文本中的关键词都是被用相似、相近和相反的关键词代替的,因而伪装文本具有误导作用。关键词数据库是一个基础性的数据库,在设计的时候,为了保证密写和提取的唯一可逆性必须禁止一个关键词出现在两组关键词中。因为如果关键词有包含关系,比如关键词数据库中有中华,也有中华人民共利国。此外,如果一个关键词出现在数据库的两组关键词中,则加密利解密也会遇到歧义而无法得到确定的结果的问题。此外为了避免歧义,关键词之间互相不存在包含关系,不能有重合。
在进行替换的时候,有些关键词的替换是固定的、自动进行的,而有些关键词则是由发送者来自己随心所欲选择。这样的误导效果更好。在每一组关键词中,有一个属性代表是否是固定的替换1)如果是固定的替换, 这样的固定替换的组中只有两个词,当然一般这样的替换是一对反义词。2)如果是非固定的替换,在数据库中,每一个关键词在这一组中都有一个编号,从0,1,一直到n-1,其中η 为这一组中的关键词数目。密写的时候,将所有这一组中的关键词都显示出来,让发送者选择其中的关键词替换,系统记录关键词替换的关系,并且以此来生产一个密钥,密钥k = a-b mod(n),其中a是原文中的关键词,b是被选中进行替换的关键词的编号。这样可以保证提取原文的时候能够根据对应关系恢复原文。密钥只是针对非固定的替换,对于固定的替换,直接根据固定的对应关系提取原文的关键词。密写完成以后,就会根据原文中关键词的序列生成了一个密钥k的序列,解密的时候用这个序列进行解密,逐一计算a = b+k mod (η),就可以确定原文中的关键词。根据数据库中每一组中关键词的最大数目max {η},计算[log2max{n}]+l,即可以得出密钥k编码需要的最少比特数,其中[]表示取整。由于密写本身是伪装成明文的形式,对手并不知道已经经过了密写,所以关键词数据库需要保密,特别是那些固定的关键词替换的部分。密写不同于加密,加密是可以让对方知道加密过程的存在的,而密写则不应该,而且伪装文本应该是一个正常的,有意义的文本或者图像之类的,这样才能够起到误导的效果,本发明采用关键词替换,发送者选择关键词使得伪装的文本具有意义。由于该密写方法只是对文本内容进行替换,因此,对于文档的密写需要先打开文档,比如先打开word或者txt文档,读取里面的文本内容,再对文本内容进行伪装替换,最后将替换后的文本进行保存,而提取隐秘信息的过程则是一个相反的过程。
具体实施例方式下面举例说明假设现在要对一个.txt文本文件进行密写,其文本的内容为“今天是星期一”。在系统的关键词数据库中,“今天”对应的一组关键词是“明天”、“后天”,替换属性是非固定替换;“是”对应的一组关键词是“不是”,替换属性是固定替换。数据库中所有组中关键词最多的一组有15个关键词,即可得出密钥k只需要4个比特,因此设定每一个关键词对应的k为4比特。密写的时候,先用记事本打开文本文件,读取内容。然后逐一在文本中搜索是否有关键词,根据关键词的属性进行相应替换。今天由于是关键词,而且是非固定的,所以,将今天、明天、后天全部显示出来,它们对应的编码分别为0,1,2,发送者进行选抒,比如发送者选择后天,则k = 0-2mod(3) = 1,我们取0001作为密钥,并且将它写入总密钥的最前面的 4比特中,后面如果有关键词,继续按照顺序往后写。接着对文本继续按照顺序扫描和搜索, 发现“是”是关键词,且为固定的替换,所以直接将“是”替换为“不是”。得到伪装文本“后天不是星期一”,将文本存入txt文件,作为伪装文本文件,总密钥为0001。提取原文的时候,打开文本文件,读取“后天不是星期一”,在文本中搜索,后天是关键词,所以读取总密钥中最前面的4比特,0001,后天在数据库中的该组中的编号为2,a =2+1 mod(3) =0,所以取编号为0的关键词,即今天。接着搜索到“不是”是关键词,根据属性,直接将它还原为是。因此,可以得到原始的文本为“今天是星期一”,将它存入txt文件,即得到了原始文件。
权利要求
1.一种基于关键词替换的文本密写方法,其特征在于是针对文本的密写,将文件打开, 读取文本,进行一定的关键词替换,由于替换的词可能和原来的词意义相近、相反和类似, 替换后的文本依然具有意义,并且可能与原来的意义相近、相反,使之具有随意误导的功能。
2.如权利要求1所述的基于关键词替换的文本密写方法,其特征在于在进行固定替换的时候,直接将一个关键词替换为数据库中规定的关键词,无需生成密钥,提取原文无需利用密钥。
3.如权利要求1所述的基于关键词替换的文本密写方法,其特征在于在进行非固定替换的时候,发送者可以直接选择自己想要用于误导监听者的关键词,根据关键词和原来关键词的对应关系,生成子密钥,提取原文时根据对应的子密钥来还原原文中的关键词,密钥的对应关系是根据关键词的先后顺序在总密钥中截取固定长度的对应子密钥。这种发送者选择关键词的方法可以明显提高误导的针对性,达到很好的误导效果。
全文摘要
本发明涉及一种基于关键词替换的文本密写方法,通过两种不同形式的关键词替换,使得发送者可以将重要的关键词替换为自己希望的关键词,达到随心所欲的误导目的。在密写的时候,可以随意选择关键词,并且根据替换前后的关键词之间的关系生成密钥,接受者根据总密钥可以提取原文。由于替换的关键词是发送者确定的,因而具有很好的针对性,误导效果更好,不容易暴露破绽。在一个截获到伪装文本的监听者(对手)看来,发送的伪装文件应该是原文,因为文本有意义,而如果是经过加密一般是无意义的,并且其他的密写方法,比如在视频、音频文件中的密写需要有多媒体文件,岂不知原文经过密写处理,具有误导的功能,甚至于伪装文本的意义和原文意义相反。
文档编号G06F21/24GK102169535SQ20111009430
公开日2011年8月31日 申请日期2011年4月11日 优先权日2011年4月11日
发明者王勇 申请人:桂林电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1