一种基于语义角色位置映射的文本水印嵌入及提取方法_3

文档序号:9453332阅读:来源:国知局
类型语义角色的 一个位置相映射。
[0080] 水印信息映射的具体实现如下:
[0081] 逐个取出由0、1、2表示的水印信息Huffman编码中的码字,将该码字映射为三种 语义角色A0、Al、ADV的一个位置。即0映射为L1集合中的一个位置,1映射为L2集合中 的一个位置,2映射为L3集合中的一个位置。将每个码字映射的位置信息读出,存放于一文 件中。重复上述过程,将水印信息串中的所有码字映射完毕即实现了水印的嵌入,最终得到 一个存储了三种语义角色位置信息的文件。实现这一过程的核心程序代码如下:
[0082]
[0083] }
[0084] data中所含即为水印映射后的位置信息,将其保存到一个文件中,用于提取水印 时使用。
[0085] 如上述基于语义角色位置映射的文本水印嵌入方法,提供一种基于语义角色位置 映射的文本水印提取方法,包括:
[0086] 根据嵌入水印时得到的语义角色的位置信息,找到文本中该位置的语义角色,再 根据语义角色与水印信息码元的对应关系,反向映射得到由码元表示的水印信息串,最终 将其转换成原始水印信息。具体包括如下步骤:
[0087] a)将需要检测水印的文档提交LTP平台进行语义角色标注处理,得到包含文本中 句子成分语义角色关系的XML文件。
[0088] b)打开嵌入水印时形成的位置文件,依次取出一个位置信息,根据该位置信息,在 XML文件中找到对应的位置,判断此位置的语义角色的类型,根据语义角色类型进行反向映 射或译码,如果语义角色类型为A0,则译码为0 ;如果语义角色类型为A1,则译码为1 ;如果 语义角色类型为ADV,则译码为2,直到所有的位置信息全部反向映射完毕,即得到嵌入的 水印信息串。
[0089] 实现上述水印提取过程的主要操作及其程序代码如下:
[0090] 导入位置信息文件:
[0091]
[0092] 提取位置信息:
[0093]
[0094] 反向映射过程:
[0095]
[0096]


[0098]data中所含即为由0、1、2表示的水印信息的Huffman编码。
[0099] 对上述由0、1、2表示的水印信息进行Huffman解码,还原为十六进制的Unicode 编码。实现Huffman解码核心操作的程序如下:
[0100]
[0101] thf中所含即为水印信息的Unicode编码。
[0102] 对水印信息的Unicode编码进行Unicode解码,还原为用字符表示的原始水印信 息。实现Unicode解码的核心程序如下:
[0103]
[0105]
[0106]outBuffer中即为提取出的原始水印信息。
【主权项】
1. 一种基于语义角色位置映射的文本水印嵌入方法,其特征在于包括如下步骤: 1) 对水印信息进行预处理,将水印字符转换成由码元构成的信息串; 2) 通过自然语言处理技术找出文本中语义角色,得到语义角色的位置信息,且将语义 角色类型与表示水印信息的码元一一对应; 3) 逐个取出水印信息串中的码字,将该码字与所对应类型语义角色的一个位置相映 射,对所有码字进行映射,完成水印的嵌入。2. 根据权利要求1所述的基于语义角色位置映射的文本水印嵌入方法,其特征在于所 述语义角色包括表示动作的施事的角色A0,表示动作的影响的角色AlW及关系相对模糊 的角色ADV。3. 根据权利要求2所述的基于语义角色位置映射的文本水印嵌入方法,其特征在于所 述步骤1)中的水印信息进行预处理包括如下步骤: 1-1)采用化icode编码,将水印字符转换成十六进制信息; 1- 2)运用化ffman编码对十六进制信息中的码元数量进行压缩,将十六进制的 化icode码串转换成由0、l、2S种码元表示的化ffman编码,与A0、Al、ADVS种语义角色 相匹配。4. 根据权利要求3所述的基于语义角色位置映射的文本水印嵌入方法,其特征在于所 述步骤2)中,通过语言技术平台LTP处理确定和标记文本中的语义角色,LTP的处理结果 为一个包含文本中句子成分语义角色关系的XML格式的文件,所述文件包含若干用于标明 各种句段关系、句法关系、语义角色的结点标签,所述结点标签包括para、sent、wortarg, 每个类别的结点标签均包含用于标明序号的id属性。5. 根据权利要求4所述的基于语义角色位置映射的文本水印嵌入方法,其特征在于查 找选定的语义角色并标记其位置的方法具体包括如下步骤: 2- 1)对所述XML文件进行解析遍历,定位word结点; 2-2)接着遍历此word结点下的arg结点内的type属性,判断其是否为指定查找的 类型(即A0、AUADV),如果是,则标记出该语义角色的位置,标记语义角色位置的表达式如 下:其中,P表示para属性,S表示sent,日表示Eir邑; 2- 3)重复上述步骤2-1)、2-2),标记出文本中所有的S种语义角色A0、A1、ADV的位置 信息,分别对应地存入S个不同的集合LUL2、L3中。6. 根据权利要求5所述的基于语义角色位置映射的文本水印嵌入方法,其特征在于所 述步骤3)具体包括如下步骤: 3- 1)让水印信息中的S种码元与S种语义角色类型一一对应,即AO对应0,Al对应1, ADV对应2 ; 3-2)逐个取出水印信息串中的码字,将该码字与所对应类型语义角色的的一个位置相 映射,即码字0映射为Ll集合中的一个位置,码字1映射为L2集合中的一个位置,码字2映 射为L3集合中的一个位置,将每个码字映射的位置信息读出,依次存放于一位置文件中; 3-3)重复上述过程,将水印信息串中的所有码字均映射为11、12、L3集合中的一个位 置,映射完成即实现了水印的嵌入,最终得到一个存放了=种语义角色位置信息的位置文 件。7. 根据权利要求6所述的基于语义角色位置映射的文本水印嵌入方法,提供一种基于 语义角色位置映射的文本水印提取方法,其特征在于包括: 根据嵌入水印时得到的语义角色的位置信息,找到文本中该位置的语义角色,再根据 语义角色与水印信息码元的对应关系,反向映射得到由所述码元表示的水印信息串,最终 将其转换成原始水印信息。8. 根据权利要求7所述的基于语义角色位置映射的文本水印提取方法,其特征在于具 体包括如下步骤: a) 将需要检测水印的文档提交LTP平台进行语义角色标注处理,得到包含文本中句子 成分语义角色关系的XML文件; b) 打开嵌入水印时形成的所述位置文件,依次取出一个位置信息,根据该位置信息,在 所述XML文件中找到对应的位置,判断此位置的语义角色的类型,根据语义角色类型进行 反向映射或译码,如果语义角色类型为A0,则译码为O;如果语义角色类型为Al,则译码为 1 ;如果语义角色类型为ADV,则译码为2,直到所有的位置信息全部反向映射完毕,即得到 嵌入的水印f胃息串。
【专利摘要】本发明涉及基于语义角色位置映射的文本水印嵌入及提取方法,嵌入方法包括如下步骤:1)对水印信息进行预处理,将水印字符转换成由码元构成的信息串;2)通过自然语言处理技术找出文本中语义角色,得到语义角色的位置信息,且将语义角色类型与表示水印信息的码元一一对应;3)逐个取出水印信息串中的码字,将该码字与所对应类型语义角色的一个位置相映射,完成水印的嵌入。提取方法包括:根据嵌入水印时得到语义角色的位置信息,找到文本中该位置的语义角色,再反向映射得到由所述码元表示的水印信息串,最终将其转换成原始水印信息。上述方法对文本格式与内容不做任何改变,具有良好的隐蔽性和鲁棒性,能有效抵抗各种常见的格式变换和攻击。
【IPC分类】G06F21/10
【公开号】CN105205355
【申请号】CN201510746611
【发明人】陈建平, 杨方兴, 朱浩, 王杰华, 王进, 文万志
【申请人】南通大学
【公开日】2015年12月30日
【申请日】2015年11月5日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1