一种基于语义角色位置映射的文本水印嵌入及提取方法_3

文档序号：9453332阅读：来源：国知局

类型语义角色的一个位置相映射。
[0080] 水印信息映射的具体实现如下：
[0081] 逐个取出由0、1、2表示的水印信息Huffman编码中的码字，将该码字映射为三种语义角色A0、Al、ADV的一个位置。即0映射为L1集合中的一个位置，1映射为L2集合中的一个位置，2映射为L3集合中的一个位置。将每个码字映射的位置信息读出，存放于一文件中。重复上述过程，将水印信息串中的所有码字映射完毕即实现了水印的嵌入，最终得到一个存储了三种语义角色位置信息的文件。实现这一过程的核心程序代码如下：
[0082]
[0083] }
[0084] data中所含即为水印映射后的位置信息，将其保存到一个文件中，用于提取水印时使用。
[0085] 如上述基于语义角色位置映射的文本水印嵌入方法，提供一种基于语义角色位置映射的文本水印提取方法，包括：
[0086] 根据嵌入水印时得到的语义角色的位置信息，找到文本中该位置的语义角色，再根据语义角色与水印信息码元的对应关系，反向映射得到由码元表示的水印信息串，最终将其转换成原始水印信息。具体包括如下步骤：
[0087] a)将需要检测水印的文档提交LTP平台进行语义角色标注处理，得到包含文本中句子成分语义角色关系的XML文件。
[0088] b)打开嵌入水印时形成的位置文件，依次取出一个位置信息，根据该位置信息，在 XML文件中找到对应的位置，判断此位置的语义角色的类型，根据语义角色类型进行反向映射或译码，如果语义角色类型为A0,则译码为0 ;如果语义角色类型为A1，则译码为1 ;如果语义角色类型为ADV，则译码为2,直到所有的位置信息全部反向映射完毕，即得到嵌入的水印信息串。
[0089] 实现上述水印提取过程的主要操作及其程序代码如下：
[0090] 导入位置信息文件：
[0091]
[0092] 提取位置信息：
[0093]
[0094] 反向映射过程：
[0095]
[0096]

[0098]data中所含即为由0、1、2表示的水印信息的Huffman编码。
[0099] 对上述由0、1、2表示的水印信息进行Huffman解码，还原为十六进制的Unicode 编码。实现Huffman解码核心操作的程序如下：
[0100]
[0101] thf中所含即为水印信息的Unicode编码。
[0102] 对水印信息的Unicode编码进行Unicode解码，还原为用字符表示的原始水印信息。实现Unicode解码的核心程序如下：
[0103]
[0105]
[0106]outBuffer中即为提取出的原始水印信息。
【主权项】
1. 一种基于语义角色位置映射的文本水印嵌入方法，其特征在于包括如下步骤： 1) 对水印信息进行预处理，将水印字符转换成由码元构成的信息串； 2) 通过自然语言处理技术找出文本中语义角色，得到语义角色的位置信息，且将语义角色类型与表示水印信息的码元一一对应； 3) 逐个取出水印信息串中的码字，将该码字与所对应类型语义角色的一个位置相映射，对所有码字进行映射，完成水印的嵌入。2. 根据权利要求1所述的基于语义角色位置映射的文本水印嵌入方法，其特征在于所述语义角色包括表示动作的施事的角色A0,表示动作的影响的角色AlW及关系相对模糊的角色ADV。3. 根据权利要求2所述的基于语义角色位置映射的文本水印嵌入方法，其特征在于所述步骤1)中的水印信息进行预处理包括如下步骤： 1-1)采用化icode编码，将水印字符转换成十六进制信息； 1- 2)运用化ffman编码对十六进制信息中的码元数量进行压缩，将十六进制的化icode码串转换成由0、l、2S种码元表示的化ffman编码，与A0、Al、ADVS种语义角色相匹配。4. 根据权利要求3所述的基于语义角色位置映射的文本水印嵌入方法，其特征在于所述步骤2)中，通过语言技术平台LTP处理确定和标记文本中的语义角色，LTP的处理结果为一个包含文本中句子成分语义角色关系的XML格式的文件，所述文件包含若干用于标明各种句段关系、句法关系、语义角色的结点标签，所述结点标签包括para、sent、wortarg，每个类别的结点标签均包含用于标明序号的id属性。5. 根据权利要求4所述的基于语义角色位置映射的文本水印嵌入方法，其特征在于查找选定的语义角色并标记其位置的方法具体包括如下步骤： 2- 1)对所述XML文件进行解析遍历，定位word结点； 2-2)接着遍历此word结点下的arg结点内的type属性，判断其是否为指定查找的类型（即A0、AUADV)，如果是，则标记出该语义角色的位置，标记语义角色位置的表达式如下：其中，P表示para属性，S表示sent,日表示Eir邑； 2- 3)重复上述步骤2-1)、2-2)，标记出文本中所有的S种语义角色A0、A1、ADV的位置信息，分别对应地存入S个不同的集合LUL2、L3中。6. 根据权利要求5所述的基于语义角色位置映射的文本水印嵌入方法，其特征在于所述步骤3)具体包括如下步骤： 3- 1)让水印信息中的S种码元与S种语义角色类型一一对应，即AO对应0,Al对应1， ADV对应2 ; 3-2)逐个取出水印信息串中的码字，将该码字与所对应类型语义角色的的一个位置相映射，即码字0映射为Ll集合中的一个位置，码字1映射为L2集合中的一个位置，码字2映射为L3集合中的一个位置，将每个码字映射的位置信息读出，依次存放于一位置文件中； 3-3)重复上述过程，将水印信息串中的所有码字均映射为11、12、L3集合中的一个位置，映射完成即实现了水印的嵌入，最终得到一个存放了=种语义角色位置信息的位置文件。7. 根据权利要求6所述的基于语义角色位置映射的文本水印嵌入方法，提供一种基于语义角色位置映射的文本水印提取方法，其特征在于包括：根据嵌入水印时得到的语义角色的位置信息，找到文本中该位置的语义角色，再根据语义角色与水印信息码元的对应关系，反向映射得到由所述码元表示的水印信息串，最终将其转换成原始水印信息。8. 根据权利要求7所述的基于语义角色位置映射的文本水印提取方法，其特征在于具体包括如下步骤： a) 将需要检测水印的文档提交LTP平台进行语义角色标注处理，得到包含文本中句子成分语义角色关系的XML文件； b) 打开嵌入水印时形成的所述位置文件，依次取出一个位置信息，根据该位置信息，在所述XML文件中找到对应的位置，判断此位置的语义角色的类型，根据语义角色类型进行反向映射或译码，如果语义角色类型为A0,则译码为O;如果语义角色类型为Al,则译码为 1 ;如果语义角色类型为ADV，则译码为2,直到所有的位置信息全部反向映射完毕，即得到嵌入的水印f胃息串。
【专利摘要】本发明涉及基于语义角色位置映射的文本水印嵌入及提取方法，嵌入方法包括如下步骤：1）对水印信息进行预处理，将水印字符转换成由码元构成的信息串；2）通过自然语言处理技术找出文本中语义角色，得到语义角色的位置信息，且将语义角色类型与表示水印信息的码元一一对应；3）逐个取出水印信息串中的码字，将该码字与所对应类型语义角色的一个位置相映射，完成水印的嵌入。提取方法包括：根据嵌入水印时得到语义角色的位置信息，找到文本中该位置的语义角色，再反向映射得到由所述码元表示的水印信息串，最终将其转换成原始水印信息。上述方法对文本格式与内容不做任何改变，具有良好的隐蔽性和鲁棒性，能有效抵抗各种常见的格式变换和攻击。
【IPC分类】G06F21/10
【公开号】CN105205355
【申请号】CN201510746611
【发明人】陈建平, 杨方兴, 朱浩, 王杰华, 王进, 文万志
【申请人】南通大学
【公开日】2015年12月30日
【申请日】2015年11月5日

完整全部详细技术资料下载

当前第3页1 2 3