作品版权保护法的制作方法

文档序号:6606328阅读:335来源:国知局
专利名称:作品版权保护法的制作方法
技术领域
本发明涉及一种中文作品版权保护方法,该方案基于同义词替换的中文信息隐藏 方法,可以有效在作品中嵌入版权信息。
背景技术
随着计算机和互联网技术的迅猛发展和普及,人们每天利用因特网来传输和交换 大量的文本数据,这使得利用文本数据进行信息隐藏成为一种非常重要的隐秘通信渠道。 为了在纯文本中嵌入隐藏信息,美国普渡大学Mikhail J. Atallah等于2000年提出了自然 语言文本信息隐藏的概念。所谓自然语言文本信息隐藏,就是利用自然语言处理技术,通过 改变文本中的词汇、语法或语义等属性来嵌入信息,并且尽可能的保留原文的意思。基于同 义词替换的隐藏方法就是通过词汇的替换来嵌入信息。目前,国外对基于同义词替换的方 法研究的很多,该研究已经逐渐成为一项公开、成熟的技术。但已有的信息隐藏技术仅仅应 用于隐秘通信方面,在版权保护领域,尤其是中文版权保护的应用尚属空白。目前,版权保护已经成为知识产权领域的重点。网络的发展给文化的发展带来了 更快捷的渠道、更广阔的空间,与此同时,在网络中知识产权更易于受到侵犯也成了一个难 以避免的问题。在知识产权保护中,文学作品由于其仅仅为文字构成的特殊性,使其难以加 载产权信息,给其知识产权保护带来了一定困难。现有的网络文学作品知识产权保护方法 常见的是采用图片发布文学作品,同时在图片中添加各种水印来存储版权信息。然而这种 手段的抗攻击性很差,尤其是该方法无法抵抗文字识别等攻击手段,攻击者可以简单的将 图片还原为文本,从而剔除图片所保存的一切版权信息,因此并没有有效起到对作品的保 护作用。

发明内容
本发明需要解决的技术问题是提供一种作品版权保护方法,该方法能够将版权信 息以同义词替换的方式隐藏在文字作品,很难被发现和破解。为解决上述问题,本发明所采取的技术方案是一种中文作品版权保护方法,该方 法包括以下步骤1)构建一个同义词库。2)对需要添加的版权信息进行编码。3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征 词,并将检索到的特征词及其位置记录存档。4)将检索到的特征词依次根据版权信息编码对应位数的数字依据某种规则进行 替换。例如对第一个词进行操作时,检查版权信息编码第一个数字,若为0,则不替换,若 为1则替换,以此类推。5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特 征词及其位置,通过对比依据规则还原版权信息编码。在前面的例子中,还原方法为特征词位置上的词与所存词一样,则该位编码为0,反之为1。6)根据还原的编码译码得到版权信息。采用上述技术方案所产生的有益效果在于本发明通过对版权信息进行编码,并 将该编码以同义词替换的形式体现在文字作品中,使得非授权者很难发觉并破解版权信 息,从而盗版作品中隐藏的版权信息基本无法被抹除,可使版权所有者易于查找盗版方,维 护了消费者和版权人的利益。


图1是采用本发明方法储存版权信息“325”后的小说《间客》片段;图2是没存储版权信息的小说《间客》片段。
具体实施例方式下面结合附图对本发明做进一步详细描述本发明是为解决盗版问题提出的解决方法,其包括以下步骤1)构建同义词库。2)对需要添加的版权信息进行编码,形成二进制字符串。3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征 词,并将检索到的特征词及其位置记录存档。4)将检索到的词依次根据版权信息编码对应位数的数字进行替换,如对第一个词 进行操作时,检查版权信息编码第一个数字,若为0,则不替换,若为1则替换,以此类推。发 布时,将发布替换后的作品。5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特 征词及其位置,通过对比还原版权信息编码,即特征词位置上的词与所存词一样,则该位编 码为0,反之为1。6)根据还原的编码译码得到版权信息。如图2所示的小说《间客》的部分内容,采用本实用新型的方法将版权信息十进制 数字“325”体现在作品中,形成图1,以追踪盗版。图1所示作品的制作过程如下首先构建同义词库;本例中仅仅构建了一个小的仅有九对同义词的同义词库重 要人物=重要角色;羡慕=艳羡;期间=期中;美貌=貌美;听话=乖巧;清清=清澈;欢 乐=快乐;自己的=自己;钓杆=鱼杆。当然,实际使用中可以构建更大的词库。其次将版权信息进行编码,形成一组数字字符串,数字字符串长度计为L ;本例采 用二进制编码方式对十进制版权信息“325”进行了编码,其转换为二进制后的数字字符串 为“101000101”,数字字符串长度为9。当然为了使编码不易被破解或伪造,版权信息可以 进行加密、签名等多种变换。之后在待嵌入版权信息的文章中进行检索,查找同义词库中存在的词汇。特别的, 若查到的词汇(下面将称之为特征词汇)数量大于L,则可根据任意一种方法选择L个,比 如随机选择。在本例中仅有9个特征词汇,就选取全部词汇作为特征。然后根据版权信息编码,以及替换规则对作品中的特征词进行替换。第i个文字使用数字字符串中第i个数字对应的替换规则进行替换,即若该数字为0,则不替换,若 为1,则将对应词替换为其同义词,其中,0 < i < L。本例中第1个特征词“重要人物”对 应“101000101”的第1个数字“1”,因此替换为“重要角色”。第2个特征词“羡慕”对应 “101000101”的第2个数字“0”,因此不进行替换,依次类推,形成图1所示的文章。当版权所有者发现了盗版文章时,可以进行如下检测,同样以图1为例。版权所有 者拥有文章的原始数据,并拥有特征词汇的位置信息。版权所有者将依次检查特征词汇部 分对应词汇是否被替换了,并替换情况依据替换规则进行翻译。在上述替换规则中,若替换 过,则该位检测编码为1,反之为0。当检测完所有特征词汇位置后,版权所有者将得到版权 信息编码,在本例中,即为编码“ 101000101”。将该编码依据编码算法进行译码,在本例中为简单的十进制-二进制转换,经过 转换后即获得版权信息“325”。
权利要求
一种作品版权保护方法,该方法包括以下步骤1)构建同义词库;2)对需要添加的版权信息进行编码,形成二进制字符串;3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征词,并将检索到的特征词及其位置记录存档。4)将检索到的词依次根据版权信息编码对应位数的数字依据某种规则进行替换。例如对第一个词进行操作时,检查版权信息编码第一个数字,若为0,则不替换,若为1则替换,以此类推。5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特征词及其位置,通过对比还原版权信息编码。特征词位置上的词与所存词一样,则该位编码为0,反之为1。6)对还原的编码进行译码,得到版权信息。
2.根据权利要求1所述的作品版权保护方法,其特征在于该方法包括以下步骤构建 同义词库。
3.根据权利要求1所述的作品版权保护方法,其特征在于所述步骤5)、6)构成的版权 检测方法通过查找原始文章中特征词是否被替换,来检测版权信息。
全文摘要
本发明公开了一种中文作品版权保护方案,该方案基于同义词替换的中文信息隐藏方法。该方案包括以下步骤1)构建同义词库;2)对需要添加的版权信息进行编码;3)在需要保护的作品文本中进行检索,找到同义词库中已有的词,将其作为特征词,并将检索到的特征词及其位置记录存档。4)将检索到的词依次根据版权信息编码对应位数的数字进行替换。5)在得到一个待检测的可能含有版权信息的作品文本时,查找存档中该作品的特征词及其位置,通过对比还原版权信息编码。6)根据还原的编码译码得到版权信息。本发明抗检测能力强,使得非授权者很难察觉或破解版权信息,维护了消费者和版权人的利益。
文档编号G06F21/24GK101901325SQ201010232710
公开日2010年12月1日 申请日期2010年7月21日 优先权日2010年7月21日
发明者赵步 申请人:赵步
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1