一种基于连续多页文本图像水印嵌入与提取方法

文档序号:8319838阅读:354来源:国知局
一种基于连续多页文本图像水印嵌入与提取方法
【技术领域】
[0001] 本发明涉及一种基于连续多页文本图像水印嵌入与提取方法,属于文本图像版权 保护技术领域。
【背景技术】
[0002] 随着网络与数字产品的快速发展,版权意识与版权保护越来越被人们所关注。数 字水印技术作为数字产品身份认证和版权保护的重要方法,也因此受到越来越多的重视与 研宄。大多数数字产品(文件、书籍、合同等)都是以打印后的文本形式保存和传递,文本 文档包含着丰富的内容与信息,是人们沟通和交流信息必不可少的一部分,对文本文档的 版权进行保护显得尤为重要。
[0003] 据统计结果显示,世界上高达80%的信息量都是通过文本信息来传递的,相比其 他媒介,文本信息的信息传达量相当高。随着打印机、扫描仪等高质量输入输出设备的广泛 应用,许多数字文本作品被任意地复制和传播,以致出现大量的假冒盗版文本作品,使得文 本作品的版权受到严重威胁。因此,如何保护文本作品的版权成为了研宄人员日益关注的 问题。在图像和视频等数字载体中,都包含了足够多的冗余数据,使得对载体做的少量更改 对人类知觉系统不会产生较大的影响,从而水印容量较大。而对于文本信息,由于包含的冗 余信息过少,嵌入少量的信息就会对文本信息产生很大的影响,使得文本水印容量较小,这 种特性给文本水印技术带来了巨大的难题和挑战。
[0004] 从文本水印的传统实现方式上分析,文本水印方法主要可以分为基于文本结构的 方法、基于句法结构的方法、基于文本语义的方法和基于图像的方法。基于文本结构的方 法只适合一些可以改变结构的文本,而不能应用于文档结构不允许改变的文本。基于句法 结构和基于文本语义的方法中,由于句法结构与文本语义的表示比较复杂,使得水印的嵌 入过程需要花费较大的代价,时间复杂度高,不利于水印的使用。现阶段,越来越多的方法 都把文本文档转化为普通图像来进行处理,因为基于图像的方法不仅不具有其他方法的不 足,而且在水印容量上明显高于其他方法。
[0005] 大多数的文本水印算法都是以文本图像中的行或字作为水印嵌入的基本单位,如 陈瑞琳提出,以行为基本单位,算法的不变量为打印扫描前后每行中黑色像素点的个数与 整个文本图像中每行的黑色像素点个数的平均值,根据具体的水印信号,对文本图像中的 像素进行一定数量的翻转,从而对该不变量进行某种意义上的约束,算法中使用的约束为 控制该不变量为一个预先设定的常数的偶数倍或奇数倍,从而嵌入水印信息。李姗姗提出 通过对行空间和字空间的控制在文本图像中嵌入水印信息,在水印提取过程中,把行空间 和字空间的规律解析成具体的水印信号。在这些文本水印算法中,都存在一个共同的缺陷: 水印容量较小,并且都是基于单张文本图像。现有的文本水印算法只能以少量的二进制序 列作为水印信息进行嵌入。在数字图像水印技术中,常用的水印信息为具有标识信息的图 像。文本水印算法的容量低使得这种标识图像不能作为水印信息嵌入在文本载体中,这大 大限制了文本水印算法的实用性。
[0006] 现有的文本图像水印算法的水印容量较低,通常只能以少数二进制序列值作为水 印数据,单张文本图像的水印容量满足不了实际应用对水印容量的需求。

【发明内容】

[0007] 本发明的目的在于提供一种基于连续多页文本图像水印嵌入与提取方法,旨在解 决现有的抗打印扫描文本水印算法中嵌入水印容量较低,满足不了实际的水印容量需求, 不能够对文本文档版权进行保护的问题。
[0008] 本发明是这样实现的,一种基于连续多页文本图像水印嵌入与提取方法包括:连 续多页文本图像水印嵌入方法和连续多页文本图像水印提取方法。
[0009] 本发明水印嵌入过程的具体步骤为:
[0010] ⑴将水印数据W进行Arnold变换后,分割成长度为Z的子序列,WiQ = 1,2, 3,…,Mniax)表示水印信息子序列集合;
[0011] (2)从文本文档图像集合中取出一页文本图像X,并二值化处理;
[0012] (3)将二值文本图像X分成M1*N1的区域,Xi (i = 1,2, 3,…,NnJ表示分区后的 图像的某个区域,Nmax表示原始图像子区域的最大个数,N max由下式计算得到:
[0013]
【主权项】
1. 一种基于连续多页文本图像水印嵌入与提取方法,其特征在于,包括水印嵌入和水 印提取两个过程; 所述水印嵌入过程的具体步骤为: 步骤一,将大小为mXη的二值图像作为水印数据W进行Arnold变换后,分割成长度为 z的子序列,Wi (i = 1,2, 3,…,Mmax)表示水印信息子序列集合; 步骤二,从文本图像集合P中取出其中一页文本图像,大小为Μ*Ν,进行二值化处理,记 为X ; 步骤三,将二值文本图像X分成Μ1*Ν1的区域,XiQ = 1,2,3, 一,NmJ表示分区后的图 像的某个区域,Nmax表示原始图像子区域的最大个数,Nmax由下式计算得到: M*N . =- , max MPNl 步骤四,针对图像分区后的每一个区域,计算文本覆盖率k; 步骤五,令Z表示该文本图像中能够嵌入的最大的水印容量,则Z通过下式计算得到: z = M眶*z ; 其中,z表示每个区域能够嵌入的水印容量,]?_表示有效区域的个数;水印数据的容 量为Z' = m*n,更新剩余需要嵌入的水印容量dz,dz = dz-Z,dz初值为t ; 步骤六,依次从有效区域集合中取出一个区域WXi,将WX^行分块操作; 步骤七,分别计算每一分块的连通面积,对连通面积矩阵进行DCT变换,得到变换后的 系数矩阵C,根据实际需要嵌入的水印容量修改DCT变换后的高频系数; 步骤八,根据队的值计算得到每个像素分块中翻转的像素点。若N i= 0,不需要对该 像素块进行像素翻转
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1