可在文档印刷品的笔迹上埋入信息的方法

文档序号：6554926阅读：210来源：国知局

专利名称：可在文档印刷品的笔迹上埋入信息的方法
技术领域：
本发明涉及一种在印刷媒体的文字上以图形编码的形式记录和识别计算机信息处理装置，即网屏编码文件追迹装置。
背景技术：
随着新材料新技术的开发和应用，作为数据信息记录的载体，已由最初的纸介质载体发展到磁、光介质及存储器等。但纸作为信息载体仍具有无可替代的作用。在“无纸化运动”推广十多年之后，其使用量不但没有减少，反而一直保持10％的年增长率，每年数百万台的打印机销量和上千万台的打/复印机保有量就是这个事实的佐证。纸质文件的原始性、实证性、直观性、作为法律凭证财务资产凭证的作用、以及安全性、耐久性等特点，不一而足，这些都是电子文件所无法取代的。目前大量重要的机密信息和重要文件等都是以纸介质作为存储载体。但随着高速个人计算机、高分辨率激光打/复印机、扫描仪和电荷耦合器件的发明和商业化应用，机密文件、证书证件等被随意非法打印、复制、流传等等，导致个人、企业及国家的大量重要信息流失，社会的政治及经济秩序受到威胁。据有关方面统计，由此造成全社会每年直接经济损失高达9000亿美元，已成为仅次于毒品犯罪的全球第二大公害。为此，各发达国家已经开始立法和研究各种对策，如何解决纸介质信息安全问题被称为二十一世纪最被关注的国际性前沿研究课题之一，同时也成为世界性难题。
在国际上，数字水印技术(digital watermarking)，是多媒体信息安全研究领域的一个热点，也是信息隐藏技术研究领域的重要分支，在工业界与学术界得到了极大地重视。但绝大多数是为解决电子文件的防复制或防篡改等的安全问题，很少用于纸介质的信息埋入，特别是针对文件这种单一文字内埋入信息量很少，且鲁棒性低，不能用于纸介质文件及身份认证等的防伪和追迹认证。
目前采用的二维条码技术是在一维条码的基础上产生出来的，因此很难跳出一维条码的局限，首先所有的二维条码的提案仍然采用将黑色区域表示信息代码“1”，白色区域表示信息代码“0”。同时二维条码同一维条码一样必须单独出现，占据一定的空间，肉眼极易发现，而且易于被复制，安全性差。况且纸张污染对二维条码的正确解读是致命的问题。
在打印机信息安全领域的研究中，日本的富士施乐公司通过在打印的文件背景上打印一些直径不足一毫米的黄色点阵代码来记录用户文档的打印日期和时间以及打印机的序列号信息，该技术只能限定于彩色打印机，不适用于普通的黑白打印机。并且该技术不涉及网屏技术。
针对上述打印机、复印机、一体机所存在的问题，一种新型的能够适用于大部分普通黑白打印机的具有打印文档追迹功能的装置成为下一代文档安全的趋势。
针对文档文字进行信息埋入最新的提案是由日本著名打印机厂商公开的名为“信息埋入装置，信息检出装置，信息埋入检出系统，信息埋入方法，信息检出方法，信息埋入检出程序及纪录媒体[特开2005-341493]的专利。该方法通过在文字图像的每一行或列添加一定的黑色像素点，使其个数成为一个常数的奇数倍或是偶数倍，按照奇数倍或是偶数倍决定是“1”还是“0”。这种方法可以解决埋入信息后文字印刷质量降低的问题。但是，埋入的信息量非常少，并且如果文档图像出现倾斜时会造成识别非常困难的致命问题。
针对文档文字进行信息埋入另一个最新的提案是由日本另外一个著名打印机厂商公开的名为“图像处理装置及其方法”[特开2006-74166]的专利。该方法在文字的交叉点，T字点，角，端点出通过细线化处理，再以细线化的交叉点，T字点，角，端点为中心，“1”为黑点，“0”为白点进行信息埋入。该方法没有考虑在非常细的笔画中，用该方法埋入信息时会出现笔画断线，影响印刷质量的问题。

发明内容
本发明第一个目的是针对日常使用的印刷文档文字进行信息埋入，特别是针对笔画比较细的如只有两三个像素点的印刷文档文字进行信息埋入。
本发明第二个目的是解决信息埋入后文字印刷质量降低的问题。
本发明第三个目的是在解决上述问题的基础上寻找可以在文字中埋入大量信息的方法。
为实现上述目的本发明所采用了如下的技术方案一种利用网屏编码可在印刷物的文字中埋入信息的方法，其特征由信息埋入部分(1)和信息识别部分(2)所构成；信息埋入部分(1)由埋入信息处理模块、文档处理模块、网屏编码埋入模块、打印输出模块组成，具体步骤是；(1)埋入信息处理模块读取计算机中的时间，打印机中的设备代码及包括读卡机，指纹识别机在内的可表示操作者特征的代码，以及将要埋入的包括复印禁止代码，防止篡改代码，密写信息在内的计算机代码；(2)将上述信息变换成考虑人眼视差特性的网屏编码；(3)文档处理模块将要打印输出的文本文件变换成图像数据；(4)网屏编码埋入模块将网屏编码按照不切断文字笔画的规则埋入文字中，直到所有信息全部埋入到整个文档中；(5)打印输出模块将埋入信息的文档打印输出；信息识别部分由扫描输入模块、网屏编码识别模块、数据显示模块构成，具体步骤是；(4)扫描输入模块将埋入信息的印刷纸介质文件进行扫描，读取图像数据；(5)网屏编码识别模块将文档中各个文字中的网屏编码按照构成网屏图像的各个像素点灰度值进行识别，并变换成计算机代码；(6)数据显示模块将上述计算机代码显示出。
在本发明的信息埋入方法中，所述的考虑人眼视差特性的网屏编码是指人眼对微小变形的不易辨认的特性。
在本发明的信息埋入方法中，所述的考虑人眼视差特性的网屏编码是指人眼对在微小范围内图像的灰度值的变化不易辨认的特性。
在本发明的信息埋入方法中，所述的考虑人眼视差特性的网屏编码是指人眼对微小范围内某种颜色不易辨认的特性。
在本发明的信息埋入方法中，所述的考虑人眼视差特性的网屏编码是指人眼对笔画中微小断裂容易辨认的特性。
在本发明的信息埋入方法中，所述埋入信息的编码形式是位置代码+校验代码+数据代码+数据代码。
在本发明的信息埋入方法中，埋入信息的编码形式可以是位置代码、校验代码、数据代码的各种组合排列方式。
本发明的有益效果是采用本实施方式可以在仅两三个像素的文档文字的笔画中埋入大量信息，而且埋入信息后文字印刷的质量不会降低。同用背景进行信息埋入的方法进行比较有节省墨粉的优点。可实现正常打印文档文件的同时，在印刷文件的文字里埋入追迹信息，例如打印者信息、打印时间、打印机的信息等。一旦机密文件信息流失、泄露，可以通过识别追查文件流失来源。或成为对纸介质文件的真伪性进行判断的依据。埋入的信息人眼不易发现，不影响文件的正常阅读使用。该发明可以彻底解决机密文件的非法打印、复印，证书证件被篡改等的问题，防止机密文件的流失。对安定社会具有一定积极效果。

图1是本发明信息埋入流程连接方框图。
图2是本发明信息识别流程连接方框图。
图3是本发明中在文字上进行信息埋入的网屏编码的各种形式。
图4是如果在文字的笔画上有微小的断线人眼容易辨别的示意图。
图5是利用各种人眼视差特性的网屏编码可表示1、0两种信息状态的示意图。
图6是网屏编码网点按代码间最大类似度在1/2以下的排列示意图。
图7是利用各种人眼视差特性的网点可构成最大类似度在1/2以下的网屏编码示意图。
图8是本发明中在文字上进行信息埋入所采用的信息编码形式示意图。
图9埋入信息后文字经扫描后的本发明的效果的实施例1。
图10埋入信息后文字经扫描后的本发明的效果的实施例2。
具体实施例方式
以下结合附图和较佳实施例，对依据本发明提供的具体实施方式
、结构、特征详述如下网屏编码的含义是针对图像、文字、记号、背景形式中的至少一种形式被印刷在记录媒体上，其印刷在媒体上的内容是由包括几何学在内的物理学的特性在内的不同网点形态，按其给定的排列规则而形成的网屏网点所替换，该方法构成了对印刷内容进行信息埋入的网屏编码。其网点形态可以由一种以上不同的以几何学的特性所构成的网点形态，如网点的形状、大小、位置及方向；网点形态也可以是由一种以上的不同的以物理学的特性所构成的网点形态，如以不同的调制方式的网点、不同光谱特性的网点、不同频率特性的网点、不同光学特性的网点及不同磁性特性的网点。
可在印刷物的文字上记录信息的装置。该发明主要应用在机密文件流失的追迹。在普通文件打印的同时，将打印者、打印时间、打印机的信息埋入到印刷的文字中，相当于给每个打印的文件赋予一个唯一身份ID。一旦文件信息泄漏，可以通过识别隐藏的网屏信息追查打印者和文件流失地点、时间等。同时可以用于控制打印机、复印机使用，防止机密信息的流失。也可用于对包括政务文件，商务单据及财务报表在内的各种印刷票据的是否真实性的认证。
图3是本发明中在文字上进行信息埋入的应用了人眼视差特性的具的网屏编码各种形式。a是在微小区域内(大小只有几个最小印刷点)去除文字笔画中间全部印刷点并在边缘补成封闭包络的一种应用人眼视差特性的网屏编码信息埋入形式。b是在微小区域内(大小只有几个最小印刷点)在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个其它灰度值点的一种应用人眼视差特性的网屏编码信息埋入形式。c是在微小区域内(大小只有几个最小印刷点)在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个没有灰度值点的一种应用人眼视差特性的网屏编码信息埋入形式。d是在微小区域内(大小只有几个最小印刷点)在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个其它颜色点的一种应用人眼视差特性网屏编码信息埋入形式。
如图4所示，如果在文字的笔画上有微小的断线人眼容易辨别，这是另一种人眼视差特性。另外，当文字的边缘受到微小的破坏人眼也容易辨别。
本发明就是利用了上述的人眼视差特性，尽可能在不破坏文字的边缘的情况下进行信息埋入。当文字笔画非常细一般在三个最小印刷点的情况下，可采用如图3(a)所示在文字边缘补成封闭包络的形式，尽量避免文字断线。虽然在文字边缘补成封闭包络的形式使文字笔画出现微小的变形，但由于利用了人眼对微小的变形不容易辨别的人眼视差特性，可使信息埋入后的结果不破坏文字印刷的质量。
图5是本发明中在文字上进行信息埋入时，利用各种人眼视差特性的网屏编码网点的点阵分布特征的可表示1、0两种信息状态的形式。(a、b)是在微小区域内去除文字笔画中间全部印刷点并在边缘补成封闭包络形式网屏网点的点阵分布构成的两种信息状态的表示。(c、d)是在微小区域内在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个其它灰度值点的一种应用人眼视差特性的网屏编码网点的点阵分布构成的两种信息状态的表示。(e、f)是在微小区域内在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个没有灰度值点的一种应用人眼视差特性的网屏编码网点的点阵分布构成的两种信息状态的表示。(g、h)是在微小区域内在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个其它颜色点的一种应用人眼视差特性网屏编码网点的点阵分布构成的两种信息状态的表示。
为了下面的描述，我们先导入网屏编码代码间最大类似度的最小化的概念，所谓代码间类似度的含义就是代码间的相似程度，其值越大代表越相似，分辨率越低，识别越困难；反之，代码间类似度越小，分辨率越高，识别越容易。
在网屏编码中设Sk为信息代码、n为代码长，m为代码的数量时，所述网屏编码间最大类似度Amax是由下式表示公式1dmin＝mind(Sk，Sl)
公式2Amax=n-dminn]]>式中d(Sk，Sl)为代码Sk与Sl之间的距离既代码间不同代码位的个数，k，l＝0，1，2，...m-1。
图6是本发明将应用人眼视差特性的网屏编码网点按代码间最大类似度在1/2以下的一种排列结果例子。在这16个代码中相互间最接近的任意一组代码之间不同的数值位的个数要大于等于代码长度的一半的数量。这组代码的代码长度为8，因此任意一组代码之间不同的数值位的个数要大于等于4。因此，本实施方式采用的网屏编码的代码间的最大类似度在1/2以下，在网屏编码的识别上具有较高的识别分辨率及抗干扰能力。
图7是以图6的G4代码为例，如图5中四种利用人眼视差特性的网点可构成最大类似度在1/2以下的网屏编码的示意图。
图7中(a、b)是在微小区域内去除文字笔画中间全部印刷点并在边缘补成封闭包络形式网屏网点的点阵分布构成的最大类似度在1/2以下的网屏编码的示意图。(c、d)是在微小区域内在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个其它灰度值点的一种应用人眼视差特性的网屏网点的点阵分布构成的最大类似度在1/2以下的网屏编码的示意图。(e、f)是在微小区域内在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个没有灰度值点的一种应用人眼视差特性的网屏网点的点阵分布构成的最大类似度在1/2以下的网屏编码的示意图。(g、h)是在微小区域内在文字笔画中间部分在不破坏文字的边缘的情况下埋入一个其它颜色点的一种应用人眼视差特性网屏网点的点阵分布构成的最大类似度在1/2以下的网屏编码的示意图。
图8是本发明中在文字上进行信息埋入所采用的信息编码形式示意图。
在图8中，101表示信息代码“1”，102表示信息代码“0”。201表示位置信息代码，202表示位置信息校验代码，203表示数据信息代码1，203表示数据信息代码2。
在本发明中，我们采用可变长度的一维网屏代码形式，该代码形式结构中有两种信息点描述形式，101表示信息代码“1”和102表示信息代码“0”。信息点是通过调整该位置在一个小区域内的网屏网点的点阵分布状态利用人眼视差特性网屏实现信息的埋入，通过该方法可以调整该位置的灰度，从而实现信息的埋入，同时该区域大小考虑了人眼和扫描仪的分辨特性的不同，选择最佳的调整区域大小，使得埋入的信息点不易被人眼察觉，做到信息埋入最佳化。在信息代码中前半部分用于记录位置信息，后半部分用于记录两个数据代码，由该两部分构成一个完整的信息代码，同时代码在印刷文档中所占据的空间跨度是可变长度的，根据印刷内容自动的伸缩。
图9及图10表示采用本发明的方法，在文档文字中埋入信息后的效果的实施例1及实施例2。从图9及图10中可以看出，在文档文字中埋入信息后，文字印刷的质量没有改变。
以下以图1为例叙述本发明在文档文字中埋入信息的具体流程；在文档文字中埋入信息装置中的信息埋入部分由埋入信息处理模块、文档处理模块、网屏编码埋入模块、打印输出模块四部分构成，其信息具体埋入流程图说明如下打印机开始打印时，首先步骤S1追迹信息获取单元就自动地读取本地打印时间，打印机中的设备代码及包括读卡机，指纹识别机在内的可表示操作者特征的代码，以及将要埋入的包括复印禁止代码，防止篡改代码，密写信息在内的计算机代码，然后将取得的信息存储在内存中，进入步骤S2信息编码加密。
在步骤S2中自动地从内存中取出存储的追迹信息，将上述取得的数据信息代码按照一一对应关系转换成0～9，A～F的网屏编码，然后将变换的信息代码加密后从新存储在内存中，从而实现数据转换，进入步骤S3。
步骤S3中首先从打印内存中获取图像数据信息。完成后转入步骤S4。
步骤S4中先预扫描内存中打印文件的图像数据，找出并记录文字中满足埋入一个完整信息条件的具体位置，然后进入步骤S5。
在步骤S5中，从内存中读取转换的后的网屏编码追迹信息，根据位置与信息一一对应原则，直接调整文字中对应位置的网点分布，利用人眼视差特性的网屏编码，改变该位置的网点的灰度分布特征，然后将根据埋入信息调整后的新图像结果存入内存，直到埋入一个完整信息，然后跳转到步骤S6。
步骤S6中在图像中埋入一个信息结束标记，然后跳转到步骤S4，重新开始一个新的完整信息埋入。所有信息埋入结束，进入步骤S8，信息埋入成功。
步骤S9中，启动打印输出引擎，将上述内存中的实现了网屏编码的图像送到输出打印机输出，至此就完成了在打印文档的文字中埋入了追迹信息。
以下以图2为例叙述本发明在文档文字中埋入信息的具体流程；网屏编码读取装置由扫描输入模块、网屏编码识别模块、数据显示模块三部分构成，具体识别流程如图2所示。
首先进入步骤S1启动自动扫描引擎，扫描图像。扫描完毕后进入步骤S2。
步骤S2中自动将扫描的数据变成识别处理需要的格式，存储在内存中，进入步骤S3。
在步骤S3中主要通过我们自己的图像处理算法提高扫描图像质量的信噪比，将处理好的图像数据信息存储在内存中。进入步骤S4。
在步骤S4中对由于打印输出、扫描仪扫描造成的图像畸变进行校正运算。校正后进入步骤S5。
步骤S5中，首先定位网屏信息点的具体位置，然后通过识别算法提取网屏信息，将提取后的网屏信息存储在内存中。
步骤S6中对提取的网屏信息进行数据的校验、纠错。在该模块中用到了类似度小于1/2编码自纠正功能。完毕后将最后的识别信息存储在内存中。
步骤S7读出内存中存储信息，根据网屏编码与计算机数据编码的一一对应关系，将上述网屏转换成计算机数据，然后显示。至此信息识别完成。
本发明的优点效果在于1.可在不改变文档文件的原貌的条件下埋入信息。解决了由于用背景进行信息埋入浪费墨粉的问题。
2.在文档文字中埋入信息后，印刷质量没有明显改变。
3.由于信息是埋在文字上的，可用于对文字篡改地点的自动识别。
该装置的研制成功，对于国防建设、军事机要、科研探索、商业秘密以及法律等各个相关领域的机密文件信息管理、文件信息流失有着更为广泛的应用前景。
权利要求
1.一种利用网屏编码可在印刷物的文字中埋入信息的方法，其特征由信息埋入部分(1)和信息识别部分(2)所构成；信息埋入部分(1)由埋入信息处理模块、文档处理模块、网屏编码埋入模块、打印输出模块组成，具体步骤是；(1)埋入信息处理模块读取计算机中的时间，打印机中的设备代码及包括读卡机，指纹识别机在内的可表示操作者特征的代码，以及将要埋入的包括复印禁止代码，防止篡改代码，密写信息在内的计算机代码；(2)将上述信息变换成考虑人眼视差特性的网屏编码；(3)文档处理模块将要打印输出的文本文件变换成图像数据；(4)网屏编码埋入模块将网屏编码按照不切断文字笔画的规则埋入文字中，直到所有信息全部埋入到整个文档中；(5)打印输出模块将埋入信息的文档打印输出；信息识别部分由扫描输入模块、网屏编码识别模块、数据显示模块构成，具体步骤是；(1)扫描输入模块将埋入信息的印刷纸介质文件进行扫描，读取图像数据；(2)网屏编码识别模块将文档中各个文字中的网屏编码按照构成网屏图像的各个像素点灰度值进行识别，并变换成计算机代码；(3)数据显示模块将上述计算机代码显示出。
2.根据权利要求1所述的网屏编码文字中信息埋入方法，其特征在于所述的考虑人眼视差特性的网屏编码是指人眼对大小只有几个最小印刷点以内的变形的不易辨认的特性。
3.根据权利要求1所述的网屏编码文字中信息埋入方法，其特征在于所述的考虑人眼视差特性的网屏编码是指人眼对在大小只有几个最小印刷点范围内图像的灰度值的变化不易辨认的特性。
4.根据权利要求1所述的网屏编码文字中信息埋入方法，其特征在于所述的考虑人眼视差特性的网屏编码是指人眼对大小只有几个最小印刷点的范围内对一种以上颜色不易辨认的特性。
5.根据权利要求1所述的网屏编码文字中信息埋入方法，其特征在于所述的考虑人眼视差特性的网屏编码是指人眼对文字笔画中大小只有几个最小印刷点以内的断裂或文字边缘的破坏容易辨认的特性。
6.根据权利要求1所述的网屏编码文字中埋入信息方法，其特征是埋入信息的编码形式是位置代码+校验代码+数据代码+数据代码。
7.根据权利要求6所述的网屏编码文字中埋入信息方法，其特征是埋入信息的编码形式可以是位置代码、校验代码、数据代码的各种组合排列方式。
8.根据权利要求1所述的网屏编码文字中埋入信息方法，其特征是所述的构成在文字上进行信息埋入的由不同网屏网点构成的并考虑人眼视差特性的网屏编码按一定的排列规则算出代码间的最大类似度为1/2以下。
全文摘要
本发明涉及一种在印刷物的文字上利用网屏编码进行信息埋入装置，由信息埋入部分和信息识别部分所构成。由埋入信息处理模块、文档处理模块、网屏编码埋入模块、打印输出模块构成信息埋入部分；由扫描输入模块、网屏编码识别模块、数据显示模块构成信息识别部分；这两个部分构成了一个可在印刷物的文字上记录信息的装置。该发明主要应用在文件流失的追迹或纸介质文件的认证。在普通文件打印的同时，将打印者、打印时间、打印机的信息埋入到印刷的文字中，一旦信息泄漏，可以协助有关部门追查文件流失的渠道，也可作为判断文件真实性的依据。
文档编号G06F17/28GK1932876SQ20061001611
公开日2007年3月21日申请日期2006年10月9日优先权日2006年10月9日
发明者顾泽苍, 郑进, 赵立龙申请人:天津市阿波罗信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾泽苍;郑进;赵立龙
技术所有人：天津市阿波罗信息技术有限公司
我是此专利的发明人

上一篇：围棋矩阵模拟信号传输系统的制作方法
上一篇：大规模电力系统网络分割潮流并行计算方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。