一种PDF文本乱码方法与流程

文档序号:12669671阅读:1143来源:国知局

本发明涉及版权保护领域,具体而言,涉及一种PDF文本乱码方法。



背景技术:

PDF文档处于文档创建、编辑、保护、发布、传播、保存整个工业环节的末端。很多电子文档以PDF的形式在互联网传播,如何保护PDF文档作者的权益成为一个亟待解决的问题。

目前流行的做法是通过PDF权限加密的方法,通过设置口令或者其它方式加密文档,允许阅读方以有限权限的方式分享文档内容。但是这种方式无法保证文档的绝对安全,一旦解密,文档的内容,尤其是文本内容和版式就可以随意被复制、编辑。



技术实现要素:

本发明提供一种PDF文本乱码方法,用以确保用户可以不通过加密的方式,在互联网上分享自己的某些文档,而窃取者无法从字库中找到文档文字的Unicode(统一编码)编码。

为达到上述目的,本发明提供了一种PDF文本乱码方法,包括以下步骤:

在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;

以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典;

将PDF文档文本内容的编码改变为所述随机编码。

进一步地,所述随机编码为无意义的数字码。

本发明通过改变文本字体映射关系后,虽然PDF文本不能正常映射为Unicode编码,但仍可以照常显示;用户如果用计算机的方式(如复制、剪切等操作)进行PDF内容窃取,不得不进行Unicode编码构建,这个会大大增加商业成本;使用本专利技术,用户可以不通过加密的方式,在互联网上分享自己的某些文档。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例的PDF文本乱码方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明一个实施例的PDF文本乱码方法流程图。如图所示,该PDF文本乱码方法包括以下步骤:

S110,在创建PDF文档或者将PDF文档另存时,在所创建或另存为的PDF文档中嵌入PDF字体;

S120,以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典;

S130,将PDF文档文本内容的编码改变为所述随机编码。

例如,上述随机编码可以为无意义的数字码。这样,通过改变字库中编 码映射的方法,使窃取者无法从字库中找到文档文字的Unicode编码,只能找到01、02这样的无意义的内部编码。

本发明的一个优选实施例的具体流程如下:

1、在PDF文档创建或者另存时,嵌入PDF字体。

2、以随机编码的方式,改变嵌入PDF字体编码映射ToUnicode字典。

3、改变PDF文本内容的编码为新的随机编码。

在上述实施例中,通过改变文本字体映射关系后,虽然PDF文本不能正常映射为Unicode编码,但仍可以照常显示;用户如果用计算机的方式(如复制、剪切等操作)进行PDF内容窃取,不得不进行Unicode编码构建,这个会大大增加商业成本;本发明用于PDF文档文本内容的进一步保护,增加PDF文档文本被恶意复制、商业窃取的难度,使用本专利技术,用户可以不通过加密的方式,在互联网上分享自己的某些文档。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1