混淆页面描述语言输出以阻碍转换为可编辑格式的制作方法

文档序号:8395924阅读:314来源:国知局
混淆页面描述语言输出以阻碍转换为可编辑格式的制作方法
【技术领域】
[0001]本发明涉及信息处理领域,更具体地,涉及用于管理电子文档的方法、用于管理电子文档的设备、以及系统。
【背景技术】
[0002]电子文档(ED)描述格式通常可分为两类:标示语言(ML)格式和页面描述语言(PDL)格式。ML格式用于文档创建和编辑,并倾向于以较高级的项描述文档的外观和布局。例如,ML可通过指明页边距、行距、字体、字号等来描述文本段落,而将确定每个字符确切位置的细节交给渲染段落以用于显示或打印的软件或设备。相对而言,PDL格式不用于编辑。它们用于帮助忠实、有效的文档渲染。通常地,段落的PDL版本将相当明确地指明每个字符在文本中的位置,但不会指明高级数据,比如页边距或行距,因为如果准确渲染是唯一目的这些就是不必要的。
[0003]因为PDL数据历来被认为是不可编辑的,用户经常将文档从ML格式转换成PDL格式以作为防止修改的简略方式。例如,作者将通常以开放的办公可扩展标记语言(OOXML)格式(一种ML格式)来创建和维护文档以用于编辑。然而,作者会将文件转换成便携文档格式(PDF),一种PDL格式,以用于发布。这样做的主要原因是PDF文档的便携性,但是在某些情况下次要原因是PDF格式使得接收者要恶意修改文件更加困难,比如盗取内容或改变文件并将其冒充为接收者的成果。
[0004]最近,出现了大量允许从I3DL格式(例如HF)到ML格式(例如00XML)反向转换的工具。因为从ML格式到PDL格式的转换中丢失了较高层的上下文信息,从PDL格式转换回ML格式需要推断或猜测数据,因而通常充其量也是不完善的,并且在很多情况下几乎是不可用的。然而,在某些情况下,可允许创建原始文档的摹写,这将足以避开发布者关于不可修改的格式的目的。

【发明内容】

[0005]总体而言,一方面,本发明涉及用于管理电子文档(ED)的方法。所述方法包括:接收用以生成用于ED的混淆页面描述语言(TOL)文件的请求;在ED中识别包括多个字符的第一文本流;计算所述多个字符在页面上的多个位置;响应于所述请求通过对第一文本流施加混淆技术来生成修改的文本流;生成包括多个位置和已修改的文本流的混淆PDL文件。
[0006]总体而言,一方面,本发明涉及一种用于管理电子文档(ED)的设备.所述设备包括:显示部件,用于向用户显示图形用户界面(GUI),该图形用户界面包括用于生成用于所述ED的混淆页面描述语言(TOL)文件的选项;接收部件,用于接收用于生成所述ED的混淆PDL文件的请求;识别部件,用于在ED内识别包括多个字符的第一文本流;计算部件,用于计算所述多个字符在页面上的多个位置;第一生成部件,用于响应于所述请求通过对第一文本流施加混淆技术来生成修改的文本流;以及第二生成部件,用于生成包括所述多个位置和所述已修改的文本流的混淆PDL文件。
[0007]总体而言,一方面,本发明涉及系统。所述系统包括:计算机处理器;缓冲器,被配置成存储包括第一文本流的电子文档,该第一文本流包括多个字符;位置引擎,其在计算机处理器上运行并配置成计算多个字符在页面上的多个位置;混淆引擎,其在计算机处理器上运行并配置成通过对第一文本流施加混淆技术来生成修改的文本流;以及页面描述语言(PDL)引擎,其在计算机处理器上运行并配置成生成用于ED的包括多个位置和已修改的文本流的混淆PDL文件。
[0008]本发明的其他方面将从下列描述和所附权利要求中显现。
【附图说明】
[0009]图1示出了依照本发明的一个或多个实施例的系统。
[0010]图2示出了依照本发明的一个或多个实施例的流程图。
[0011]图3A和图3B示出了依照本发明的一个或多个实施例的示例。
[0012]图4示出了依照本发明的一个或多个实施例的的计算机系统。
【具体实施方式】
[0013]现在将参照附图来详细描述本发明的具体实施例。为保持一致性,不同图中的相同元件用相同的参考符号来表示。
[0014]在本发明实施例的下列详细描述中,详尽阐述了许多具体细节以提供对本发明更为深入全面的理解。然而,对于本领域普通技术人员而言显而易见的是,没有这些具体细节本发明也可实行。在其他情况下,为了避免不必要地使描述复杂化,众所周知的特征没有详细描述。
[0015]总体而言,本发明的实施例提供用于管理包括一个或多个文本流的ED的系统和方法。所述ED可以是开放的办公可扩展标记语言(OOXML格式或任何其他ML格式。作为接收到生成用于ED的混淆PDL文件的用户请求的响应,计算文本流的字符的位置(例如坐标)。然后,对PDL数据(例如文本流、剪贴画、图像、形状等)应用一项或多项混淆技术以生成修改的PDL数据。例如,将混淆技术应用于文本流以生成修改的文本流。混淆PDL文件包括已修改的文本流和计算出的位置。混淆PDL文件还可包括ED中的任意矢量图的光栅表示。混淆PDL文件可以是PDF或任何其他PDL格式。和标准PDL文件一样,混淆I3DL文件帮助ED的忠实渲染。然而,在应对被设计用来将PDL文件转换回原始ML格式(例如OOXML)或任何其他可编辑/可修改格式的工具上,混淆PDL文件比标准PDL文件更加复原力。换句话说,任何这类工具对混淆PDL文件的操作的输出将和所述ED有很小类似,减少了将所述输出作为原件忠实且轻易可修改的复制品的功用。
[0016]图1示出了依照本发明一个或多个实施例的系统(100)。如图1所示,系统(100)具有多个组件,包括缓冲器(114)、图形用户界面(116)、位置引擎(118)、混淆引擎(120)和PDL引擎(122)。每个组件(114、116、118、120、122)可位于相同的硬件设备(例如,个人计算机(PC)、桌面计算机、主机、服务器、电话机、自助服务机、电缆箱、个人数字助理(PDA)、电子阅读器、智能电话机、平板计算机等)或使用具有有线和/或无线网段的网络所连接的不同硬件设备上。在本发明的一个或多个实施例中,系统(100)输入ED (106),并输出用于ED (106)的混淆PDL文件(110)。系统(100)还可输出用于ED (106)的标准PDL文件(108)。
[0017]在本发明的一个或多个实施例中,ED(106)包括一个或多个文本流。每个文本流可具有任意数量的字符,因而可具有任意数量的单词。文本流可对应于句子、段落、文本列、注脚、图片说明、尾注、章节、篇章等。每页可有多个文本流。文本流可跨越多个页面。ED(106)还可包括要在一页或多页上显示或跨越一页或多页显示的图形特征(例如照片、矢量图、剪贴画、形状等)。两个或多个图形特征可能部分重叠。使用ML格式(例如,开放文档格式(ODF) ,OOXML等)来表示/定义ED (106)。相应地,文本流、图形特征以及文本流的属性和图形特征可作为ML格式标签中的属性来记录/识别。要正确地渲染(例如,显示、打印)ED (106),文本流、图形特征和属性是必要的。
[0018]如上所述,ED(106)是可编辑/可修改的。而且,ED(106)可通过用户应用来创建和/或修改,所述用户应用例如包括字处理应用、电子制表应用、桌面发布应用、图形应用、照片打印应用、网络浏览器、幻灯片生成应用、表格生成器等。
[0019]在本发明的一个或多个实施例中,标准PDL文件(108)是PDL格式(例如,PDF,XPS等)的ED (106)。标准PDL文件(108)帮助ED (106)的忠实渲染。相应地,和ED (106)一样,标准PDL文件(108)包括文本流和图形特征。然而,不同于ED (106),标准PDL文件
(108)包括每个文本流的每个字符和每个图形特征的明确位置(例如,x、y坐标,偏移等)。而且,不同于ED (106),标准PDL文件(108)不容易被修改。
[0020]在本发明的一个或多个实施例中,混淆PDL文件(110)是PDL格式(例如H)F、XPS等)的ED(10
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1