一种文档格式转换的方法及装置的制作方法

文档序号:6445001阅读:257来源:国知局
专利名称:一种文档格式转换的方法及装置的制作方法
技术领域
本申请涉及电子文档处理领域,尤其涉及一种文档格式转换的方法及装置。
背景技术
PDF格式文档目前已经成为诸多电子格式文档中,应用最广泛的一种。在印刷和打印领域,PDF格式文档更是居于统治地位,不管是前端排版还是后端输出,PDF都是页面内容描述文档的标准格式。另一方面,Adobe在PDF格式文档应用之前,定义的页面内容描述文档的标准格式是PostScript,尽管PostScript在页面独立和设备相关方面相对于TOF格式文档而言都有诸多不足,但是由于PostScript悠久的应用历史和丰富的外围支持,故而有数量众多的用户仍然在使用PostScript格式来进行印刷和打印。由于PostScript格式文档在进行处理时,会遇到一系列麻烦,故而在将PostScript格式文档递交给印前输出系统做光栅化处理前,需要先经过规范化处理。即将PostScript格式转换为PDF格式。在PostScript格式文件的规范化处理中,一个重要的目标是在转换的过程中尽量保存对象的原始描述类型。如PostScript中的文字对象在转换之后仍然是HF中的文字对象,PostScript中的图形对象在转换之后也仍然是F1DF中的图形对象,PostScript中的图像对象在转换之后也仍然是TOF中的图像对象等等,这样可以最大限度地保持页面描述的原始面貌和设备无关性,从而尽可能真实地再现前端用户的设计意图。对于文字对象来说,最理想的情况是在转换之后仍然是文字对象,并且描述文字呈现形状的轮廓数据和控制数据都得到完全的保持,没有一点损失。目前常用的对基于PostScript中的charpath指令得到的文字向量路径的转换方法,包括如下两种:(I)基于PostScript中的charpath指令获得文字的向量路径,用填充或者划线模式对其进行描述,像一般的向量路径那样进行图形绘制操作。也就是,直接将基于PostScript得到的文字向量路径转换为对应的HF向量路径。(2)基于PDF格式对象中提供的Tr (Text rendering mode,文字绘制模式)属性,将由charpath指令得到的PostScript格式的向量路径转换为对应的PDF格式文字对象。然而在实现本申请实施例中技术方案的过程中,本申请人发现现有技术至少存在如下缺点:(I)由于在现有技术一中采用的是直接将PostScript格式的文字的轮廓转换为对应的TOF向量路径的技术方案,故而存在着丢失了文字的控制信息的技术问题;(2)由于在现有技术一中采用的是直接将PostScript格式的文字的轮廓转换为对应的HF向量路径的技术方案,故而存在着转换不准确、可能存在重影的技术问题。(3)由于在现有技术二中采用的是基于PDF格式对象中提供的Tr属性,将由charpath指令得到的PostScript格式的向量路径转换为对应的PDF格式文字对象的技术方案,故而存在着对于非charpath指令获得的向量路径,存在丢失的技术问题。

发明内容
本发明提供一种文档格式转换的方法及装置,用以解决现有技术中,存在着文字控制信息丢失或普通向量路径丢失的技术问题。本发明通过本申请中的实施例,提供如下技术方案:一方面,本发明通过本申请中的一个实施例,提供如下技术方案:一种文档格式转换方法,所述方法用于将PostScript文件转换为PDF文件,所述方法包括:确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;将所述PostScript格式的图形对象转换为PDF格式的图形对象。进一步的,所述PostScript格式的文字对象相关的参数信息,具体包括:所述文字对象的字体信息、所述文字对象的字符编码、所述文字对象的位置坐标以及所述文字对象的变换矩阵。进一步的,所述确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,还包括:设置第一字体信息为预存字体信息;设置第一变换矩阵为预存变换矩阵;设置第一文字绘制模式为预存文字模式。进一步的,所述基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象,具体包括:将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息;将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵;将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式;基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScript格式的文字对象转换为PDF格式的文字对象。进一步的,所述文字对象的绘制模式,具体为:填充模式或划线模式。进一步的,所述将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息之前,还包括:保存所述第一字体信息;保存所述第一变换矩阵;
保存所述第一文字绘制模式。进一步的,所述将所述PostScript格式的文字对象转换为PDF格式的文字对象之后,还包括:将所述预存字体信息恢复为所述第一字体信息;将所述预存变换矩阵恢复为所述第一变换矩阵;将所述预存文字绘制模式恢复为所述第一文字绘制模式。另一方面,本发明通过本申请中的另一实施例提供如下技术方案:一种文档格式转换装置,所述装置用于将PostScript文件转换为PDF文件,所述装置包括:确定单元:用于确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;记录单元:用于在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;文字转换单元:用于基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;图形转换单元:用于将所述PostScript格式的图形对象转换为TOF格式的图形对象。进一步的,所述装置还包括:字体设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一字体信息为预存字体信息;矩阵设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前设置第一变换矩阵为预存变换矩阵;绘制设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一文字绘制模式为预存文字模式。进一步的,所述文字转换单元,具体包括:字体转换模块:用于将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息;矩阵转换模块:用于将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵;绘制转换模块:用于将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式;转换模块:用于基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScript格式的文字对象转换为PDF格式的文字对象。上述技术方案中的一个或多个技术方案,具有如下技术效果或优点:(I)由于在将文字由PostScript转换为PDF格式时,采用了保留文字控制参数的技术方案,故而达到了保留文字控制信息的技术效果;(2)由于在将文字由PostScript转换为PDF格式时,采用了保留文字控制参数的技术方案,故而达到了消除重影的技术效果;
(3)由于在将PostScript转换为PDF格式时,采用了将文字对象和图形对象分别采用不同的方案进行处理的技术方案,故而达到了在实现文字转换时保存了控制参数、同时又不会丢失图形路径的技术效果。


图1为本申请实施例一中文档格式转换方法的流程图;图2为本申请实施例一中将PostScript格式的文字对象转换为PDF格式的文字对象中的各个步骤流程图;图3为本申请实施例一中将PostScript格式的文字对象转换为PDF格式的文字对象时具体转换的流程图;图4为本申请实施例二中文档格式转换方法的方框图;图5为申请实施例二中文字转换单元的方框图;图6为本申请实施例二中文档格式转换装置的细化方框图。
具体实施例方式为了使本申请所属技术领域中的技术人员更清楚地理解本申请,下面结合附图,通过具体实施例对本申请技术方案作详细描述。请参考图1至图3,本申请实施例一提供一种文档格式转换方法,所述方法用于将PostScript文件转换为PDF文件,如图1所示,所述方法包括如下步骤:SlOl:确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;在具体实施过程中,在进行文档格式转换前,用于进行文档格式转换的装置中,已经包含如下信息:预存字体信息:在本申请实施例中,以第一字体信息为预存字体信息,其中,第一字体信息可以为任意字体,比如楷体、宋体、隶书等,本申请实施例对此不作限制。预存变换矩阵:预存文字模式:在本申请实施例中,以第一文字绘制模式为预存文字模式,而第一文字绘制模式可以为填充或者划线模式,如果第一文字绘制模式为填充模式,将其对应的Tr值设置为0,如果第一文字绘制模式为划线模式,将其对应的Tr值设置为I。当然在具体实施过程中,对于设置何种文字绘制模式,本申请不作限制,对于文字绘制模式为模式时,设置为0或I也不作限制。在具体实施过程中,可以基于文字路径集和图形路径集的不同,给所述路径的文字路径标识设置相应的参数,比如如果是文字路径将其值设置为0,如果是图形路径将其值设置为1,当然对于这个参数值不作限制,只要能够对文字路径和图形路径做出区分即可。另外,在本申请实施例中,如果获得charpath指令,即表示当前路径为文字路径,自然对于以何种方式判断该路径为文字路径,本申请也不作限制。S102:在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;
在判断一个路径为文字路径后,记录该文字路径的相关参数,比如文字路径的字体信息、位置坐标、字符编码和变换矩阵等,然后在后续进行PDF格式转换时,即可以保留这些相关参数。当然,对于记录的文字路径的相关参数,不限于上面的几种参数。S103:基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;在具体实施过程中,将PostScript格式的文字对象转换为PDF格式的文字对象,如图2所示,还具体包括如下过程:S201:保存预存参数。在具体实施过程中,这里的预存参数时进行文档格式转换前,用于进行文档格式转换的装置中,已经包含的如下信息:预存字体信息;预存变换矩阵;预存文字模式。S202:设置转换参数。这里的转换参数主要是当前待转换的文字的相关参数,进行参数设置主要是将文档转换装置中的预存参数设置为待转换文字的相关参数。具体的包括:将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息;比如如果预存字体为宋体,而待转换文字的字体为偕体,那么将预存的字体信息由宋体转换为楷体;将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵;将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式。比如如果预存的文字绘制模式为划线模式,而待转换文字的文字绘制模式为填充模式,那么将预存的文字绘制模式由填充模式转换为划线模式。S203:格式转换。在具体实施过程中,将将PostScript格式的文字对象转换为PDF格式的文字对象,如图3所示,又包括如下过程:S301:根据当前文字路径中记录的字符编码和位置坐标,将待转换文字路径转换为文字对象;S302:根据当前文字绘制模式为填充类型或划线类型,将上述所得文字对象的文字绘制模式Tr设置为O或I。S204:恢复预存参数。也就是将前面的预存字体信息由楷体又恢复为宋体;将前面的预存绘制模式由划线模式恢复为填充模式。S104:将所述PostScript格式的图形对象转换为PDF格式的图形对象。在具体实施过程中,对于非文字对象的其他路径信息,则直接转换为对应的图形对象即可。请参考图4至图5,本申请实施例二提供一种文档格式转换装置,所述装置用于将PostScript文件转换为PDF文件,如图4所示,所述装置包括:确定单元401:用于确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;记录单元402:用于在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数彳目息;文字转换单元403:用于基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;进一步的,所述文字转换单元,如图5所示,具体包括:字体转换模块501:用于将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息;矩阵转换模块502:用于将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵;绘制转换模块503:用于将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式;转换模块504:用于基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScript格式的文字对象转换为PDF格式的文字对象。图形转换单元404:用于将所述PostScript格式的图形对象转换为PDF格式的图形对象。进一步的,如图6所示,所述装置还包括:字体设置单元405:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一字体信息为预存字体信息;矩阵设置单元406:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前设置第一变换矩阵为预存变换矩阵;绘制设置单元407:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一文字绘制模式为预存文字模式。由于本申请实施二中的装置为与实施本申请实施例一中的方法所对应的装置,所以基于本申请实施例一中的方法,本领域所属技术人员能够了解本申请实施二中的装置的具体实施方法以及本申请实施二的装置的各种变化形式。所以在此对于该装置的运行不再详细介绍,只要本领域所属技术人员基于本申请实施例一中的方法所采用的装置,都属于本申请所欲保护的范围。上述技术方案中的一个或多个技术方案,具有如下技术效果或优点:(I)由于在将文字由PostScript转换为PDF格式时,采用了保留文字控制参数的技术方案,故而达到了保留文字控制信息的技术效果;(2)由于在将文字由PostScript转换为PDF格式时,采用了保留文字控制参数的技术方案,故而达到了消除重影的技术效果;(3)由于在将PostScript转换为PDF格式时,采用了将文字对象和图形对象分别采用不同的方案进行处理的技术方案,故而达到了在实现文字转换时保存了控制参数、同时又不会丢失图形路径的技术效果。尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
权利要求
1.一种文档格式转换的方法,所述方法用于将PostScript文件转换为PDF文件,其特征在于,所述方法包括: 确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象; 在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息; 基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象; 将所述PostScript格式的图形对象转换为PDF格式的图形对象。
2.如权利要求1所述的方法,其特征在于,所述PostScript格式的文字对象相关的参数信息,具体包括: 所述文字对象的字体信息、所述文字对象的字符编码、所述文字对象的位置坐标以及所述文字对象的变换矩阵。
3.如权利要求1所述的方法,其特征在于,所述确定一PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,还包括: 设置第一字体信息为预存字体信息; 设置第一变换矩阵为预存变换矩阵; 设置第一文字绘制模式为预存文字模式。
4.如权利要求3所述的方法,其特征在于,所述基于所述参数信息,将所述PostScript格式的文字对象转换 为PDF格式的文字对象,具体包括: 将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息; 将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵; 将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式; 基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScript格式的文字对象转换为PDF格式的文字对象。
5.如权利要求4所述的方法,其特征在于,所述文字对象的绘制模式,具体为: 填充模式或划线模式。
6.如权利要求4所述的方法,其特征在于,所述将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息之前,还包括: 保存所述第一字体信息; 保存所述第一变换矩阵; 保存所述第一文字绘制模式。
7.如权利要求6所述的方法,其特征在于,所述将所述PostScript格式的文字对象转换为PDF格式的文字对象之后,还包括: 将所述预存字体信息恢复为所述第一字体信息; 将所述预存变换矩阵恢复为所述第一变换矩阵; 将所述预存文字绘制模式恢复为所述第一文字绘制模式。
8.一种文档格式转换的装置,所述装置用于将PostScript文件转换为PDF文件,其特征在于,所述装置包括: 确定单元:用于确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象; 记录单元:用于在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息; 文字转换单元:用于基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象; 图形转换单元:用于将所述PostScript格式的图形对象转换为PDF格式的图形对象。
9.如权利要求8所述的装置,其特征在于,所述装置还包括: 字体设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一字体信息为预存字体信息; 矩阵设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前设置第一变换矩阵为预存变换矩阵; 绘制设置单元:用于在确定一 PostScript格式文件的向量路径集中包含有文字路径集和图形路径集之前,设置第一文字绘制模式为预存文字模式。
10.如权利要求8所述的装置,其特征在于,所述文字转换单元,具体包括: 字体转换模块:用于将所述预存字体信息由第一字体信息变换为所述文字对象的字体信息; 矩阵转换模块:用于将所述预存变换矩阵由第一变换矩阵变换为所述文字对象的变换矩阵; 绘制转换模块:用于将所述文字绘制模式由第一文字绘制模式变换为所述文字对象的文字绘制模式; 转换模块:用于基于所述文字对象的字体信息、所述文字对象的变换矩阵以及所述文字对象的绘制模式,将所述PostScript格式的文字对象转换为PDF格式的文字对象。
全文摘要
本申请公开了一种文档格式转换的方法及装置,所述文档格式转换的方法用于将PostScript文件转换为PDF文件,所述方法包括确定一PostScript格式文件的向量路径集中包含有文字路径集和图形路径集,其中,所述文字路径集对应有PostScript格式的文字对象;所述图形路径集对应有PostScript格式的图形对象;在所述向量路径集的变量中记录所述PostScript格式的文字对象相关的参数信息;基于所述参数信息,将所述PostScript格式的文字对象转换为PDF格式的文字对象;将所述PostScript格式的图形对象转换为PDF格式的图形对象。
文档编号G06F17/22GK103186513SQ20111046061
公开日2013年7月3日 申请日期2011年12月31日 优先权日2011年12月31日
发明者陈恳 申请人:北大方正集团有限公司, 北京北大方正电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1