Pdf文件到swf文件转换方法及系统的制作方法

文档序号:6439135阅读:315来源:国知局

专利名称::Pdf文件到swf文件转换方法及系统的制作方法
技术领域
:本发明涉及计算机应用技术,特别涉及一种PDF文件到SWF文件转换方法及系统。
背景技术
:SffF(shockwaveflash)是Macromedia(现已被ADOBE公司收购)公司的动画设计软件Flash的专用格式,是一种支持矢量和点阵图形的动画文件格式,被广泛应用于网页设计,动画制作等领域,SWF文件通常也被称为Flash文件。SWF由于其出色的效果以及跨平台特性,在互联网阅读中扮演着重要角色,SWF普及程度很高,现在超过99%的网络使用者都可以读取SWF文件。PDF(PortableDocumentformat,便携文件格式)是一种广泛应用的电子文件格式。对于从PDF到SWF的转换,是十分迫切和需要的。现有的PDF到SWF的文件转换工具(如pdf2swf.exe),将PDF文件转换为到SWF文件的方法是一.设置PDF到SWF转换系统的转换字库;二.读入PDF文件,识别出PDF文件中的各文字的字体、PDF文件中的图片、PDF文件中的图层信息;三.对于PDF文件中的图片,进行像素的识别,放入到新生成的SWF文件中;对于PDF文件中的文字,在转换字库中查找各文字的相应字体文字,进行转码,放入到新生成的SWF文件中;对于PDF文件中的图层,将图层进行矢量的转换,放入到新生成的SWF文件中;四.转换完成。由于生成PDF文件的作者使用各种字库,而一般的PDF到SWF转换系统(如pdf2swf.exe)的转换字库容量有限,通常常会缺少多种非西文字体,PDF文件中的使用的字库很有可能超过一般PDF到SWF转换系统的转换字库容量,再加上字体版权(如方正字库版权)问题,在PDF到SWF转换过程中,就会造成部分文字的缺失以及乱码;另外,图片因为需要印刷原因,直接转换会造成生成的SWF文件过大;还有,PDF文件编辑者由于追求各种艺术效果,会大量使用图层,大量的图层会导致程序计算负荷很重,会直接导致转换错误。
发明内容本发明要解决的技术问题是PDF文件转换成SWF文件时,不会造成部分文字的缺失以及乱码。为解决上述技术问题,本发明提供了一种PDF文件到SWF文件转换方法,包括以下步骤一.设置转换字库及字体替换规则;所述转换字库中设置有多种字体的字库;所述字体替换规则设置有所述转换字库中未设置的多种字体的替换规则,即用所述转换字库中设置的某种字体替换所述转换字库中未设置的某种字体的规则;二.读取PDF文件,识别出PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层;三.对于PDF文件中每一页的文字,如果该页上的文字字体包括在转换字库设置的字体中,则利用转换字库中的该字体字库,对该页上的文字进行转码,放入到新生成SWF文件中,然后进行步骤六;如果该页上的文字的字体未包括在转换字库设置的字体中,进行步骤四;四.如果所述字体替换规则中设置有该页上的文字字体的替换字体,则利用转换字库中的该替换字体字库,对该页上的文字进行转码,放入到新生成SWF文件中,然后进行步骤六;如果所述字体替换规则中未设置该页上的文字字体的替换字体,则进行步骤五;五.将该页页面图片化;六.对PDF文件中的图片以及步骤五图片化后的页面进行像素的识别,放入到新生成SWF文件中;对PDF文件中的图层进行矢量的转换,放入到新生成SWF文件中;七.转换结束。步骤六中,可以先对PDF文件中的图层进行简化,然后进行矢量的转换放入到新生成SWF文件中。步骤七中,可以先将新生成SWF文件中的图片总体积大于一门限值的页面上的图片的分辨率调低,使新生成SWF文件中的各页面上的图片总体积都小于该门限值,然后转换结束。为解决上述技术问题,本发明还提供了一种PDF文件到SWF文件转换系统,包括一转换字库、一字体替换规则模块、一PDF文件信息识别模块、一文字处理模块、一图片处理模块、一图层处理模块;所述转换字库,用于设置多种字体的字库;所述字体替换规则模块,用于设置所述转换字库中未设置的多种字体的替换规则,即用所述转换字库中设置的某种字体替换所述转换字库中未设置的某种字体的规则;所述PDF文件信息识别模块,用于读取PDF文件,识别出PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层;所述文字处理模块,用于对PDF文件中的文字进行处理,具体处理过程是对于PDF文件中每一页的文字,如果该页上的文字字体包括在转换字库设置的字体中,则利用转换字库中的该字体字库,对该页上的文字进行转码,放入到新生成SWF文件中;如果该页上的文字字体未包括在转换字库设置的字体中,并且所述字体替换规则中设置有该页上的文字字体的替换字体,则利用转换字库中的该替换字体字库,对该页上的文字进行转码,放入到新生成SWF文件中;如果该页上的文字字体未包括在转换字库设置的字体中,并且所述字体替换规则中未设置该页上的文字字体的替换字体,则将该页页面图片化;所述图片处理模块,用于对PDF文件中的图片以及所述文字处理模块图片化后的页面进行像素的识别,放入到新生成SWF文件中;所述图层处理模块,用于对PDF文件中的图层进行矢量的转换,放入到新生成SWF文件中。PDF文件到SWF文件转换系统还可以包括一分辨率调整模块;所述分辨率调整模块,用于将新生成SWF文件中的图片总体积大于一门限值的页面上的图片的分辨率调低,使新生成SWF文件中的各页面上的图片总体积都小于该门限值。所述图层处理模块,可以先对PDF文件中的图层进行简化,然后进行矢量的转换,放入到新生成SWF文件中。本发明的PDF文件到SWF文件转换方法及系统,通过分析PDF文件,得到PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层,把常规转换字库没有包括的一些非常规字体(如方正字库中的非西文字体)按替换规则替换为常规转换字库已包括的常规字体,如果没有替换规则就把包含非常规字体的PDF页面图片化,然后对图片化后的页面进行像素的识别,将PDF文件非常规字体页面转换成SWF文件,通过对非常规字体的替换及图片化处理,使得PDF文件到SWF文件转换过程中避免了部分文字的缺失以及乱码。本发明的PDF文件到SWF文件转换方法及系统,还通过把复杂的图层简化以减少计算负担,可以把图层复杂页面内容比较顺利转化出来。为了更清楚地说明本发明或现有技术中的技术方案,下面将对本发明或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本发明的PDF文件到SWF文件转换方法一实施例示意图;图2是本发明的PDF文件到SWF文件转换系统一实施例示意图。具体实施例方式下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。本发明的PDF文件到SWF文件转换方法一实施例如图1所示,包括以下步骤一.设置转换字库及字体替换规则,所述转换字库中设置有多种字体的字库,所述字体替换规则设置有所述转换字库中未设置的多种字体的替换规则,即用所述转换字库中设置的某种字体替换所述转换字库中未设置的某种字体的规则,例如,所述转换字库中设置有楷体、宋体等多种字体,但并没有设置方正宋一简体,所述字体替换规则可以设定用宋体替换方正宋一简体;二.读取PDF文件,识别出PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层;较佳的,通过XPDF写代码提取PDF头文件,由于PDF头文件有每一页的文字字体信息,通过PDF头文件可以得到PDF文件每一页的文字字体;三.对于PDF文件中每一页的文字,如果该页上的文字字体包括在转换字库设置的字体中,则利用转换字库中的该字体字库,对该页上的文字进行转码,放入到新生成SWF文件中,然后进行步骤六;如果该页上的文字的字体未包括在转换字库设置的字体中,进行步骤四;四.如果所述字体替换规则中设置有该页上的文字字体的替换字体,则利用转换字库中的该替换字体字库,对该页上的文字进行转码,放入到新生成SWF文件中,然后进行步骤六;如果所述字体替换规则中未设置该页上的文字字体的替换字体,则进行步骤五;五.将该页页面图片化;六.对PDF文件中的图片以及步骤五图片化后的页面进行像素的识别,放入到新生成SWF文件中;对PDF文件中的图层先进行简化(如淡化阴影、图层位图化、合并图层等),然后进行矢量的转换放入到新生成SWF文件中;七.将新生成SWF文件中的图片总体积大于一门限值(如图片总体积超过500KB)的页面上的图片的分辨率调低,使新生成SWF文件中的各页面上的图片总体积都小于该门限值,转换结束。本发明的PDF文件到SWF文件转换系统一实施例如图2所示,包括一转换字库、一字体替换规则模块、一PDF文件信息识别模块、一文字处理模块、一图层处理模块、一图片处理模块、分辨率调整模块;所述转换字库,用于设置多种字体的字库;所述字体替换规则模块,用于设置所述转换字库中未设置的多种字体的替换规则,即用所述转换字库中设置的某种字体替换所述转换字库中未设置的某种字体的规则,例如,所述转换字库中设置有楷体、宋体等多种字体,但并没有设置方正宋一简体,所述字体替换规则可以设定用宋体替换方正宋一简体;所述PDF文件信息识别模块,用于读取PDF文件,识别出PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层;所述文字处理模块,用于对PDF文件中的文字进行处理,具体处理过程是对于PDF文件中每一页的文字,如果该页上的文字字体包括在转换字库设置的字体中,则利用转换字库中的该字体字库,对该页上的文字进行转码,放入到新生成SWF文件中;如果该页上的文字字体未包括在转换字库设置的字体中,并且所述字体替换规则中设置有该页上的文字字体的替换字体,则利用转换字库中的该替换字体字库,对该页上的文字进行转码,放入到新生成SWF文件中;如果该页上的文字字体未包括在转换字库设置的字体中,并且所述字体替换规则中未设置该页上的文字字体的替换字体,则将该页页面图片化;所述图层处理模块,用于先对PDF文件中的图层进行简化(如淡化阴影、图层位图化、合并图层等),然后进行矢量的转换放入到新生成SWF文件中;所述图片处理模块,用于对PDF文件中的图片以及所述文字处理模块图片化后的页面进行像素的识别,放入到新生成SWF文件中;所述分辨率调整模块,用于将新生成SWF文件中的图片总体积大于一门限值(如图片总体积超过500KB)的页面上的图片的分辨率调低,使新生成SWF文件中的各页面上的图片总体积都小于该门限值。本发明的PDF文件到SWF文件转换方法及系统,通过分析PDF文件,得到PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层,把常规转换字库没有包括的一些非常规字体(如方正字库中的非西文字体)按替换规则替换为常规转换字库已包括的常规字体,如果没有替换规则就把包含非常规字体的PDF页面图片化,然后对图片化后的页面进行像素的识别,将PDF文件非常规字体页面转换成SWF文件,通过对非常规字体的替换及图片化处理,使得PDF文件到SWF文件转换过程中避免了部分文字的缺失以及乱码。本发明的PDF文件到SWF文件转换方法及系统,还通过把复杂的图层简化以减少计算负担,可以把图层复杂页面内容比较顺利转化出来。本发明的PDF文件到SWF文件转换方法及系统,对于转换后的得到的SWF文件,还进一步对图片过大的页面上的图片的分辨率进行调整,以方便SWF文件在网络中传输。权利要求1.一种PDF文件到SWF文件转换方法,其特征在于,包括以下步骤一.设置转换字库及字体替换规则;所述转换字库中设置有多种字体的字库;所述字体替换规则设置有所述转换字库中未设置的多种字体的替换规则,即用所述转换字库中设置的某种字体替换所述转换字库中未设置的某种字体的规则;二.读取PDF文件,识别出PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层;三.对于PDF文件中每一页的文字,如果该页上的文字字体包括在转换字库设置的字体中,则利用转换字库中的该字体字库,对该页上的文字进行转码,放入到新生成SWF文件中,然后进行步骤六;如果该页上的文字的字体未包括在转换字库设置的字体中,进行步骤四;四.如果所述字体替换规则中设置有该页上的文字字体的替换字体,则利用转换字库中的该替换字体字库,对该页上的文字进行转码,放入到新生成SWF文件中,然后进行步骤六;如果所述字体替换规则中未设置该页上的文字字体的替换字体,则进行步骤五;五.将该页页面图片化;六.对PDF文件中的图片以及步骤五图片化后的页面进行像素的识别,放入到新生成SffF文件中;对PDF文件中的图层进行矢量的转换,放入到新生成SWF文件中;七.转换结束。2.根据权利要求1所述的PDF文件到SWF文件转换方法,其特征在于,步骤六中,先对PDF文件中的图层进行简化,然后进行矢量的转换放入到新生成SWF文件中。3.根据权利要求2所述的PDF文件到SWF文件转换方法,其特征在于,进行简化包括如淡化阴影、图层位图化、合并图层。4.根据权利要求1、2或3所述的PDF文件到SWF文件转换方法,其特征在于,步骤七中,将新生成SWF文件中的图片总体积大于一门限值的页面上的图片的分辨率调低,使新生成SWF文件中的各页面上的图片总体积都小于该门限值,然后转换结束。5.一种PDF文件到SWF文件转换系统,其特征在于,包括一转换字库、一字体替换规则模块、一PDF文件信息识别模块、一文字处理模块、一图片处理模块、一图层处理模块;所述转换字库,用于设置多种字体的字库;所述字体替换规则模块,用于设置所述转换字库中未设置的多种字体的替换规则,即用所述转换字库中设置的某种字体替换所述转换字库中未设置的某种字体的规则;所述PDF文件信息识别模块,用于读取PDF文件,识别出PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层;所述文字处理模块,用于对PDF文件中的文字进行处理,具体处理过程是对于PDF文件中每一页的文字,如果该页上的文字字体包括在转换字库设置的字体中,则利用转换字库中的该字体字库,对该页上的文字进行转码,放入到新生成SWF文件中;如果该页上的文字字体未包括在转换字库设置的字体中,并且所述字体替换规则中设置有该页上的文字字体的替换字体,则利用转换字库中的该替换字体字库,对该页上的文字进行转码,放入到新生成SWF文件中;如果该页上的文字字体未包括在转换字库设置的字体中,并且所述字体替换规则中未设置该页上的文字字体的替换字体,则将该页页面图片化;所述图片处理模块,用于对PDF文件中的图片以及所述文字处理模块图片化后的页面进行像素的识别,放入到新生成SWF文件中;所述图层处理模块,用于对PDF文件中的图层进行矢量的转换,放入到新生成SWF文件中。6.根据权利要求5所述的PDF文件到SWF文件转换系统,其特征在于,PDF文件到SWF文件转换系统还包括一分辨率调整模块;所述分辨率调整模块,用于将新生成SWF文件中的图片总体积大于一门限值的页面上的图片的分辨率调低,使新生成SWF文件中的各页面上的图片总体积都小于该门限值。7.根据权利要求5所述的PDF文件到SWF文件转换系统,其特征在于,所述图层处理模块,用于先对PDF文件中的图层进行简化,然后进行矢量的转换,放入到新生成SWF文件中。全文摘要本发明公开了一种PDF文件到SWF文件转换方法,通过分析PDF文件,得到PDF文件中每一页的文字字体,以及PDF文件中的图片、PDF文件中的图层,把常规转换字库没有包括的一些非常规字体按替换规则替换为常规转换字库已包括的常规字体,如果没有替换规则就把包含非常规字体的PDF页面图片化,然后对图片化后的页面进行像素的识别,将PDF文件非常规字体页面转换成SWF文件。本发明还公开了一种PDF文件到SWF文件转换系统,本发明的PDF文件到SWF文件转换方法及系统,通过对非常规字体的替换及图片化处理,使得PDF文件到SWF文件转换过程中避免了部分文字的缺失以及乱码。文档编号G06T11/60GK102402500SQ20111037702公开日2012年4月4日申请日期2011年11月23日优先权日2011年11月23日发明者万曦申请人:上海居冠软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1