文件转换系统与方法

文档序号:6420421阅读:588来源:国知局
专利名称:文件转换系统与方法
技术领域
本发明是关于一种文件格式转换技术,特别是一种可自动将Word格式文件转换为可延伸性标示语言格式文件的技术。
背景技术
随着信息时代的到来,不同的企业、用户之间所需要进行信息的交流频率越来越多,但是不同的企业、不同的用户之间由于使用习惯和软件的不同,造成文件的格式不一,从而在进行文件交换时造成不便。
现有技术中已有一些关于文件格式的转换方法,如中国国家知识产权局于2000年12月6日公开的公开号为CN 1275752A的名称为“网际网络上数据库的自动转换存储的方法与系统”的专利申请案,该申请案揭露了一种可以将网际网络用户上传的文件转换为数据库规定格式的文件进行存储的方法。该方法将用户上传的文件进行检查与解析,然后重新排序组成固定格式的文件。该方法虽然可以进行文件格式的转换,但是只能转换为该数据库所规定的格式,局限性较大,而且还将用户的文件重新拆分,不能保持文件的一致性与完整性。
再如中国国家知识产权局于2001年9月26日公开的公开号为CN1314634A的名称为“文件转换方法、文件转换器、以及文件显示系统”的专利申请案,该申请案涉及一种文件转换方法,该文件转换方法首先从由多个数据段组成的一个文件中提取部分数据,然后将该部分数据显示在一个有限显示能力的装置上进行显示。该申请案的不足在于其只能在一个能力有限的显示装置上显示部分数据,不能显示完整的数据,且只能应用在网际网络浏览器上的超文本链接标示语言(Hypertext Markup Language,HTML)上,而不能将文本格式文件转换为XML格式的文件,局限性较大,。
再一例子如中国国家知识产权局于2003年3月19日公开的公开号为CN 1403950A的名称为“电子文件自动转换发送的系统与方法”的专利申请案,该申请案揭露一种电子文件的转换方法,其可以将文件的编码信息进行转换,例如将简体中文转换为繁体中文,或者将繁体中文转换为简体中文。该专利申请案的不足在于其只是进行文字编码的转换,而不能将文本格式文件转换为XML格式的文件。
最后一个例子如中国国家知识产权局于1998年4月15日公开的公开号为CN 1178948A的名称为“文件格式转换方法”的专利申请案,该申请案所揭露的技术可将个人计算机(Personal Computer,PC)或笔记型计算机(Notebook Personal Computer)上的文件资源转换为一种可被袖珍型个人计算机如CD机可读取的格式。该专利申请案所揭露技术的不足同样在于不能将文本格式文件转换为XML格式的文件。
但是,在某些场合需要提交一种固定格式的文件,在这种情况下,用户往往需要重新进行文件的重新录入与编辑,从而浪费用户时间,造成不必要的工作量。

发明内容本发明的要目的在于提供一种文件转换方法,其能将用户编辑过的Word格式的文件转换为XML格式的文件,满足用户的不同需要。
本发明提供一种文件转换系统,该文件转换系统包括多个客户端计算机,一网络、一应用程序服务器、一文件接收服务器及一数据库。每一客户端计算机均提供一图形用户接口,用于进行文件编辑,当需要进行文件编辑时,客户端计算机发出一文件传输请求。数据库中存储有各种格式的文件,包括Word格式的文件,同时,在该数据库中亦存储有文件的摘要信息。应用程序服务器用于接收客户端计算机发送的文件传输请求,传输对应文件,执行文件格式检查,分析文件内容,并进行格式转换,执行文件合并作业。应用程序服务器包括一传输请求接收模块,用于接收客户端计算机发出的文件传输请求;一文件获取模块,用于依据文件传输请求从数据库中获取对应的文件;一文件检查模块,用于对获取的文件格式进行检查,包括文件格式的识别和检查,判断该文件的格式是否为Word格式;一文件分析模块,用于对获取的文件内容进行分析,从而得到该文件不同的段落,例如摘要段落、正文段落、详细描述段落等;一格式转换模块,用于将Word格式的文件转换为XML格式的文件,该格式转换模块通过一后台运行的程序执行文件格式转换,该后台运行程序由Visual Basic程序编写语言编写;一文件合并模块,用于将转换后的XML格式文件与Word文件的附加图档合并,构成一个完整的XML文件。文件接收服务器用于接收从应用程序服务器传输的文件,该文件为经过格式转换后的XML格式文件。
本发明还提供一种文件转换方法,其能将用户编辑过的Word格式的文件转换为XML格式的文件,该文件转换方法包括如下步骤发出文件传输请求;获得对应文件;检查文件格式,判断该文件的格式是否为Word格式;若经过判断得出该文件为Word格式文件,则将输入文件转换为XML格式文件;合并该可延伸性标示语言文件与图档;返回完整的XML格式文件。若判断得出该文件格式为其它非Word格式的文件,则直接结束操作流程。
通过本发明提供的文件转换系统与方法,可实现将用户的Word格式文件转换为XML格式的文件。

图1是本发明文件转换系统的实施环境图。
图2是本发明文件转换系统应用程序服务器的功能模块图。
图3是本发明文件转换系统的数据库中摘要信息表示意图。
图4是本发明文件转换系统与方法的文件转换与合并流程图。
具体实施方式参阅图1所示,是本发明文件转换系统的实施环境图。该文件转换系统包括多个客户端计算机10,一网络11、一应用程序服务器12、一数据库13及一文件接收服务器14。每一客户端计算机10均提供一图形用户接口(图中未示出),用于进行文件编辑,当需要进行文件编辑时,客户端计算机发出一文件传输请求(图中未示出),该文件传输请求被传输到应用程序服务器12。数据库13中存储有各种格式的文件,包括Word格式的文件,同时,在该数据库13中亦存储有该文件的摘要信息。应用程序服务器12用于接收客户端计算机发送的文件传输请求,执行文件格式转换,该应用程序服务器12位于文件发送方。文件接收服务器14用于接收从应用程序服务器12传输的文件,该文件为经过格式转换后的XML格式文件,该文件接收服务器14位于文件接收方。
参阅图2所示,是本发明文件转换系统应用程序服务器的功能模块图。该应用程序服务器12为文件格式转换的控制中心,其接收从客户端计算机10传输的文件传输请求,该应用程序服务器12包括一传输请求接收模块121、一文件获取模块122、一文件检查模块123、一文件分析模块124、一格式转换模块125及一文件合并模块126。传输请求接收模块121用于接收客户端计算机10传输的文件传输请求。文件获取模块122用于依据文件传输请求从数据库13中获得对应的文件。
文件检查模块123用于对数据库13中储存的文件格式进行检查,包括文件格式的识别和检查,判断该文件是否为Word格式的文件。文件分析模块124用于对获得的文件内容进行分析,从而得到该文件不同的段落,例如摘要段落、正文段落、详细描述段落等。格式转换模块125用于执行文件格式转换,将Word格式的文件转换为XML格式的文件,该格式转换模块通过一后台运行的程序执行文件格式转换,该后台运行程序由Visual Basic程序编写语言编写。
文件合并模块126用于将转换后的XML格式文件与Word文件的附加图档合并,构成一个完整的XML文件,该附加图档为Word文件内附加的图档,该图档的格式可为标签图像文件格式(Tagged Image File,TIF)、标记图像文件格式(Tagged Image File Format,TIFF)位图文件(BitMap,BMP)、图像交换格式(Graphics lnterchange Format,GIF)、联合图形图像专家组(Joint Photo Graphic Experts Group,JPEG)等格式。
参阅图3所示,是本发明文件转换系统的数据库中摘要信息表示意图。该摘要信息为数据库13中非结构化资料的摘要信息300,该摘要信息300包括资料编号301、资料标题302、资料位置303、资料目录304及转换日期305。资料编号301为一资料标示编号,用于应用程序服务器12识别文件之用,该资料编号为顺序编号,且在数据库13中有序排列。资料标题302为各种非结构化资料的标题,包括文件标题、图像标题、声音标题及影像标题。资料位置303用于记录数据库13中不同的非结构化资料的存储位置,该存储位置表明了某项数据的详细储存位置,例如文件123.doc的数据位置为C\Winnt\System32\123.doc。资料目录304记录某项资料的储存目录,转换日期305记录Word格式文件转换为XML格式文件的转换日期。
参阅图4所示,是本发明文件转换系统与方法的文件转换与合并流程图。首先,传输请求接收模块121接收客户端计算机10发出的文件传输请求(步骤S40);接着由文件获取模块122透过网络11从数据库13获取对应的文件(步骤S41),文件检查模块123对上述所获得的文件执行格式识别与检查(步骤S42);判断该文件格式是否为Word格式(步骤S43);若经过检查,判断该文件格式为非Word格式文件,则直接结束转换流程。若经过检查,判断该文件确为Word文件,则由文件分析模块124执行文件内容识别,从而得到该文件的不同段落,例如摘要段落、正文段落、详细描述段落等,接着由格式转换模块125将该文件从Word格式转换为XML格式(步骤S44)。上述的格式转换模块125执行包括如下步骤首先,由格式转换模块125根据上述的分析结果设定XML文件中对应段落,将该Word文件中每一资料标题下对应段落文字复制并粘贴到XML格式文件中对应的资料标题段落下,完成文件格式转换,上述步骤S44中文件格式转换在一后台运行程序的控制下完成,该后台运行程序用Visual Basic语言编写。接着由文件合并模块126将转换后的XML格式文件与Word文件中的图像进行合并,以构成一个完整的XML文件(步骤S45),最后返回该XML文件到客户端计算机10(步骤S46),流程结束。
权利要求
1.一种文件转换系统,该文件转换系统可将Word格式文件转换为可延伸性标示语言格式文件,其特征在于,包括多个客户端计算机,用于发出文件传输请求;一数据库,其中存储不同格式的文件;一应用程序服务器,包括一传输请求接收模块,用于接收客户端计算机发送的文件传输请求;一文件获取模块,用于根据文件传输请求获得所需传输的文件;一文件检查模块,用于对上述所获得的文件进行文件格式的识别和检查;一文件分析模块,用于对经过文件格式检查后的文件内容进行分析,获得该文件不同的段落;一格式转换模块,用于将经过文件内容分析后的Word格式文件转换为可延伸性标示语言格式的文件;一文件合并模块,用于将转换后的可延伸性标示语言格式文件与Word格式文件中的图档合并,构成一个完整的可延伸性标示语言格式文件;一文件接收服务器,用于接收从应用程序服务器传输的可延伸性标示语言格式文件。
2.如权利要求1所述的文件转换系统,其特征在于,其中的数据库中存储的不同格式文件包括Word格式的文件。
3.如权利要求1所述的文件转换系统,其特征在于,其中的格式转换模块在一后台运行程序的控制下完成格式转换,该后台运行程序用Visual Basic语言编写。
4.一种文件转换方法,该文件转换方法可将Word格式文件转换为可延伸性标示语言格式文件,其特征在于,包括以下步骤发出文件传输请求;获取对应文件;检查文件格式,判断该文件的格式是否为Word格式;若判断得出该文件确实为Word格式文件,则将输入文件转换为可延伸性标示语言格式文件,合并该可延伸性标示语言格式文件与图档,返回完整的可延伸性标示语言格式文件;若判断得出该文件格式为其它非Word格式的文件,则直接结束操作流程。
5.如权利要求4所述的文件转换方法,其特征在于,其中的图档为转换的Word文件中所包含的图档。
6.如权利要求4所述的文件转换方法,其特征在于,其中的文件转换操作包括以下步骤根据文件分析模块对所获取文件的分析结果设定可延伸性标示语言格式文件中对应的段落;将该文件中不同资料标题下对应段落文字复制并粘贴到可延伸性标示语言格式文件中对应的资料标题段落下,完成文件格式转换。
全文摘要
本发明提供一种文件转换系统与方法。该文件转换系统包括多个客户端计算机、一应用程序服务器、一文件接收服务器及一数据库。该文件转换方法包括以下步骤发出文件传输请求;获取对应文件;检查和判断文件格式;将输入文件转换为可延伸性标示语言格式文件;合并该可延伸性标示语言格式文件与图档;返回完整的可延伸性标示语言格式文件。通过本发明提供的文件转换系统及方法,可将Word格式文件转换为可延伸性标示语言格式文件,提高用户工作效率。
文档编号G06F17/27GK1627288SQ20031011258
公开日2005年6月15日 申请日期2003年12月10日 优先权日2003年12月10日
发明者李忠一, 林海洪, 罗宝胜 申请人:鸿富锦精密工业(深圳)有限公司, 鸿海精密工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1