一种通用的文件自动化解析处理系统的制作方法

文档序号:6373286阅读:151来源:国知局
专利名称:一种通用的文件自动化解析处理系统的制作方法
技术领域
本发明涉及一种通用的文件自动化解析处理系统,属于文件自动化处理技术领域。
背景技术
日前,在完成工作任务中,经常需要对大量的计算机文件进行操作。按 照传统的方法,需要设计人员通过特殊软件将若干份含有计算机能够识别的编码文件手动生成人能识别的汉语文件,然后交由相关人员进行翻译。并在翻译结束后,由设计人员将 翻译的文件一一手动生成计算机识别的编码文件。这种手工方式带来的问题是一方面由于需要操作的文件较多,内容繁琐和不易识别,且不方便操作,极易出错;另一方面消耗了设计人员大量的时间和精力。目前国内外文件自动解析处理方面大体分为三种一是针对特定的领域文件;二是处理特定的XML文件;三是对数据库文件进行统计分析。以上情况存在的问题一是处理的对象具有针对性,业务比较单一,不具备满足多领域文件、多种处理要求的通用性;二是不能通过简单的配置或者修改来适应文件处理的通用性。

发明内容
本发明的技术解决问题针对现有技术的不足,提供一种通用的文件自动化解析处理系统,针对不同领域的各种文件,通过编写PM、XML配置文件,完成文件的自动化处理,加快文件处理速度,提高效率,解放文件处理的人力资源,并充分利用计算机资源。本发明的技术解决方案一种通用的文件自动化解析处理系统,包括指令输入模块、控制模块、XML文件配置模块、PM文件配置模块、XML文件载入模块、XML文件解析模块、PM文件载入模块、文件输出模块和文件处理模块;指令输入模块接收用户指令并将用户指令发送给控制模块,所述用户指令包括配置XML文件指令、配置PM文件指令和处理用户文件指令;控制模块根据用户指令的类别调用不同的模块,若用户指令为配置XML文件指令,则调用XML文件配置模块,由XML文件配置模块读取预设的XML文件,并且判断该XML文件是否符合预定格式,仅当该XML文件正常,即符合预定格式时,由文件处理模块将当前时间和该XML文件的名称及内容存入数据库,并且同时还将该XML文件存到XML文件指定目录之中;若用户指令为配置PM文件指令,则调用PM文件配置模块,由PM文件配置模块读取预设的PM文件,之后由文件处理模块将当前时间和该PM文件的名称存入数据库,并且同时还将该PM文件存到PM文件指定目录之中;若用户指令为处理用户文件指令,则调用XML文件载入模块,由XML文件载入模块读取存储在XML文件指定目录之中XML文件,之后由XML文件解析模块对该XML文件进行解析,得到该XML文件中的对PM文件的关联信息,并且根据所述关联信息调用PM文件载入模块将存储在PM文件指定目录中的PM文件载入,之后由文件处理模块根据PM文件中的处理指令对用户文件进行处理,再由文件输出模块将处理之后的用户文件进行保存并输出,即得到用户需求文件。 所述XML文件的格式包括标题用于表示该XML文件的名称;描述为该XML文件本身功能的介绍;关联为该XML文件关联到PM文件的描述;作者和日期为该XML文件的作者及生成日期;
·
所述PM文件采用Perl语言编写,该PM文件中的内容为对用户文件的操作指令。本发明与现有技术相比的有益效果是(I)本发明文件自动化解析处理系统更具有通用性本系统不局限于某种领域的某种文件,可以批量处理不同领域的、不同文件格式的大量文件。针对不同领域的不同需求,编写PM文件、XML配置文件可实现各类文件的解析处理。(2)本发明中PM文件可复用性强本发明中的PM文件使用Perl语言编写,允许调用、继承、修改。鉴于此,在实现新功能时,利用现有的PM文件,可缩短PM文件实现周期,降低实现难度。


图I为本发明系统组成框图;具体的实施方式本发明提供了一种通用的文件自动化解析处理系统,如图I所示,包括指令输入模块、控制模块、XML文件配置模块、PM文件配置模块、XML文件载入模块、XML文件解析模块、PM文件载入模块、文件输出模块和文件处理模块;XML文件和PM文件是根据用户需求预先编写好的,XML文件的格式包括标题(Title):用于表示该XML文件的名称;描述为该XML文件本身功能的介绍;例如包括该XML文件要处理的业务的介绍,以及该XML包含的所有关联的PM文件的介绍等等;关联为该XML文件关联到PM文件的描述,指明了该XML文件要关联到那个PM文件。作者和日期为该XML文件的作者及生成日期;PM文件采用Perl语言编写,该PM文件中的内容为对用户文件的操作指令。指令输入模块接收用户指令并将用户指令发送给控制模块,所述用户指令包括配置XML文件指令、配置PM文件指令和处理用户文件指令;控制模块根据用户指令的类别调用不同的模块,若用户指令为配置XML文件指令,则调用XML文件配置模块,由XML文件配置模块读取预设的XML文件,并且判断该XML文件是否符合预定格式,仅当该XML文件正常,即符合预定格式时,由文件处理模块将当前时间和该XML文件的名称及内容存入数据库,并且同时还将该XML文件存到XML文件指定目录之中;若用户指令为配置PM文件指令,则调用PM文件配置模块,由PM文件配置模块读取预设的PM文件,之后由文件处理模块将当前时间和该PM文件的名称存入数据库,并且同时还将该PM文件存到PM文件指定目录之中;本发明中数据库采用Mysql。若用户指令为处理用户文件指令,则调用XML文件载入模块,由XML文件载入模块读取存储在XML文件指定目录之中XML文件,之后由XML文件解析模块对该XML文件进行解析,得到该XML文件中的对PM文件的关联信息,并且根据所述关联信息调用PM文件载入模块将存储在PM文件指定目录中的PM文件载入,之后由文件处理模块根据PM文件中的处理指令对用户文件进行处理,PM文件中是由Perl语言编写的对用户文件进行操作的命令,比如命令为删除每一个用户文件中第100行的内容,则文件处理模块根据这个命令,顺次将所有用户文件中的第100行删除,之后再由文件输出模块将处理之后的用户文件进行保存并输出,即得到用户需求文件。第一次实际使用时,应先输入配置XML文件指令和配置PM文件指令,将所有的预 设好的XML文件和PM文件注册,之后再输入处理用户文件指令对用户文件进行处理,执行过后,以后如果XML文件和PM文件没有变动,就无需再对XML文件和PM文件注册。本发明执行效率高由于使用Perl语言编写PM文件,占用资源少,执行速度快。通过对本发明系统进行测试,对一份5万行文件进行解析处理的时间大约为0. 3秒。
权利要求
1.一种通用的文件自动化解析处理系统,其特征在于包括指令输入模块、控制模块、XML文件配置模块、PM文件配置模块、XML文件载入模块、XML文件解析模块、PM文件载入模块、文件输出模块和文件处理模块; 指令输入模块接收用户指令并将用户指令发送给控制模块,所述用户指令包括配置XML文件指令、配置PM文件指令和处理用户文件指令;控制模块根据用户指令的类别调用不同的模块, 若用户指令为配置XML文件指令,则调用XML文件配置模块,由XML文件配置模块读取预设的XML文件,并且判断该XML文件是否符合预定格式,仅当该XML文件正常,即符合预定格式时,由文件处理模块将当前时间和该XML文件的名称及内容存入数据库,并且同时还将该XML文件存到XML文件指定目录之中; 若用户指令为配置PM文件指令,则调用PM文件配置模块,由PM文件配置模块读取预设的PM文件,之后由文件处理模块将当前时间和该PM文件的名称存入数据库,并且同时还将该PM文件存到PM文件指定目录之中; 若用户指令为处理用户文件指令,则调用XML文件载入模块,由XML文件载入模块读取存储在XML文件指定目录之中XML文件,之后由XML文件解析模块对该XML文件进行解析,得到该XML文件中的对PM文件的关联信息,并且根据所述关联信息调用PM文件载入模块将存储在PM文件指定目录中的PM文件载入,之后由文件处理模块根据PM文件中的处理指令对用户文件进行处理,,再由文件输出模块将处理之后的用户文件进行保存并输出,即得到用户需求文件。
2.根据权利要求I所述的一种通用的文件自动化解析处理系统,其特征在于所述XML文件的格式包括 标题用于表不该XML文件的名称; 描述为该XML文件本身功能的介绍; 关联为该XML文件关联到PM文件的描述; 作者和日期为该XML文件的作者及生成日期;
3.根据权利要求I所述的一种通用的文件自动化解析处理系统,其特征在于所述PM文件采用Perl语言编写,该PM文件中的内容为对用户文件的操作指令。
全文摘要
一种通用的文件自动化解析处理系统,其特征在于包括指令输入模块、控制模块、XML文件配置模块、PM文件配置模块、XML文件载入模块、XML文件解析模块、PM文件载入模块、文件输出模块和文件处理模块。针对不同领域的各种文件,通过编写PM、XML配置文件,完成文件的自动化处理,加快文件处理速度,提高效率,解放文件处理的人力资源,并充分利用计算机资源。
文档编号G06F17/30GK102789495SQ20121024370
公开日2012年11月21日 申请日期2012年7月13日 优先权日2012年7月13日
发明者何文婷, 朱峰, 石云, 邹光南 申请人:航天恒星科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1