提取排版数据的方法及装置的制作方法

文档序号:6614754阅读:170来源:国知局

专利名称::提取排版数据的方法及装置的制作方法
技术领域

背景技术
:排版作业需要对很多格式的出版物进行排版,并且不同格式的出版物所用的排版数据并不完全相同,例如在制作名片时需要将姓名、职位、地址、联系方式排版到名片上,而制作请柬时需要将被邀请人姓名、出席活动的项目、活动地点、以及活动时间排版到请柬上。在排版这些出版物时由于所用到的数据不同,所以需要从客户的数据库中提取出不同的排版数据,目前从客户数据库中提取排版数据的方法有如下两种一、根据具体排版业务的需要编写不同的数据提取处理程序,形成定制化的模块,并通过定制化的模块提取排版数据。例如在排版名片时,将姓名、职位、地址、联系方式等需要提取的项目写入到定制化模块;而在排版请柬时,将被邀请人姓名、出席活动的项目、活动地点、以及活动时间等需要提取的项目写入到定制化模块。由于需要提取的项目被固定的写入了定制化模块,所以每个不同格式的出版物都需要一个对应的定制化模块,当需要更改出版物时,都需要修改原有的定制化模块或编写新的定制化模块,增加了工作量。着排版系统应用范围的扩大,定制化的模块也越来越多,进而会导致系统的维护成本和风险不断提升。二、事先预计需要提取的项目,然后将这些项目通过一个窗口输入,例如:排版时通过窗口输入数据库的连接参数,选择数据表,以及数据关联关系,然后通过提取程序从数据库中提取出相应的数据。上述方法需要预计提取项目,但实际操作时,会出现很多不可预测的需要提取数据的项目,这样该方法就不能完全适应,需要去修改窗口中能够输入的项目,降低了工作效率。
发明内容本发明提供一种提取排版数据的方法,以降低排版系统的维护成本和实施风险。为达到上述发明目的,本发明采用如下技术方案该提取排版数据的方法包括创建数据提取的信息表;将数据提取的信息表转换成计算机语言;依据信息表转换成的计算机语言连接数据库,并提取排版数据。所述数据提取的信息表包括数据库的连接参数、数据提取的筛选条件以及数据关联参数。所述数据库的连接参数用于提供连接数据库的必要信息。所述数据提取的筛选条件用于描述待提取数据所要符合的条件。所述数据关联参数用于确定提取后的数据之间的关系。其中,依据信息表转换成的计算机语言连接数据库,并提取排版数据具体包括根据数据库连接参数中设置的数据库所在的服务器名称、数据库名称、登陆数据库的用户名和密码,建立与数据库的连接;依据数据提取的筛选条件以及数据关联参数,从数据库中提取符合筛选条件的数据,并按照数据关联参数对提取后的数,进行合并。所述的提取排版数据的方法还包括将提取后的数据转换成XML格式。所述数据提取的信息表采用XML格式描述。由上述技术方案所描述的提取排版数据的方法,通过创建数据提取的信息表来描述需要提取的数据,并将数据提取的信息表转换成计算机语言,这样计算机就可以根据转换成计算机语言后的信息表连接数据库,并在数据库中提取排版数据,实现了排版数据的提取。由于本发明中不采用定制化模块提取排版数据,当需要更改出版物时,只需要修改数据提取的信息表,而数据提取的信息表采用自然语言描述,修改起来比较简单,从而降低了排版系统的维护成本和实施风险。由于数据提取的信息表不需要事先预测需要提取的项目,可以随时添加需要提取的项目,并且是通过自然语言添加,所以本发明提取排版数据的方法能够适应很多不可预测的提取项目的需要。本发明还提供一种提取排版数据的装置,以降低排版系统的维护成本和实施风险。为达到上述发明目的,本发明采用如下技术方案该提取排版数据的装置包括信息采集模块,用于采集数据提取的信息表;解析模块,连接到信息采集模块,用于将数据提取的信息表转换成计算机"i吾5;信息提取模块,连接到解析模块,根据数据提取的信息表转换成的计算机语言连接数据库,并提取排版数据。所述信息采集模块将数据提取的信息表以XML的格式输入到解析模块。由上述技术方案所描述的提取排版数据的装置,通过信息釆集模块来采集数据提取的信息表,然后由解析模块将数据提取的信息表转换成计算机语言,并最后由信息提取模块根据所述的计算机语言连接数据库及提取排版数据。由于信息表中的可以随时添加需要提取的项目,并且是通过自然语言添加,所以本发明提取排版数据的方法能够适应很多不可预测的提取项目的需要。而采用解析模块将数据提取的信息表转换成计算机语言,使得用户在修改自然语言描述的数据提取的信息表时,就可以使得转换后的计算机语言改变,即可更改提取项目,相对于现有技术而言不需要维护定制化模块,从而降低了排版系统的维护成本和实施风险。图1为本发明提取排版数据的方法的基本流程图2为本发明提取排版数据的方法中连接数据库的流程图。具体实施例方式本发明提取排版数据的方法及装置通过数据提取的信息表来描述需要提取的数据,然后将数据提取的信息表转换成计算机语言,以便计算机能够按照要求提取数据,省去了管理定制换模块的维护成本和实施风险。而数据提取的信息表能够随时添加需要提取的项目,并且是通过自然语言添加,所以本发明提取排版数据的方法能够适应很多不可预测的提取项目的需要。下面结合附图对本发明提取排版数据的方法及装置进行详细描述。如图l所示,本发明提取排版数据的方法包括(1)创建数据提取的信息表;所述数据提取的信息表包括数据库的连接参数、数据提取的筛选条件以及数据关联参数。为了使得信息表能够为较大多数大的用户所熟悉,本发明中的数据提取的信息表采用XML格式描述。其中,所述数据库的连接参数用于提供连接数据库的必要信息。数据库结构不同,登陆数据库时需要提供的必要信息会有所不同。对于SQL(StructuredQueryLanguage,结构查询语言)SERVER数据库,所述数据库的连接参数需要数据库所在的服务器名称、数据库名称、登陆数据库的用户名和密码;对于oracle数据库,所述数据库的连接参数需要提供机器名、用户名、密码;对于文件数据库,如EXECL、ACCESS或CSV(CommaS印aratedValue,逗号分隔值)所述数据库的连接参数只需文件名。通过上述的连接参数,即可登陆数据库,一般的数据库可能会有很多的数据表,每个数据表中记录不同的信息,例如在4艮行的数据库中,有的数据表记录用户的基本信息,有的数据表记录对应用户的刷卡信息。其中,所述数据提取的筛选条件用于描述待提取数据所要符合的条件。例如可以将用户姓名作为筛选条件,只要和制定用户相关的信息都会被提取出来。其中,所述数据关联参数用于确定提取后的数据之间的关系。从多个数据表中提取数据时,指定数据之间的关联关系,用于确定提取后数据的组织结构和层次关系,当数据库中存在多个信息表时,这些信息表之间是两两主次关联的,数据关联参数包括相关联的主表名称、主表关联列名、从表名称、从表关联列名。一个主表可以对应多个子表,主表和子表之间可以通过多个列进行关联。例如在用户基本信息表中提取指定用户的基本信息,而在刷卡信息表中提取指定用户的刷卡记录,那么其中的用户姓名就可以作为数据关联参数。(2)创建完上述的数据提取的信息表后,将数据提取的信息表转换成计算机语言,如转换成SQL语言,以便计算机能够识别。(3)依据信息表转换成的计算机语言连接数据库,并提取排版数据。具体包括如下步骤根据数据库连接参数建立与数据库的连接;依据数据提取的筛选条件以及数据关联参数,从数据库中提取符合筛选条件的数据,并按照数据关联参数对提取后的数据进行合并。(4)由于后续的排版只能读取固定格式的数据,为了将提取出的数据进行排版,需要将提取后的数据转换成固定格式,由于目前本领域的技术人员对XML格式比较熟悉,故而本发明中将提取后的数据转换成XML格式。本发明提供的提取排版数据的装置包括如下模块信息采集模块,用于采集数据提取的信息表,可以将该信息表以文本格式输入到信息采集模块,或者以XML格式输入到信息采集模块。所述采集数据提取的信息表包括数据库的连接参数、数据提取的筛选条件以及数据关联参数。其中,所述数据库的连接参数用于提供连接数据库的必要信息。数据库结构不同,登陆数据库时需要提供的必要信息会有所不同。例如,对于SQLSERVER数据库,所述数据库的连接参数需要数据库所在的服务器名称、数据库名称、登陆数据库的用户名和密码;对于oracle数据库,所述数据库的连接参数需要提供机器名、用户名、密码;对于文件数据库,如EXECL、ACCESS或CSV所述数据库的连接参数只需文件名。通过不同数据库所需连接参数,即可登陆数据库。所述数据提取的筛选条件用于描述待提取数据所要符合的条件;所述数据提取的筛选条件用于描述待提取数据所要符合的条件。解析模块,连接到信息釆集模块,用于将数据提取的信息表转换成计算机语言,为了使得信息表能够为较大多数大的用户所熟悉,本发明中的数据提取的信息表采用XML格式描述;信息提取模块,连接到解析模块,根据数据提取的信息表转换成的计算机语言连接数据库,并提取排版数据。具体为根据数据库连接参数建立与数据库的连接;依据数据提取的筛选条件以及数据关联参数,从数据库中提取符合筛选条件的数据,并按照数据关联参数对提取后的数据进行合并。下面结合典型的提取排版数据的方法的案例,阐述本发明的实际使用方式。假设本实施例采用SQLServer数据库,服务器名称为Founder、数据库名称为AutoPrint、用户名为sa、用户密码为pass,业务数据库中有两个表,如表l所示,用于记录客户的基本注册信息,如表2所示,用于记录客户的刷卡消费信息。表1客户的基本注册信息<table>tableseeoriginaldocumentpage9</column></row><table>要提取的数据结果是汇总了客户的基本注册信息和刷卡消费信息,本实施例需要得到的排版数据的数据结构如下<刷卡信息汇总〉<个人消费信息><个人基本信息姓名=""发卡行=,",账户类型=""/><刷卡信息><刷卡记录刷卡项目=""刷卡金额=,",刷卡时间=,",/><刷卡记录刷卡项目=""刷卡金额=""刷卡时间=""/><刷卡记录刷卡项目=""刷卡金额=""刷卡时间=",7><刷卡信息><个人消费信息><刷卡信息汇总>为了完成本实施例的排版数据的提取,需要创建的数据提取的信息表如下〈数据提取规则〉〈连接参数服务器名称-"Founder"数据库名称-"AutoPrint"用户名-"sa"用户密码-"pass"/〉<数据筛选条件>〈筛选条件数据表="表1"篩选参数^select姓名,发卡行,账户类型from表1"/>〈筛选条件数据表="表2"筛选参数="select刷卡项目,刷卡金额,刷卡时间from表2"/></数据筛选条件〉〈数据关联参数〉〈关联参数主表名称="表1"主表关联列名="姓名"从表名称="表2"从表关联列名="姓名"/〉</数据关联参数></数据提取规则>由上述数据提取的信息表可知,需要从表l中提取的信息包括"姓名"、"发卡行"、"账户类型",需要从表2中提取的信息包括"刷卡项目"、"刷卡金额"、"刷卡时间";因为需要从两个表中提取数据,所以需要设置数据关联参数,其中表l为主表,关联的列名为"姓名",表2为从表,关联的列名为"姓名"。创建好上述数据提取的信息表后,需要将上述的信息表转换成计算机语言,本实施例中转换成SQL语言,使得计算机能够访问数据库。然后由计算机连接数据库,并提取排版数据;如图2所示,具体的步骤是a)根据连接参数中设置的服务器名称连接到名为"Founder"的服务器,然后通过用户名sa和用户密码pass登陆名为"AutoPrint"的数据库,从而建立与数据库之间的连接;b)判断数据提取的信息表中是否设置了关联参数,如果数据提取的信息表中没有设置数据关联参数,则执行步骤c),否则执行步骤d);在本实施例中需要从两个数据表中提取排版数据,故而在数据提取的信息表中设置了数据关联参数,因此执行步骤d);c)根据数据筛选条件,从数据库中提取需要排版的数据;d)根据数据筛选条件,从数据库的多个表中提取需要排版的数据,根据数据关联参数对数据的排版数据进行合并;本实例的数据提取采用Microsoft的DotNet技术中的Dataset来完成,将数据筛选条件和数据关联参数作为参数对Dataset进行初始化,并完成排版数据的提取;e)最后,需要将提取后的数据转换为指定的数据格式,以完成排版数据的输出;本实例中通过Dataset的接口函数将提取到的排版数据输出,并转换为XML格式,得到最终的结果如下<刷卡信息汇总><个人消费信息><个人基本信息姓名=,,张三"发卡行=,,中国方正银行"账户类型=,,人民币,V〉<刷卡信息><刷卡记录刷卡项目="交通费"刷卡金额="25.00"刷卡时间="2006-8-1"/><刷卡记录刷卡项目="通讯费"刷卡金额="120.00"刷卡时间="2006-8-1"/><刷卡记录刷卡项目="购物"刷卡金额="580.00"刷卡时间="2006+3"/><刷卡信息〉</个人消费信息><个人消费信息><个人基本信息姓名=,,李四"发卡行="香港方正4艮行,,账户类型="港币,V〉<刷卡信息><刷卡记录刷卡项目="才几票"刷卡金额="1100.00"刷卡时间=,,2006-8-2,7〉<刷卡记录刷卡项目="住宿费"刷卡金额="360.00"刷卡时间="2006-8-3"/><刷卡记录刷卡项目="交通费"刷卡金额=,,80.00"刷卡时间="2006-8-4"/〉<刷卡信息></个人消费信息〉<个人消费信息><个人基本信息姓名="王五"发卡行="新加坡方正银行"账户类型=,,新币"/><刷卡信息〉<刷卡记录刷卡项目="餐^:费"刷卡金额="30.00"刷卡时间="2006-8-2,7><刷卡记录刷卡项目="交通费"刷卡金额="24.00"刷卡时间="2006-8-2"/><刷卡信息></个人消费信息><刷卡信息汇总>本发明主要用于提取排版数据,例如在排版名片、排版请柬时,需要从不同的数据库中提取不同的数据,可以利用本发明来实现。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。权利要求1、一种提取排版数据的方法,其特征在于包括创建数据提取的信息表;将数据提取的信息表转换成计算机语言;依据信息表转换成的计算机语言连接数据库,并提取排版数据。2、根据权利要求1所述的提取排版数据的方法,其特征在于,所述数据提取的信息表包括数据库的连接参数、数据提取的筛选条件以及数据关联参数。3、根据权利要求2所述的提取排版数据的方法,其特征在于,所述数据库的连接参数用于提供连接数据库的必要信息。4、根据权利要求2所述的提取排版数据的方法,其特征在于,所述数据提取的筛选条件用于描述待提取数据所要符合的条件。5、根据权利要求2所述的提取排版数据的方法,其特征在于,所述数据关联参数用于确定提取后的数据之间的关系。6、根据权利要求1至5任一项所述的提取排版数据的方法,其特征在于,依据信息表转换成的计算机语言连接数据库,并提取排版数据具体包括根据数据库连接参数建立与数据库的连接;依据数据提取的筛选条件以及数据关联参数,从数据库中提取符合筛选条件的数据,并按照数据关联参数对提取后的数据进行合并。7、才艮据权利要求6所述的提取排版数据的方法,其特征在于还包括将提取后的数据转换成XML格式。8、根据权利要求l所述的提取排版数据的方法,其特征在于,所述数据提取的信息表采用XML格式描述。9、一种提取排版数据的装置,其特征在于包括信息采集模块,用于采集数据提取的信息表;解析模块,连接到信息采集模块,用于将数据提取的信息表转换成计算机语言;信息提取模块,连接到解析模块,根据数据提取的信息表转换成的计算机语言连接数据库,并提取排版数据。10、根据权利要求9所述的提取排版数据的装置,其特征在于,所述信息采集模块将数据提取的信息表以XML的格式输入到解析模块。全文摘要本发明公开了一种提取排版数据的方法及装置,解决了现有排版数据提取的维护成本高和实施风险高的问题。该提取排版数据的方法包括创建数据提取的信息表;将数据提取的信息表转换成计算机语言;依据信息表转换成的计算机语言连接数据库,并提取排版数据。对应的装置包括信息采集模块,采集数据提取的信息表;解析模块,将数据提取的信息表转换成计算机语言;信息提取模块,根据数据提取的信息表转换成的计算机语言连接数据库,并提取排版数据。由于数据提取的信息表采用自然语言描述,修改简单,降低了排版系统的维护成本和实施风险。本发明用于提取排版数据,例如在排版名片、排版请柬时提取数据。文档编号G06F17/30GK101178735SQ20071019575公开日2008年5月14日申请日期2007年12月14日优先权日2007年12月14日发明者龚文荣申请人:北大方正集团有限公司;北京北大方正电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1