建立书刊文献数据库的方法

文档序号:6420858阅读:243来源:国知局
专利名称:建立书刊文献数据库的方法
技术领域
本发明属于应用于图书和期刊的数据库系统领域,具体涉及一种建立书刊文献数据库的方法。
背景技术
目前,公知的书刊文献数据库都是独立于纸本图书之外的系统。流行的电子书技术和解决方案也是关注对已经出版的图书期刊等内容的处理,而与传统出版的生产环节是相互脱节的。同时,为了防止用户的版权盗用,电子书普遍采用严苛的限制手段,诸如特制的文件格式、必须在线阅读等等不便措施,不能满足读者通过利用电子书刊实现从阅读图书到使用图书的愿望。

发明内容
本发明克服上述现有的书刊文献数据库的不足,提供一种依托书刊发行而同步建立的书刊文献数据库方法。
本发明的技术内容一种建立书刊文献数据库的方法,包括(1)在书刊出版生产环节,根据样书制作书刊全文电子档案;(2)采用数据文本汇整工具汇整书刊文本数据,作为数据库中一个子数据库;(3)针对全文电子档案和子数据库设定配置文件;(4)设置数据库管理系统;(5)将书刊全文电子档案、书刊文本数据及对应的配置文件,连同数据库管理系统一起打包封装到安装文件制作光盘;(6)光盘随书刊同步发售或独立发行,通过安装光盘建立书刊数据库。
安装不同书刊数据库光盘时,如果数据库管理系统相同,无需更新数据库管理系统,仅累加子数据库的数据;如果数据库管理系统不同,采用另一个统一的数据库管理系统进行整合。
累加多个子数据库时,数据库管理系统可自动运行索引建档工具,通过全部重新建立索引和累进式建立索引,形成单一的索引档案,将新旧子库的数据内容自动累加整合在一个数据库内。
原文全书电子档案可采用可加密的通用文件格式,例如MS Word和AdobePDF等文件格式。在电子档案制作过程中,设定文档的阅读密码。同时,电子档案与其内容相同的数据库数据对应存放。相关的阅读密码和全文电子档案与数据的对应关系可加密写入上述数据库配置文件。
进一步可包括自动解密的流程(1)打开MS Word或Acrobat Reader,MS Word或Acrobat Reader对加密过的MS Word或PDF文件会弹出一个密码对话框;(2)遍历当前Windows系统的各个窗口,找到打开含密码文件的MS Word或PDF文件,进而遍历其子窗口序列,获取密码对话框窗口的Windows句柄;(3)得到密码对话框窗口中填写密码的输入框的句柄,将解密后的密码添入该输入框,并触发密码对话框窗口的提交按钮。
所述数据文本汇整工具可以是XML编辑器,全文数据库的所有数据库数据可采用XML格式存放,字段在XML中定义。
本发明的技术效果为出版行业在书刊出版的生产环节中纳入书刊文献数据库光盘的制作,其光盘可以随书刊同步发售或独立发行,书刊文献数据库主要依托书刊文献数据库光盘的发行由读者安装而建立。同时,读者在安装不同种图书或不同期刊物的光盘时,将新旧不同子数据库的数据内容自动累加整合在一个数据库内。针对出版社而言,通过出售不同的图书光盘,也即不同的子库,可以将新旧图书的数据内容自动累加整合在一个数据库内。读者购买的该出版社的图书越多,其书刊数据库中累加的子库也就越多,数据量也越丰富。
在原文数据提供方面,数据所有者可选择采用通用的文件格式发布原文档案,但进行档案加密,以防止不当流传。唯在用户使用书刊数据库调阅的时候,系统可以自动解密,不需要读者用户干预,不会使用户感到不便。


图1是本发明书刊文献数据库的数据库光盘制作示意图;图2是本发明书刊文献数据库示意图;图3是本发明书刊文献数据库的原文自动解密示意图;图4是本发明书刊文献数据库界面示意图。
具体实施例方式
参考图1,本发明在书刊出版的生产环节中纳入书刊文献数据库光盘的制作。数据库光盘制作系统是由一组软件工具所组成,并辅助以高速扫描仪和文字自动光学辨识等相关电子文件制作的支持软硬件。
具体实施方式
如下(1)在新书刊出版之前,首先根据样书样稿高速扫描形成TIFF图形档案,并完成电子书刊的制作,例如Adobe PDF格式的电子书。对杂志期刊,可采用作者投稿的原格式,例如MS Word格式或Adobe PDF格式,并且同步设定电子文件的阅读密码。
(2)对书刊数据库光盘中所包括的书刊数据本身的封装是透过XML编辑器完成的。采用XML编辑器将所要封装的数据按照约定的XML格式写入XML编辑器内,包括条目名称、作者、内文、发布日期等,形成统一的经过格式校验的,符合书刊数据库要求的XML文本。利用编辑器汇整数据,能够保证数据的格式统一,正确入库。
(3)参考图1,将数据的命名和分类命名,以及电子档案的密码设定到配置文件内。配置文件可加密存放,并将在数据库光盘安装时自动分析配置文件的内容,将光盘中的书刊内容放置在书刊数据库为所要安装的内容提供的位置中。
(4)设置数据库管理系统,参考图2,数据库管理系统包括主模块,负责控制其它模块,协调各模块之间的通讯;Acrobat包(Acrobat Wrapper),实现加密的PDF格式原文全书电子档案的自动解密;检索引擎(Search Engine),是系统的数据中心,作用是存储管理数据,并提供分字段的全文检索功能;检索引擎连接包(Search Engine Connection Wrapper),负责主模块与检索引擎的通讯,包括数据的增删改查等操作;图形用户接口(GUI),是系统的显示接口模块,封装了所有的菜单,工具条,对话框,控制按钮等;嵌入式IE(Embedded IE)模块,内嵌了一个Internet Explorer,使得书刊数据库系统可以方便地显示各类数据,图形及多媒体信息;XML分析器(XML Parser)模块,用来方便存取各种系统配置文件及数据文件;网络登入(WebLogin)模块,用于实现自动在线数据更新,含数据下载和上传,并可在数据提供方用户授权的基础上自动登录数据服务网站;解密(Decryption)模块,用于数据文件的加解密操作。
(5)参考图3,在书刊文献数据库内还包括原文自动解开阅读密码的技术,其工作流程为首先打开MS Word或Acrobat Reader,MS Word或Acrobat Reader对加密过的MS Word或PDF文件会弹出一个密码对话框。登入模块遍历当前Windows系统的各个窗口,找到打开含密码文件的MS Word或PDF文件,进而遍历其子窗口序列,获取密码对话框窗口的Windows句柄。之后,登入模块得到密码对话框窗口中填写密码的输入框的句柄,将解密后的密码添入该输入框,并触发密码对话框窗口的提交按钮,从而完成密码的自动登入过程。在这期间,文件监控器一直监控MS Word或Acrobat Reader的各种异常行为,即使通过Windows核心的消息机制关闭其它异常信息窗口,保证登入动作的顺利完成。该技术包括的模块如下,以PDF档案自动解密为例主动解密主模块,负责与其他模块的通讯,完成自动解密的整个流程;RSA模块,实现RSA算法,实现非对称的加解密动作;密钥生成模块,负责生成系统公钥,并协助用户生成私钥;Acrobat密码登入模块实现打开加密PDF文件的功能,自动登入Acrobat并解密。
(6)参考图1,在XML文本数据和加密的电子档案,以及配置文件和数据库管理软件群备妥后,利用打包工具,将书刊全文电子档案、书刊文本数据及对应的配置文件,连同数据库管理软件系统一起打包封装,根据作业流程进行测试和病毒扫描杀毒,至此,完成书刊数据库母盘(Mother CD)的制作。
(7)光盘随书刊同步发售或独立发行,通过安装光盘建立书刊数据库。参考图4,书刊文献数据库系统功能区放置文件、命令、查看和帮助等系统使用功能;数据库功能区放置全文检索窗口,分字段控制选单等。在检索结果与条目浏览区内,在浏览模式下,放置子库的名称;在检索模式下,排列检索结果。在分类与分库管理区内,提供各个子库的清单,可以任意单选或复选不同的子数据库,进行内容的全文检索。图书数据内容浏览区用于呈现多媒体数据内容。在安装不同书刊数据库光盘时,数据库管理系统自动运行索引建档工具,通过全部重新建立索引和累进式建立索引,形成单一的索引档案,将新旧子库的数据内容自动累加整合在一个数据库内。以图书为例,通过多个光盘安装,可以在书刊数据库内建立多重子库。一张光盘的内容即可以包括一个或多个子库的数据,假设任意一个子库的数据为K(i),则一个光盘中既有数据也有数据库管理系统软件,可标记为K(i)M,其中M表示书刊数据库管理系统。如果每本图书的数据看作是一个子库,由多个数据子库所组成的书刊数据库,可以标记为K(books)=K(1),K(2),...,K(m),...,K(n),...,数据库管理系统标记为M,则安装任意光盘K(m)M,都将安装完整的数据库管理系统和K(books)的一个子库K(m)。在用户取得并安装第二张数据库光盘K(n)M后,将在用户端建立一个新的书刊数据库系统,(K(m)+K(n))M。通过多书刊数据库光盘的安装,理想状态下用户拥有的书刊数据库为K(books)M,其众多子库的命名可由文件表控制。
对书刊数据库管理系统而言,如果某一出版社的数据库管理系统M相同,则无需更新安装M。对不同的出版社而言,数据库管理系统M可能不同,具有微小的差异,必要时可以采用彼此共通的数据库管理系统进行整合,从而达到汇整多个不同的书刊数据库的数据资源。
权利要求
1.一种建立书刊文献数据库的方法,包括(1)在书刊出版生产环节,根据样书制作书刊全文电子档案;(2)采用数据文本汇整工具汇整书刊文本数据,作为数据库中一个子数据库;(3)针对全文电子档案和子数据库设定配置文件;(4)设置数据库管理系统;(5)将书刊全文电子档案、书刊文本数据及对应的配置文件,连同数据库管理系统软件群组一起打包封装到安装文件制作光盘;(6)光盘随书刊同步发售或独立发行,通过安装光盘建立书刊数据库。
2.如权利要求1所述的建立书刊文献数据库的方法,其特征在于安装多个不同书刊数据库光盘时,如果数据库管理系统相同,无需更新数据库管理系统,仅累加子数据库的数据;如果数据库管理系统不同,采用另一个统一的数据库管理系统进行整合。
3.如权利要求2所述的建立书刊文献数据库的方法,其特征在于累加多个子数据库时,数据库管理系统自动运行索引建档工具,通过全部重新建立索引和累进式建立索引,形成单一的索引档案,将新旧子库的数据内容自动累加整合在一个数据库内。
4.如权利要求1、2或3所述的建立书刊文献数据库的方法,其特征在于原文全书电子档案采用可加密的通用文件格式,在电子档案制作过程中,设定文档的阅读密码,同时,电子档案与其内容相同的数据库数据对应存放,相关的阅读密码和全文电子档案与数据的对应关系可加密写入上述数据库配置文件。
5.如权利要求4所述的建立书刊文献数据库的方法,其特征在于进一步包括自动解密的流程(1)打开MS Word或Acrobat Reader,MS Word或Acrobat Reader对加密过的MS Word或PDF文件会弹出一个密码对话框;(2)遍历当前Windows系统的各个窗口,找到打开含密码文件的MS Word或PDF文件,进而遍历其子窗口序列,获取密码对话框窗口的Windows句柄;(3)得到密码对话框窗口中填写密码的输入框的句柄,将解密后的密码添入该输入框,并触发密码对话框窗口的提交按钮。
6.如权利要求1所述的建立书刊文献数据库的方法,其特征在于所述数据文本汇整工具是XML编辑器,全文数据库的所有数据库数据采用XML格式存放,字段在XML中定义。
7.如权利要求1或6所述的建立书刊文献数据库的方法,其特征在于所述子数据库由文件表控制。
全文摘要
本发明提供了一种建立书刊文献数据库的方法,属于应用于书刊的数据库系统领域。该方法包括在书刊出版生产环节,根据样书制作书刊全文电子档案,采用数据文本汇整工具汇整书刊文本数据,作为数据库中一个子数据库,设定相关配置文件,设置数据库管理系统,将书刊全文电子档案、书刊文本数据及对应的配置文件,连同数据库管理系统软件一起打包封装制作成光盘,光盘随书刊同步发售或独立发行,通过读者安装光盘建立书刊数据库。在书刊出版的生产环节中纳入书刊文献数据库光盘的制作,使书刊文献数据库依托书刊文献数据库光盘的发行而建立。同时,读者在安装不同种图书或不同期刊物的光盘时,将新旧子库的数据内容自动累加整合在一个数据库内。
文档编号G06F17/30GK1627306SQ20031011738
公开日2005年6月15日 申请日期2003年12月12日 优先权日2003年12月12日
发明者赵锋, 王宏源 申请人:王宏源
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1