分布式异构数据整合系统的制作方法

文档序号:6338743阅读:217来源:国知局
专利名称:分布式异构数据整合系统的制作方法
技术领域
本发明涉及数据整合技木,尤其涉及ー种分布式异构数据整合系统。
背景技术
借助于计算机和网络,人类积累了丰富的数据资源。计算机网络的普及,使得数据资源的共享成为一个热门话题。然而,由于时间和空间上的差异,人们使用的数据源各不相同,各信息系统的数据类型、数据访问方式等也都千差万別。这就导致各数据源、系统之间不能高效地进行数据交換与共享,成为“信息孤岛”。“信息孤岛”的产生是信息化发展必然经历的阶段。在计算机应用的初级阶段,围绕ー项项业务工作,开发或引进ー个个应用系统。这些分散开发或引进的应用系统,一般不考虑数据标准或信息共享问题,形成“信息孤岛”也是必然的。集成困难是产生“信息孤岛”的客观原因。大部分的应用系统在设计之初都是针对 ー个特定的目的开发,而对于兼容性的考虑明显不足。应用标准的缺失是产生“信息孤岛” 的技术原因。在缺少统一数据标准的前提下,难以实现信息资源的整合。“信息孤岛”是如今存在于信息化系统的中普遍的问题。而“信息孤岛”所产生的不利影响主要如下一方面,数据的一致性无法保证。同一个数据在不同部门的应用系统中却是不一致的,正确性难以进行判断。另ー方面,信息无法得到及时的共享和反馈。信息是具有时效性的,ー些有用的信息超过了一定的时期,就变成了无用的信息。但^feb Service的出现有可能能够改变“信息孤岛”的现状,Web Service使得网络不再仅是传输数据的平台,而且也是传递服务的平台。基于Web Service技术的数据共享成为解決“信息孤岛”问题的ー个契机。

发明内容
本发明旨在提出ー种利用ffeb Service的分布式系统来整合存在于异构数据库中的数据。根据本发明,提出ー种分布式异构数据整合系统,包括一組数据服务提供単元、注册中心和客户端。一組数据服务提供単元中的每ー个数据服务提供単元包括数据库、Web Service 和Web服务器,其中不同的数据服务提供単元中的数据库根据不同的数据结构构建,数据库通过Wfeb Service连接到Web服务器,Web服务器通过W^eb Service访问数据库。每ー个数据服务提供単元的Web服务器在注册中心注册,注册中心提供服务列表,服务列表记录并在网络上公布经过注册的Web服务器。客户端包括Web应用程序和注册查询装置,注册查询装置周期性地与注册中心通信,查询经注册的Web服务器,Web应用程序访问经注册的Web服务器,通过Web服务器以及ffeb Service访问数据服务提供単元中的数据库。数据服务提供単元中的数据库是根据Oracle数据结构或者SQL数据结构构建。Web Service从数据库提取数据,将格式转换成统ー的数据格式后提供给Web服务器。该统ー的数据格式是符合HTTP协议、XML协议或SOAP协议其中之一的数据格式。注册中心是根据UDDI协议构建。客户端的Web应用程序不直接访问数据库,仅访问Web服务器上由W^eb Service 进行数据转换的数据。在ー个数据服务提供単元中,Web服务器中的数据与数据库中的数据同歩。本发明的分布式异构数据整合系统利用ffeb Service整合了存在于异构数据库中的数据,将这些异构数据转换成统ー的格式后保存在Web服务器中,通过Web服务器和注册中心的配合工作利用网络提供访问这些数据的平台,用户可以通过客户端借助Web服务器访问到这些数据而不会感受到由于异构数据而带来的问题。


图1掲示了根据本发明分布式异构数据整合系统的结构图。图2掲示了 Web Service的体系架构。
具体实施例方式本发明是借助于ffeb Service实现的分布式异构数据整合系统,在其中,Web Service起到了关键的作用,因此,此处首先对W^eb Service进行简单的介绍。对于^feb krvice,不同的组织有不同的定义。IBM的定义是Web Service是新一代Web应用,是自包含、自描述的模块化应用,能够通过Web被发布,定位和调用。一旦 ー个ffeb Service被发布,其他应用或者其他ffeb Service就可以发现和调用这个服务。微软给出的定义是一个Web Service是为其他应用提供数据和服务的逻辑应用単元。应用程序通过统ー的W^eb协议和数据格式(例如HTTP、XML、SOAP)访问Wfeb krvice,不需要担心任何实现细节。从表面上看,Web Service就是ー个应用程序,它向外界暴露出一个能够通过Wfeb 进行调用的API。也就是说ffeb Service是可通过URL定位的自动将信息返回到需要它的客户端那里的ー种资源。Web Service应该能够被客户方便地集成到本地应用程序中,甚至是另外的Web krvice中。因此它要有这样ー些特性Web Service应该是一个“黑匣子”,即客户无需关心它的具体实现它的实现和维护工作由服务提供者负责客户只需要通过它提供的接ロ来使用。Web Service应该实现自我功能描述以便向客户介绍自己。Web Service需要提供一种发现机制使得客户能够在Web上找到该服务。Web Service应该跨语言跨平台并且面向消息松散耦合。图2掲示了 Wfeb Service的体系架构。在W^eb Service的体系架构里有三个角色 服务提供者20,服务注册中心21和服务请求者22。服务提供者20是提供最终ffeb Service的供应商,它实现了ー个为特定的需求而编写的应用程序——Web Service,也称为Web服务,并放置在在线服务器上供別人使用。服务提供者20是ffeb Service的拥有者,负责其所拥有服务的发布、更新和回收。服务提供者20也是实现ffeb Service的平台。服务请求者22是服务的用户。服务请求者22是特定服务的消费者。服务请求者22也是查找并调用ー个特定服务的应用。服务请求者22可以是ー个通过浏览器访问服务的人,或者是ー个应用程序,甚至是另外ー个W^eb krvice。服务注册中心21是ー个Wfeb Service的注册地, 汇集了很多在线的Web krvice,一般来说服务提供者20将ffeb Service安装到在线服务器后,会将W^eb Service发布到服务注册中心21。对于想要使用Web Service的服务请求者22来说,首先去查询服务注册中心21,当发现合适的ffeb Service之后,将从服务注册中心21获取这些ffeb Service的技术信息引用,通过这些引用找到ffeb Service及其相关的技术信息,从而完成服务请求者21和服务提供者20之间的技术绑定。Web Service也提供了一系列的技术规范,包括XML、SOAP、WSDL、UDDI,它们构成了 ー个互操作的协议栈。XML 扩展标记语言 XML (extensible Markup Language)是ー门新兴的面向 hternet应用的标记语言,它是由万维网协会(也称为W3C)制定的ー种通用语言规范。XML 是根据 SGML (Standard Generalized Markup Language)制定的,它继承了 SGML 的规范, 实际上可以看作是SGML的ー个子集。XML不但继承了许多SGML的优点,而且比SGML更为简化。由于有太多的可选功能,SGML变得过于复杂,以至于很难编写出针对这种语言的普通解释器,而XML的解释器则简单的多。此外XML使得现有的hternet协议和软件更为协调,从而简化了数据的处理和传输。目前使用的最广泛的标记语言是HTML,但是HTML只是ー种静态的页面表现机制,只涉及了简单的页面文档及其相关媒体数据在hternet上的存储和传输,无法胜任向电子商务、图书目录,商品目录这样的复杂的应用。而XML是ー 种自描述的数据共享机制。其主要特点有
良好的扩展性XML可以让信息提供者根据需要,通过DTD自行定义标记及属性,结构化地描述信息,使其他信息系统自动了解文档的内容,从而使XML可用于多种场合。适与异构应用间的数据共享XML的灵活和扩展性使其可以对不同的应用甚至差异很大的应用的数据进行描述,尤其是对于那些专用于记录数据的应用。自描述性这个特性使得数据在不同的应用间进行交換和处理而不必要求相应的应用程序是针对该数据定制的。一个应用程序可以自动的理解另外ー个应用程序数据的含义。更有意义的数据检索在XML出现之前,搜索软件想要执行带有语义信息的查询是不可能的。XML的标记使得基于语义的查询成为可能。例如商品可以以标准的方式按照商品名、商品代码、价格或其他的标准进行查询。不同数据源的集成XML能够使不同来源的机构化数据很容易地结合在一起。软件代理商可以在中间层的服务器上对来自不同后台数据库和应用的数据进行集成。然后数据就能被发送到客户或其他服务器做进ー步地集合、处理和分发。可伸縮性由于XML把数据和显示分开,处理者能够在结构化的数据中嵌套程序化的描述以表达如何显示数据。这样可以只关心数据的逻辑结构甚至还可以定义自己的个人样式表来显示各种不同的XML数据。这是ー种非常強大的机制,能尽可能的减少客户计算机同使用者的交互,同时减少服务器和浏览器进行交換的相应时间,大大增强了服务器的可伸縮性。多种语言支持XML提供了多种字符集的支持。使得XML非常有利于多语种的应用的开发。XMLi^feb Service的基石。Web Service全部的规范、技术都是以XML为底层核心和构架基础的。无论W^eb Service的调用(SOAP技术)Jeb Service的描述(WSDL技术) 还是ffeb Service的发现(UDDI技木)都是使用XML作为信息描述和交換的标准手段。SOAP =SOAP协议定义了 W^eb Service參与者之间的标准交互协议,它的主要作用是为各类XML消息提供ー个简单统一旦轻量级的传输机制。它建立在XML基础上,提供了一个松散的、分布的环境中对等地通过交換结构化类型调用信息描述,从而完成远程过程/ 对象调用的一个简单机制。它本身没有定义任何应用语义,如编程模型或特定语义实现,只是通过一个模块化的包装模型和对模块中特定格式编码的数据地重编码机制来表示应用语义。SOAP由三部分组成S0AP信封、SOAP编码规则和SOAP RPC表示。SOAP信封构造定义了ー个整体的表示框架,是SOAP规范中定义的SOAP消息在句法上的最外层结构。在句法上,它包含了所有其他的SOAP元素和应用元素。SOAP编码规则定义了一个编码机制用于交換应用程序定义的数据类型的实例。SOAP RPC表示定义了一 个用于表示远端过程调用和相应的约定。由于SOAP采用了 XML,并在调用与交換信息方面有其优势,使得它称为Web krvice中互相调用的接ロ定义所遵循的规范。SOAP的主要特点是简明性和可扩展性。对于各ffeb Service之间的弱耦合关系,采用ー种简单的调用描述方法,符合其需求和特点。 SOAP是完全基于XML的,也继承了 XML的可扩展性和可描述性。此外,SOAP协议是和底层的通信协议无关的,但它可以和HTTP、SMTP等协议进行绑定。Web服务描述语言(WSDL) =WSDL是ー种基于XML格式的语言,用于定义Web Service具体实现细节和描述如何对其访问。WSDL将W^eb Service描述为ー组端点,这些端点对包含面向文档信息或面向过程信息的消息进行操作,使用户应用程序能够调用其所提供的服务。UDDI =WSDL准确定义了 Web Service,但它不足以使人们找到Web Service。如果用户不知道W^eb Service的存在,就不能找到描述它的WSDL。获得WSDL时需要ー些中心存储库。用户可以利用该库进行查询,以找到自己需要的Web Service。这就是UDDI要完成的工作。UDDI提供了一种基于分布式商业注册中心的方法,该商业注册中心维护了ー个企业提供的W^eb Service的全球目录,从而实现Wfeb Service的发布和发现。从概念上来讲,UDDI商业注册所提供的信息包含三部分“白页(White Page)”包括了地址、联系方法和已知的企业标识;“黄页(Yellow Page)”包括了基于标准分类法的行业类別;“绿页(Green I^age)”则包括了关于该企业所提供的ffeb Service的技术信息,其形式可能是ー些指向文件和URL的指针,而这些文件或URL是为服务发现机制服务的。所有的UDDI商业注册信息存储在UDDI商业注册中心里。UDDI注册中心是对所有提供公共UDDI注册服务站点的统称,在逻辑上它是ー个统一体,但在物理上则是以分布式系统架构实现,不同的站点之间采用对等的网络结构实现,因此访问其中任意一个站点就等同于访问UDDI注册中心。參考图1所示,本发明基于ffeb Service建立了ー种分布式异构数据整合系统,该系统包括一組数据服务提供単元10、注册中心11和客户端12。一組数据服务提供単元10中的每ー个数据服务提供単元包括数据库101、Web Service 102和Web服务器103,其中不同的数据服务提供単元10中的数据库101根据不同的数据结构构建,数据库101通过Wfeb Service 102连接到Web服务器103,Web服务器 103通过ffeb Service 102访问数据库101。在图1所示的实施例中,掲示了两个数据服务提供単元IOa和10b,其中的数据库IOla和IOlb分別是根据Oracle数据结构和SQL数据结构构建。Web Service 102从数据库101提取数据,将格式转换成统ー的数据格式后提供给Web服务器103。在一个实施例中,统ー的数据格式是符合HTTP协议、XML协议或SOAP 协议其中之一的数据格式。具体到图1所示的实施例,Web Service 10 从数据库IOla 提取数据,数据库IOla中的数据符合Oracle数据格式,因此Wfeb Service 10 提供如下的数据格式转换OracIe-HTTP、OracIe-XML、OracIe-SOAP,之后 Web Service 10 将经过格式转换的数据提供给Web服务器103a。Web Service 102b从数据库IOlb提取数据,数据库IOlb中的数据符合SQL数据格式,因此ffeb Service 102b提供如下的数据格式转换 SQL-HTTP、SQL-XML、SQL-S0AP,之后W^eb Service 10 将经过格式转换的数据提供给W^eb 服务器103b。每ー个数据服务提供単元10的Web服务器103在注册中心11注册,注册中心11 是根据UDDI协议构建,注册中心11提供服务列表,服务列表记录并在网络上公布经过注册的Web服务器103的信息。客户端12包括Web应用程序120和注册查询装置121,注册查询装置121周期性地与注册中心11通信,查询经注册的Web服务器103的信息,Web应用程序120访问经注册的Web服务器103,通过Web服务器103以及W^eb Service 102访问数据服务提供単元 10中的数据库101。客户端12的Web应用程序120不直接访问数据库102,而仅访问Web 服务器103上由ffeb Service 102进行数据转换的数据。在ー个数据服务提供単元10中, Web服务器103中的数据与数据库101中的数据同歩。因此对于客户端12的用户来说,不会感受到数据内容方面的任何差异,同时由于异构数据而带来的影响也被Web Service消除。本发明的分布式异构数据整合系统利用ffeb Service整合了存在于异构数据库中的数据,将这些异构数据转换成统ー的格式后保存在Web服务器中,通过Web服务器和注册中心的配合工作利用网络提供访问这些数据的平台,用户可以通过客户端借助Web服务器访问到这些数据而不会感受到由于异构数据而带来的问题。
权利要求
1.ー种分布式异构数据整合系统,其特征在干,一組数据服务提供単元,每ー个数据服务提供単元包括数据库、Web Service和Web服务器,其中不同的数据服务提供単元中的数据库根据不同的数据结构构建,数据库通过Web Service连接到Web服务器,Web服务器通过W^eb Service访问所述数据库;注册中心,每ー个数据服务提供単元的Web服务器在所述注册中心注册,注册中心提供服务列表,服务列表记录并在网络上公布经过注册的Web服务器;客户端,客户端包括Web应用程序和注册查询装置,所述注册查询装置周期性地与所述注册中心通信,查询经注册的Web服务器,所述Web应用程序访问经注册的Web服务器, 通过所述Web服务器以及ffeb Service访问数据服务提供単元中的数据库。
2.如权利要求1所述的分布式异构数据整合系统,其特征在干,所述数据库根据Oracle数据结构或者SQL数据结构构建。
3.如权利要求2所述的分布式异构数据整合系统,其特征在干,所述ffeb Service从数据库提取数据,将格式转换成统ー的数据格式后提供给Web服务器。
4.如权利要求3所述的分布式异构数据整合系统,其特征在干,所述统ー的数据格式是符合HTTP协议、XML协议或SOAP协议其中之一的数据格式。
5.如权利要求1所述的分布式异构数据整合系统,其特征在干,所述注册中心是根据UDDI协议构建。
6.如权利要求1所述的分布式异构数据整合系统,其特征在干,所述客户端的Web应用程序不直接访问数据库,仅访问Web服务器上由ffeb Service 进行数据转换的数据。
7.如权利要求1所述的分布式异构数据整合系统,其特征在干,在ー个数据服务提供単元中,Web服务器中的数据与数据库中的数据同歩。
全文摘要
本发明揭示了一种分布式异构数据整合系统,包括一组数据服务提供单元,每一个数据服务提供单元包括数据库、WebService和Web服务器,其中不同的数据服务提供单元中的数据库根据不同的数据结构构建,数据库通过WebService连接到Web服务器,Web服务器通过WebService访问所述数据库;注册中心,每一个数据服务提供单元的Web服务器在注册中心注册,注册中心提供服务列表,服务列表记录并在网络上公布经过注册的Web服务器;客户端,客户端包括Web应用程序和注册查询装置,注册查询装置周期性地与注册中心通信,查询经注册的Web服务器,Web应用程序访问经注册的Web服务器,通过Web服务器以及WebService访问数据服务提供单元中的数据库。
文档编号G06F17/30GK102567333SQ20101058952
公开日2012年7月11日 申请日期2010年12月15日 优先权日2010年12月15日
发明者陆莉莉 申请人:上海杉达学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1