端到端云服务系统及其数据挖掘方法

文档序号:8433921阅读:423来源:国知局
端到端云服务系统及其数据挖掘方法
【技术领域】
[0001]本发明涉及云计算、服务、应用程序及移动互联网领域,具体而言,涉及虚拟化数据库的数据挖掘方面。
【背景技术】
[0002]现有技术被限制于对数据库的虚拟化以最佳地使用及共享物理资源及提高数据库访问性能。数据库虚拟化难以解决挖掘问题,而由于服务移动到云以获得可伸缩性及弹性,数据正以指数形式增长,因而挖掘问题已变得很有挑战性和非常重要。
[0003]201010544357.8专利文献公开了一种基于云计算的商业数据可控分发与融合应用系统,该系统由云计算服务资源集群即云提供端、用户终端即云请求端和虚拟云服务中心即中间件组成;云提供端通过虚拟云服务中心管理的设备机群提供相应的商业数据资源和应用能力服务;云请求端提出服务请求;虚拟云服务中心根据用户提交的任务请求,寻找符合用户需求的商业数据资源,并为云请求端提供按需服务;虚拟云服务中心根据商业数据发布/订阅服务属性获取分发路由,完成云集群服务器间的数据迀移。该系统实质上是对分布于多节点的云服务端的数据挖掘,即仅仅是对一个云服务端的数据挖掘,然而实际应用场景中一个系统通常使用多个云服务端,且各云服务端都是独立的,因此该系统无法协调各云服务端进行数据的分析与挖掘。
[0004]201010118572.1专利文献公开了一种具有隐私保护的用户模型构建方法,该方法包括:对用户使用Web信息服务的历史数据进行多级处理以形成具有多层次的用户模型,每层次的各个节点包含用户信息;对应用户模型的各个层次设置隐私参数;通过信息熵计算由所述隐私参数确定的用户信息进而获取用户隐私的暴露度。该方法仅适用于web的数据挖掘,虽然web可以分布在各个终端,但其云服务端仍然只有一个,与前述专利文献一样无法协调各独立的云服务端进行数据挖掘。
[0005]201010248470.1专利文献公开了一种基于多智能Agent框架结构的旅游多媒体信息个性化服务系统,该系统采用智能Agent技术,通过不断自主学习,发现和挖掘用户的兴趣,采用基于向量夹角的K-近邻算法实现自动用户兴趣建模。该专利文献揭示根据用户反馈和浏览特性更新其兴趣模型,其进行数据挖掘的对象很特定即非常局限,类似于单一的云服务端,不存在对多个相互独立的云服务端进行数据挖掘的技术前提,也就无法协调各云服务端进行数据挖掘。
[0006]200910086571.0专利文献公开了一种数据加密传输方法,在数据传输的双方均设置密钥空间和安全算法空间,并且分别为密钥空间、安全算法空间、安全算法设置更新条件。该方法仅仅揭示了数据在传输过程中的加密方法,而不涉及数据挖掘,更不存在多个相互独立的云服务端,也就不存在协调各云服务端进行数据挖掘。
[0007]基于上述,可知现有技术无法协调多个相互独立的云服务端的数据挖掘活动,对相关联的数据库的挖掘性能较低。

【发明内容】

[0008]基于此,本发明实施例提供一种端到端云服务系统及其数据挖掘方法,能够协调多个相互独立的云服务端的数据挖掘活动,提高对与端到端云服务系统相关联的数据库的挖掘和服务性能,使得数据挖掘不仅仅限于极个别的云而且适用于更多的甚至相互独立的云,可极大地提升挖掘的数据量和挖掘的质量,同时还可使得单个云获得独立挖掘所不能得到的数据挖掘服务。
[0009]本发明实施例采用的一个技术方案是:提供一种端到端云服务系统,该系统包括分布式设置的多个云服务端以及一个中央控制端,其中,多个云服务端分别设置或嵌入有数据挖掘代理程序,数据挖掘代理程序负责对与其所在的云服务端相关联的数据库进行数据挖掘,中央控制端设置或嵌入有中央数据挖掘程序,中央数据挖掘程序负责协调多个云服务端的数据挖掘代理程序的数据挖掘活动。
[0010]本发明实施例采用的另一个技术方案是:提供一种端到端云服务系统的数据挖掘方法,包括:将端到端云服务系统虚拟成分布式设置的多个云服务端以及一个中央控制端,其中,多个云服务端分别设置有数据挖掘代理程序或嵌入该数据代理挖掘程序,中央控制端设置或嵌入有中央数据挖掘程序;各云服务端的数据挖掘代理程序既可周期性地进行数据挖掘,又可响应中央控制端或云服务端的数据挖掘服务提出的服务请求进行数据挖掘,以获得一次挖掘结果;各云服务端的数据挖掘代理程序向中央控制端和数据挖掘服务中的至少一者发送一次挖掘结果。
[0011]通过上述技术方案,本发明实施例所产生的有益效果是:将端到端云服务数据挖掘虚拟并部署成一个中央控制端以及分布式设置的多个云服务端的挖掘代理,既可以直接对与各云服务端相关联的数据库进行数据挖掘,还可以通过中央控制端协调各个相互独立的云服务进行数据挖掘,从而提高对与端到端云服务相关联的数据库的挖掘功能和性能。
【附图说明】
[0012]图1是本发明一实施例的端到端云服务系统的架构图;
[0013]图2是基于图1所示端到端云服务系统进行数据挖掘的流程图;
[0014]图3是基于图1所示端到端云服务系统进行算法更新的流程图。
【具体实施方式】
[0015]下面结合附图和实施例对本发明的技术方案进行详细说明。
[0016]图1是本发明一实施例的端到端云服务系统的架构图。如图1所示,端到端云服务系统包括一个中央控制端和分布式设置的多个云服务端(即通常意义上的云,图中仅示出云服务端i,且i为正整数)。其中,每一云服务端均设置或嵌入有一个数据挖掘代理程序,即,对于云服务端i而言为数据挖掘代理程序i,该数据挖掘代理程序负责对与其所在的云服务端相关联的数据库进行数据挖掘,中央控制端设置或嵌入有一个中央数据挖掘程序,该中央数据挖掘程序负责协调各云服务端的数据挖掘代理程序的数据挖掘(Data mining)活动,以从大量的数据中通过数据挖掘算法搜索隐藏于数据库中的信息。基于此,可知本发明实施例的端到端云服务系统实质上是一种分布式及协调式相结合的云端架构。
[0017]与云服务端相关联的数据库即为MVDB-SR(Multimedia Virtual Database forService Record,多媒体虚拟数据库),且每一 MVDB-SR具有两个关键组件,即VFS (VirtualFile System,虚拟文件系统)和VDB (Virtual Database System,虚拟数据库系统)。其中,VFS存储例如图像、音频及视频等格式的多媒体文件,VDB存储表格等文本格式的数据链接,即,如果多媒体文件是数据链接的一部分,则表示多媒体文件存储于VFS中且其相关联的链接存储于VDB中。
[0018]每一云服务端通过平台API (Applicat1n Programming Interface,应用程序编程接口 )协调数据挖掘服务和数据挖掘代理程序,并通过数据挖掘代理程序对MVDB-SR进行数据挖掘。
[0019]中央控制端含中央数据挖掘程序、虚拟数据库管理程序(Virtual DatabaseAdministrator,VDBA或集中式VDBA),集中式VDBA与每一云服务端对应的MVDB-SR —起协调动态资源分配及性能优化。其中,集中式VDBA的客户端信息数据库用于管理每一个云服务端的MVDB-SR、监测每一MVDB-SR的数据,集中式VDBA的服务器信息数据库用于协调并记录所有云服务端的操作。
[0020]图2是基于图1所示端到端云服务系统进行数据挖掘的流程图。结合图1和图2所示,数据挖掘代理程序既可周期性地也可视需要从中央控制端或各云服务端进行数据挖掘,具体而目:
[0021]云客户端的N个云服务客户端作为用户且与多个云服务端对应,即云服务端i对应云服务客户端i。为服务云客户端i,某些应用将调用数据挖掘服务即DMSi (DataMining Services i)通过API向数据挖掘代理程序发出服务请求,数据挖掘代理程序响应该服务请求并进行数据挖掘,以获得一次挖掘结果。
[0022]数据挖掘代理程序还可以按需求向中央控制端发出服务请求,继而由中央控制端的操作界面调用中央数据挖掘程序将服务请求馈送至数据挖掘代理程序,数据挖掘代理程序再将结果反馈给DMSi。
[0023]数据挖掘代理程序还可以响应中央控制端的数据挖掘请求,以获得一次挖掘结果。进一步地,数据挖掘代理程序可以仅向中央控制端发送一次挖掘结果,当然也可以向中央控制端和数据挖掘服务中的任何一个发送一次挖掘结果。
[0024]又或者,各云服务端的数据挖掘代理程序根据设定周期性地在MVDB-SR中进行数据挖掘,以获得一次挖掘结果,例如,数据挖掘代理程序启动计时器并在计时器每次终止时进行一次数据挖据,该计时器可预先设定相邻两次终止的时间间隔。进一步地,数据挖
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1