基于云计算平台保持主机资源稳定的方法

文档序号:7861906阅读:214来源:国知局
专利名称:基于云计算平台保持主机资源稳定的方法
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种基于云计算平台保持主机资源稳定的方法。
背景技术
云计算(Cloud Computing)是网格计算(Grid Computing)、分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(UtilityComputing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统。云计算的一个核心理念就是通过不断提高“云”的处理能力,进而减少用户终端的处理负担,最终使用户终端简化成一个单纯的输入输出设备,并能按需享受“云”的强大计算处理能力。云计算的重 要特点之一就是对用户端的设备要求最低,使用起来也最方便。主机是云平台的一个节点,是组成云平台的最小的实体单位,主机上主要用来开启虚拟机。同类型主机可组成一个集群。集群是指将一组计算机关联起来,使它们在外界从很多方面看起来如同一台计算机。集群内的计算机之间通常通过局域网连接,通常用来改善性能和可用性。虚拟化指对计算资源进行抽象的一个广义概念。虚拟化对上层应用或用户隐藏了计算资源的底层属性。它既包括使单个的资源(比如一个服务器,一个操作系统,一个应用程序,一个存储设备)划分成多个虚拟资源,也包括将多个资源(比如存储设备或服务器)整合成一个虚拟资源。虚拟化技术是指实现虚拟化的具体的技术性手段和方法的集合性概念。主机是云计算平台中的基础部分,主要向云计算平台提供资源。当集群出现错误时,主机与云控制器的连接被中断,对云计算平台来说,有部分资源无法被利用,现有的解决方法是在云平台中清除错误集群下的主机记录,将主机重新注册到另外一个集群。但是,现有的解决方法存在以下的不足在现有云计算平台的基础上,主机不能重复注册,如果已经注册的主机因为集群丢失而无法使用时,需要将主机重新注册到另外一个集群上,必须先修改云计算平台的数据,即需要清空掉云计算平台关于主机的记录,主机才能重新注册到另外一个集群上。这样,由于需要人为修改云计算平台的数据,可能会导致数据修改错误;另外,由于修改过程繁琐,导致主机资源在一段时间无法使用。

发明内容
本发明实施例提出一种基于云计算平台保持主机资源稳定的方法,能够减少因集群出错而造成的资源丢失和数据丢失,减少处理的步骤和时间,降低因此给用户带来的影响。本发明实施例提供一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;B、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群。
优选的,还包括步骤E :当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群。实施本发明实施例,具有如下有益效果本发明基于云计算平台保持主机资源稳定的方法,通过将主机注册到主要集群的时候还同时注册到一个备要集群,使备要集群在主要集群发生异常时候能够变为所述主机的当前主要集群以代替所述主要集群以接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的一段时间集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用备要集群相比使用特定集群(云平台中因集群所在主机不能正常通信导致云控制器无法管理该集群下的正常主机,而特定集群用于找回这些主机;当损坏主机修复后,特定集群会自动归还集群的这部分主机)来接管损坏集群下的主机资源,不需要配备一台专门的机器,适合规模小一点的云计算平台;特定集群在相对大一点的平台中应单独一台设备来接受丢失主机,相对反应速度较快,但是需要额外配备一台专门的机器(作为特定集群)。另外,使用备要集群接管损坏集群下的主机资源同时通知管理员修复异常集群,若异常集群能修复,将所述异常集群变为所述主机的当前备要集群;若不能修复,则通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群,防止因集群出错而造成的资源丢失和数据丢失,降低因此给用户带来影响。


图I是本发明所提供的基于云计算平台保持主机资源稳定的方法的流程图。图2是图I所示基于云计算平台保持主机资源稳定的方法的具体流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请参照图1,本发明提供了一种基于云计算平台保持主机资源稳定的方法,所述方法包括
步骤S101、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;步骤S102、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;步骤S103、所述云计算平台通知管理员对所述异常集群进行修复;步骤S104、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群;步骤S105、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群。 下面,结合图2,对本发明的基于云计算平台保持主机资源稳定的方法进行详细描述,包括步骤Sll :主机向集群a提出正式注册请求;步骤S12 :注册成功后,集群a向主机返回注册成功消息;步骤S13 :将主机注册记录发送给云计算平台;以上步骤为现有技术中主机注册到集群上的通用技术,在此不详细描述。步骤S14 :主机向集群a提出正式注册请求的同时向集群b提出注册备要集群请求;具体的,在主机正式注册的同时,同时在云计算平台利用数据库做个链接,使主机与备要集群b保持一个联系;主要集群a平时正常使用,备要集群b其他时间可作为另一个主机的主要集群,只有在该主机的主要集群a发生故障时代替主要集群a发挥作用。步骤S15 :注册成功后,集群b向主机返回注册成功消息;步骤S16 :将主机注册记录发送给云计算平台;步骤S17 :当主要集群a发生异常情况时,云计算平台监控到与集群a的通讯中断;步骤S18 :等待一段时间后云计算平台再次向集群a发送命令,若仍无回答,则判断集群a以及集群a下的主机状态丢失,且云计算平台无法利用所述状态丢失的主机的资源;步骤S19 :接着,所述云计算平台从数据库中查找所述主机的备要集群b时,若发现所述备要集群b的状态为正在运行,则发送命令至所述备要集群b,以使备要集群b和丢失的主机通信;步骤S20 :集群b与状态丢失的主机连接成功后变为所述主机的当前主要集群以接管所述主机,所述云计算平台通过所述集群b重新获取状态丢失的主机的资源,并将所述主机的状态更改为正在进行;步骤S21 :同时,所述云计算平台通知管理员对所述异常集群a进行修复(图中没显示);步骤S22 :当集群a修复成功,将修复成功结果通知云计算平台;步骤S23 :所述云计算平台将所述集群a变为所述主机的当前备要集群;
步骤S24 :但是,若所述集群a修复失败,将修复失败结果通知云计算平台;步骤S25 :所述云计算平台选择一新集群C,并与所述新集群c通信,若能正常获取所述新集群c的信息则判定所述新集群c是正常的;步骤S26 :所述云计算平台将所述集群a的状态丢失主机与所述新集群c建立链接,以使所述新集群c替换所述集群a且变为所述状态丢失主机的当前备要集群,并对应修改云计算平台的数据库中的数据。综上所述,本发明基于云计算平台保持主机资源稳定的方法,通过将主机注册到主要集群的时候还同时注册到一个备要集群,使备要集群在主要集群发生异常时候能够变为所述主机的当前主要集群以代替所述主要集群以接管损坏集群下的主机资源,不会让资源丢失,同时防止因集群损坏带来的集群及集群下主机资源无法使用;另外,相比于现有方法中清除错误集群下的主机记录以将主机重新注册到另外一个集群的繁琐过程简单很多;且使用备要集群相比使用特定集群(云平台中因集群所在主机不能正常通信导致云控制器 无法管理该集群下的正常主机,而特定集群用于找回这些主机;当损坏主机修复后,特定集群会自动归还集群的这部分主机)来接管损坏集群下的主机资源,不需要配备一台专门的机器,适合规模小一点的云计算平台;特定集群在相对大一点的平台中应单独一台设备来接受丢失主机,相对反应速度较快,但是需要额外配备一台专门的机器(作为特定集群)。另夕卜,使用备要集群接管损坏集群下的主机资源同时通知管理员修复异常集群,若异常集群能修复,将所述异常集群变为所述主机的当前备要集群;若不能修复,则通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群,防止因集群出错而造成的资源丢失和数据丢失,降低因此给用户带来影响。以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
权利要求
1.一种基于云计算平台保持主机资源稳定的方法,其特征在于包括步骤 A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源; B、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源; C、所述云计算平台通知管理员对所述异常集群进行修复; D、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群。
2.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,还包括步骤 E、当所述异常集群修复失败,所述云计算平台通知一新集群替换所述异常集群,替换成功后,所述新集群变为所述主机的当前备要集群。
3.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤A中,当云计算平台发现与异常集群通讯中断时,再次向所述异常集群发送命令,如无应答才判断所述异常集群及注册到所述异常集群下的主机状态丢失。
4.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,在所述步骤B中,所述云计算平台从数据库中查找所述主机的备要集群时,若发现所述备要集群的状态为正在运行,则发送命令至所述备要集群,以使备要集群和丢失的主机通信,通信成功后则变为所述主机的当前主要集群以接管所述主机,并将主机状态变为正在运行。
5.如权利要求2所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述云计算平台通知一新集群替换所述异常集群具体包括步骤 E1、所述云计算平台选择一新集群,并与所述新集群通信,若能正常获取所述新集群的信息则判定所述新集群是正常的; E2、所述云计算平台将所述异常集群的状态丢失主机与所送新集群重新建立链接,以使所送新集群替换所述异常集群且变为所述状态丢失主机的当前备要集群,并对应修改云计算平台的数据库中的数据。
6.如权利要求I所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述主机同时注册到主要集群和备要集群,是所述主机正式注册到主要集群的同时,在云计算平台利用数据库做链接,使所述主机与备要集群保持联系。
7.如权利要求6所述的基于云计算平台保持主机资源稳定的方法,其特征在于,所述备要集群在所述主要集群发生故障而变为所述主机的当前主要集群以代替所述主要集群发挥作用前,所述备要集群可作为另一个主机的主要集群。
全文摘要
本发明公开了一种基于云计算平台保持主机资源稳定的方法,包括步骤A、当云计算平台监控到与异常集群通讯中断时,判断所述异常集群及注册到所述异常集群下且以所述异常集群作为主要集群的主机状态丢失,且云计算平台无法利用所述主机的资源;B、所述云计算平台从数据库中查找所述主机注册主要集群时同时注册的备要集群,将所述备要集群变为所述主机的当前主要集群,并通过所述当前主要集群与所述主机进行通信,以重新获取所述主机的资源;C、所述云计算平台通知管理员对所述异常集群进行修复;D、当所述异常集群修复成功,所述云计算平台将所述异常集群变为所述主机的当前备要集群。
文档编号H04L12/24GK102882970SQ20121037165
公开日2013年1月16日 申请日期2012年9月28日 优先权日2012年9月28日
发明者邓书芬, 吴海玲, 吴文青, 陈浩, 庹海波 申请人:广州杰赛科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1