一种基于服务器集群的高可用方法及其装置与流程

文档序号:11406899阅读:164来源:国知局
一种基于服务器集群的高可用方法及其装置与流程

本发明涉及集群高可用技术领域,特别是涉及一种基于服务器集群的高可用方法及其装置。



背景技术:

随着云计算技术的不断发展,越来越多的云平台方案得到应用以及推广。实际上,云平台就像人们平时所消费水、电等一样的消费模式,一般用户按照实际的需求定制资源,使用终端设备通过网络连接,以便获取计算资源、存储资源以及网络资源等,这些资源全部来自于云平台,也就是服务器集群。

为整合计算、存储、网络等资源,以便提供给用户更好的服务,目前云平台方案的底层技术使用虚拟化技术,为保障用户应用系统持续运行,则需提高集群的高可用性,为用户应用系统提高可用保护。

目前的高可用方式是通过集群整体的监控模块周期性的监控整个集群的状态,其中虚拟机的状态是其中的一个部分,这种监控方式由于监控模块需要监控的内容过多,使得不仅对虚拟机的监测实时性不够,且即使发现了虚拟机宕机,其上报也不够及时,实时性差。并且,目前虚拟机宕机后,其上报方式多为报警,之后由工作人员进行人为处理,解决宕机的效率低,且过程复杂,高可用性差。

因此,如何提供一种实时性和高可用性好的基于服务器集群的高可用方法及其装置是本领域技术人员目前需要解决的问题。



技术实现要素:

本发明的目的是提供一种基于服务器集群的高可用方法及其装置,提高了集群内虚拟机监测和上报的实时性,且监测到宕机服务器后,能够自主进行高可用保护,减少了人工干预,解决宕机的效率高,高可用性好。

为解决上述技术问题,本发明提供了一种基于服务器集群的高可用方法,包括:

采用虚拟机监测工具实时监测集群内各个服务器节点上运行的虚拟机的状态;

若出现虚拟机宕机,记录宕机虚拟机的信息;

按照所述宕机虚拟机的信息以及预设调度策略从所述集群内选择用于接收所述宕机虚拟机的目标服务器;

按照所述宕机虚拟机的信息以及预设集群策略,从所述目标服务器上为所述宕机虚拟机分配相应的资源;

资源分配完成后,将所述宕机虚拟机迁移至所述目标服务器内运行。

优选地,所述虚拟机监测工具具体为choose工具。

优选地,所述资源包括计算资源、存储资源、网络资源。

优选地,所述按照所述宕机虚拟机的信息以及预设调度策略从所述集群内选择用于接收所述宕机虚拟机的目标服务器的过程具体包括:

依据所述宕机虚拟机的信息确定所述宕机虚拟机所需的资源;

从所述集群内筛选能够提供所述宕机虚拟机所需的资源的部分服务器;

依据所述宕机虚拟机的信息从此次筛选出部分服务器中选择系统配置支持所述宕机虚拟机运行的若干个服务器;

若此次筛选出的服务器有多个,则按照特定选取规则从中选取其中一个作为所述目标服务器;若此次筛选出的服务器仅有一个,则将该服务器作为所述目标服务器;

若未能筛选出满足上述条件的服务器,则发送告警信息至告警系统。

优选地,所述按照所述宕机虚拟机的信息以及预设调度策略从所述集群内选择用于接收所述宕机虚拟机的目标服务器的过程还包括:

当同时出现多个宕机虚拟机时,依据所述预设调度策略,分别为各个所述宕机虚拟机选择不同的目标服务器。

为解决上述技术问题,本发明还提供了一种基于服务器集群的高可用装置,包括:

虚拟机监测工具,用于实时监测集群内各个服务器节点上运行的虚拟机的状态;

记录模块,用于若出现虚拟机宕机,记录宕机虚拟机的信息;

服务器调度模块,用于按照所述宕机虚拟机的信息以及预设调度策略从所述集群内选择用于接收所述宕机虚拟机的目标服务器;

资源调度模块,用于按照所述宕机虚拟机的信息以及预设集群策略,从所述目标服务器上为所述宕机虚拟机分配相应的资源;

迁移处理模块,用于资源分配完成后,将所述宕机虚拟机迁移至所述目标服务器内运行。

优选地,所述虚拟机监测工具具体为choose工具。

优选地,所述服务器调度模块具体包括:

第一筛选单元,用于依据所述宕机虚拟机的信息确定所述宕机虚拟机所需的资源;从所述集群内筛选能够提供所述宕机虚拟机所需的资源的部分服务器;

第二筛选单元,用于依据所述宕机虚拟机的信息从第一次筛选出部分服务器中选择系统配置支持所述宕机虚拟机运行的若干个服务器;

第三筛选单元,用于若第二次筛选出的服务器有多个,则按照特定选取规则从中选取其中一个作为所述目标服务器;若第二次筛选出的服务器仅有一个,则将该服务器作为所述目标服务器;若未能筛选出满足上述条件的服务器,则发送告警信息至告警系统。

优选地,所述服务器调度模块还包括:

多宕机筛选单元,用于当同时出现多个宕机虚拟机时,依据所述预设调度策略,分别为各个所述宕机虚拟机选择不同的目标服务器。

本发明提供了一种基于服务器集群的高可用方法及其装置,采用专用的虚拟机监测工具实时监测各个服务器节点上的虚拟机状态,一旦出现虚拟机宕机,即记录宕机虚拟机的信息并上报,之后及时依据记录的信息和预设策略,将宕机虚拟机迁移至合适的目标服务器上运行。可见,本发明将虚拟机的监测同集群整体的状态监测中分离出来,提高了虚拟机监测和上报的实时性;并且,在发生虚拟机宕机后,能够直接依据预设策略为其分配合适的目标服务器并进行迁移,保证系统的持续运行,减少了人工干预,解决宕机的效率高,且过程简单,高可用性好。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的一种基于服务器集群的高可用方法的过程的流程图;

图2为本发明提供的一种基于服务器集群的高可用装置的结构示意图。

具体实施方式

本发明的核心是提供一种基于服务器集群的高可用方法及其装置,提高了集群内虚拟机监测和上报的实时性,且监测到宕机服务器后,能够自主进行高可用保护,减少了人工干预,解决宕机的效率高,高可用性好。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供了一种基于服务器集群的高可用方法,包括:

步骤s1:采用虚拟机监测工具实时监测集群内各个服务器节点上运行的虚拟机的状态;

步骤s2:若出现虚拟机宕机,记录宕机虚拟机的信息;

步骤s3:按照宕机虚拟机的信息以及预设调度策略从集群内选择用于接收宕机虚拟机的目标服务器;

步骤s4:按照宕机虚拟机的信息以及预设集群策略,从目标服务器上为宕机虚拟机分配相应的资源;

其中,这里的资源包括计算资源、存储资源、网络资源。

可以理解的是,为了使宕机虚拟机在迁移至目标服务器后可以正常工作,需要保证宕机虚拟机能够使用目标服务器的资源,且这些资源需要足够保证宕机服务器的使用需求。当然,这些资源还可包括其他资源,本发明对此不作限定。

步骤s5:资源分配完成后,将宕机虚拟机迁移至目标服务器内运行。

需要注意的是,将虚拟机迁移后,需要重启目标服务器,才能令在虚拟机能够使用分配的资源。

其中,虚拟机监测工具优选为choose工具。

可以理解的是,choose工具能够实现实时检测虚拟机状态,并具有在虚拟机宕机后主动上报的机制,提高了虚拟机宕机后的响应速度。

在一种优选实施例中,步骤s3的过程具体包括:

依据宕机虚拟机的信息确定宕机虚拟机所需的资源;

从集群内筛选能够提供宕机虚拟机所需的资源的部分服务器;

依据宕机虚拟机的信息从此次筛选出部分服务器中选择系统配置支持宕机虚拟机运行的若干个服务器;

若此次筛选出的服务器有多个,则按照特定选取规则从中选取其中一个作为目标服务器;若此次筛选出的服务器仅有一个,则将该服务器作为目标服务器;

若未能筛选出满足上述条件的服务器,则发送告警信息至告警系统。

可以理解的是,若服务器上资源不足,不能够满足的宕机虚拟机的需求,则即使宕机虚拟机迁移至该服务器上也不能正常工作,另外,由于不同服务器的配置不同,虚拟机的需求也不同,为了保证虚拟机的正常运行,目标服务器的配置需要满足宕机虚拟机的需求。

另外,以上仅为优选方案,实际使用时,除了以上两部分筛选还可以进行其他筛选操作,例如,由于每个服务器上虚拟机的个数是有限的,因此对于那些设置虚拟机的个数已经达到预设值的服务器,则可进行排除。当然,还可以设置其他筛选条件,本发明对此不作具体限定。

进一步可知,这里的特定选取规则可以为随机选取或者选择各个目标服务器的可用资源最多的服务器,或者采用其他规则,本发明对此不作限定。

在另一种优选实施例中,步骤s3的过程还包括:

当同时出现多个宕机虚拟机时,依据预设调度策略,分别为各个宕机虚拟机选择不同的目标服务器。

可以理解的是,分别为各个宕机虚拟机选择不同的目标服务器进行并发迁移能够提高虚拟机的迁移速度,但是在目标服务器个数不够的情况下,也可以为需求相近的虚拟机选择相同的目标服务器,宕机虚拟机与目标服务器之间的配对关系根据实际情况而定,本发明对此不作限定。

本发明提供了一种基于服务器集群的高可用方法,采用专用的虚拟机监测工具实时监测各个服务器节点上的虚拟机状态,一旦出现虚拟机宕机,即记录宕机虚拟机的信息并上报,之后及时依据记录的信息和预设策略,将宕机虚拟机迁移至合适的目标服务器上运行。可见,本发明将虚拟机的监测同集群整体的状态监测中分离出来,提高了虚拟机监测和上报的实时性;并且,在发生虚拟机宕机后,能够直接依据预设策略为其分配合适的目标服务器并进行迁移,保证系统的持续运行,减少了人工干预,解决宕机的效率高,且过程简单,高可用性好。

本发明还提供了一种基于服务器集群的高可用装置,参见图2所示,图2为本发明提供的一种基于服务器集群的高可用装置的结构示意图。该装置包括:

虚拟机监测工具1,用于实时监测集群内各个服务器节点上运行的虚拟机的状态;

记录模块2,用于若出现虚拟机宕机,记录宕机虚拟机的信息;

服务器调度模块3,用于按照宕机虚拟机的信息以及预设调度策略从集群内选择用于接收宕机虚拟机的目标服务器;

资源调度模块4,用于按照宕机虚拟机的信息以及预设集群策略,从目标服务器上为宕机虚拟机分配相应的资源;

迁移处理模块5,用于资源分配完成后,将宕机虚拟机迁移至目标服务器内运行。

其中,虚拟机监测工具1具体为choose工具。

在一种优选实施例中,服务器调度模块3具体包括:

第一筛选单元,用于依据宕机虚拟机的信息确定宕机虚拟机所需的资源;从集群内筛选能够提供宕机虚拟机所需的资源的部分服务器;

第二筛选单元,用于依据宕机虚拟机的信息从第一次筛选出部分服务器中选择系统配置支持宕机虚拟机运行的若干个服务器;

第三筛选单元,用于若第二次筛选出的服务器有多个,则按照特定选取规则从中选取其中一个作为目标服务器;若第二次筛选出的服务器仅有一个,则将该服务器作为目标服务器;若未能筛选出满足上述条件的服务器,则发送告警信息至告警系统。

作为优选地,服务器调度模块3还包括:

多宕机筛选单元,用于当同时出现多个宕机虚拟机时,依据预设调度策略,分别为各个宕机虚拟机选择不同的目标服务器。

本发明提供了一种基于服务器集群的高可用装置,采用专用的虚拟机监测工具实时监测各个服务器节点上的虚拟机状态,一旦出现虚拟机宕机,即记录宕机虚拟机的信息并上报,之后及时依据记录的信息和预设策略,将宕机虚拟机迁移至合适的目标服务器上运行。可见,本发明将虚拟机的监测同集群整体的状态监测中分离出来,提高了虚拟机监测和上报的实时性;并且,在发生虚拟机宕机后,能够直接依据预设策略为其分配合适的目标服务器并进行迁移,保证系统的持续运行,减少了人工干预,解决宕机的效率高,且过程简单,高可用性好。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1