云计算平台的管理方法和装置与流程

文档序号:14847635发布日期:2018-06-30 16:55阅读:469来源:国知局
云计算平台的管理方法和装置与流程

本公开涉及互联网应用技术领域,特别涉及云计算平台的管理方法和装置。



背景技术:

随着互联网应用技术的发展,云计算平台发挥着越来越重要。云计算平台提供商即需要快速部署云计算平台,也需要便捷的管理云计算平台。

现有技术中,通过安装在单台服务器上的配置软件部署和管理云计算平台,并通过第三方服务器对该配置软件进行备份。

在一个具体的应用场景中,将Fuel配置软件安装在单台服务器上,通过Fuel配置软件部署和管理Openstack云计算平台。当Fuel配置软件完成对云计算平台的部署后,将Fuel配置软件复制到第三方服务器进行备份保存。一旦运行Fuel配置软件的服务器故障,将导致外部网络和云计算平台的通信连接中断,使得云计算平台提供的云服务在一段时间内不可用。如果需要恢复到之前的云计算平台部署状态,需要读取第三方服务器上存储的的Fuel配置软件备份,重新对云计算平台的进行部署。由于恢复云计算平台原来的部署状态耗费时间较长,导致云计算平台提供的云服务会中断较长时间。



技术实现要素:

为了解决相关技术中存在的恢复云计算平台原来的部署状态耗时较长的技术问题,本公开提供了一种云计算平台的管理方法方法及装置。

一种云计算平台的管理方法,包括第一服务器集群和第二服务器集群,所述第一服务器集群包括主服务器和备用服务器,所述第二服务器集群包括多个数据库服务器,所述方法包括:

监听所述第一服务器集群中的所述主服务器,并由所述主服务器接收外部网络的访问请求;

当监听到的所述主服务器故障时,启用所述第一服务器集群中的备用服务器以代替所述主服务器;

响应外部网络的所述访问请求,将接收到的所述访问请求逐一下发到所述第二服务器集群的各数据库服务器。

在一个具体的实施例中,所述监听所述第一服务器集群中的所述主服务器,包括:

向所述第一服务器集群中的所述主服务器发送心跳检测指令;

根据在预先设定的切换时间内未能接收所述主服务器发出的应答指令,判定所述主服务器故障状态。

在一个具体的实施例中,所述更新所述虚拟IP地址和所述第一服务器集群的服务器绑定,包括:

获取由虚拟路由冗余协议配置的所述主服务器和备用服务器各自的优先权等级;

根据所述优先权等级,更新所述虚拟IP地址和所述第一服务器集群的服务器绑定;

通过所述更新启用所述第一服务器集群中的备用服务器以代替所述主服务器定。

在一个具体的实施例中,所述响应外部网络的所述访问请求,将接收的所述访问请求逐一下发到所述第二服务器集群的各数据库服务器之前,所述方法还包括:

向所述第二服务器集群中的各数据库服务器发送状态同步指令;

根据所述状态同步指令,对所述数据库服务器存储的配置数据进行同步更新。

在一个具体的实施例中,所述响应外部网络的所述访问请求,将接收的所述访问请求逐一下发到所述第二服务器集群的各数据库服务器,包括:

获取所述第二服务器集群中各数据库服务器的IP地址;

根据获取的所述IP地址,将接收的所述访问请求逐一下发到所述数据库服务器。

在一个具体的实施例中,所述响应外部网络的所述访问请求,将接收的所述访问请求逐一下发到所述第二服务器集群的各数据库服务器之后,包括:

获取所述数据库服务器存储的所述配置数据,并根据获取的所述配置数据配置所述云计算平台。

一种云计算平台的管理装置,包括第一服务器集群和第二服务器集群,所述第一服务器集群包括主服务器和备用服务器,所述第二服务器集群包括多个数据库服务器,其特征在于,所述装置包括:

监听模块,用于监听所述第一服务器集群中的所述主服务器,并由所述主服务器接收外部网络的访问请求;

更新模块,用于当监听到的所述主服务器故障时,启用所述第一服务器集群中的备用服务器以代替所述主服务器;

响应模块,用于响应外部网络的所述访问请求,将接收到的所述访问请求逐一下发到所述第二服务器集群的各数据库服务器。

在一个具体的实施例中,所述监听模块还包括:

检测指令发送单元,用于向所述第一服务器集群中的所述主服务器发送心跳检测指令;

判断单元,用于根据在预先设定的切换时间内未能接收所述主服务器发出的响应指令,判定所述主服务器故障。

在一个具体的实施例中,所述更新模块还包括:

获取单元,获取由虚拟路由冗余协议配置的所述主服务器和备用服务器各自的优先权等级;

更新单元,用于根据获取的所述优先权等级,更新所述虚拟IP地址和所述第一服务器集群的服务器绑定;

启用单元,用于通过所述更新启用所述第一服务器集群中的备用服务器以代替所述主服务器。

在一个具体的实施例中,所述装置还包括:

IP地址获取单元,用于获取所述第二服务器集群中各数据库服务器的IP地址;

下发单元,用于根据获取的所述IP地址,将接收的所述访问请求逐一下发到所述数据库服务器在一个具体的实施例中,所述装置还包括:

同步指令发送模块,用于向所述第二服务器集群中的各数据库服务器发送状态同步指令;

同步模块,用于根据所述状态同步指令,对所述数据库服务器存储的配置数据进行同步更新。

本公开的实施例提供的技术方案可以包括以下有益效果:通过监听第一服务器集群中的主服务器,并由主服务器接收外部网络的访问请求。当监听到的主服务器故障时,启用第一服务器集群中的备用服务器以代替主服务器。响应外部网络的访问请求,将接收到的访问请求逐一下发到第二服务器集群的各数据库服务器。当管理云计算平台的主服务器故障时,立即启用备用服务器代替故障的主服务器,快速恢复到云计算平台原来的部署状态,以使得云计算平台提供的云服务不会由于主服务器故障而中断。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。

图1是一示例性实施例示出的云计算平台的管理方法的流程图。

图2是图1对应实施例示出的方法中步骤110的一种具体实现流程图。

图3是图1对应实施例示出的方法中步骤130的一种具体实现流程图。

图4是另一示例性实施例示出的云计算平台的管理方法的流程图。

图5是图1对应实施例示出的方法中步骤150的一种具体实现流程图。

图6是另一示例性实施例示出的云计算平台的管理方法的示意图。

图7是一示例性实施例示出的云计算平台的管理装置的框图。

图8是根据图6对应实施例的装置中的监听模块610在一个实施例的框图。

图9是根据图6对应实施例的装置中的更新模块630在一个实施例的框图。

图10是另一示例性实施例示出的云计算平台的管理装置的框图。

具体实施方式

这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

云计算平台,是指通过互联网提供的基于互联网相关服务的虚拟化资源平台。例如,以数据存储为主的存储型云平台,以数据处理为主的计算型云平台以及计算和数据存储处理兼顾的综合云计算平台。

其中,部署和管理云计算平台,包括对云计算平台的节点拓扑结构设置、存储磁盘空间分配、各节点网络设置以及计算资源分配进行部署和管理。

图1是一示例性实施例示出的云计算平台的管理方法的流程图。如图1所示,该方法包括以下步骤:

在步骤110中,监听第一服务器集群中的主服务器,并由主服务器接收外部网络的访问请求。

通过第一服务器集群中的主服务器和外部网络进行通信,由主服务器提供部署和管理云计算平台的UI界面。客户端通过访问该UI界面对云计算平台进行配置和管理。

在一个具体的实施例中,主服务器通过虚拟的IP地址和外部网络进行通信,接收外部网络的访问请求。第一服务器集群中仅有一台主服务器通过绑定唯一的虚拟IP地址,负责第一服务器集群的路由工作。外部网络通过该唯一的虚拟IP地址访问第一服务器集群。

其中,虚拟IP地址是指通过协议软件实现服务器集群的路由功能,由具有虚拟路由冗余功能的协议软件将一个IP地址动态分配给服务器集群中的服务器,该IP地址不需要和物理网关关联,但能实现服务器集群的路由功能。

在一个具体的实施例中,通过向第一服务器集群中的主服务器持续的发送ICMP(Internet Control Message Protocol,网络控制消息协议)数据包,如果主服务器能够响应该数据包并返回有效的IP地址,则主服务器处于工作正常状态。如果主服务器不能返回有效的IP地址,即可判定主服务器故障。

ICMP是TCP/IP协议族的子协议,用于在主机和路由器之间传递控制消息。ICMP数据包在Linux系统和Windows系统中可以通过Ping程序实现。

在另一个具体的实施例中,通过监听主服务器的TCP端口状态来判断该主服务器是否处于故障状态。例如,如果监听到主服务器浏览网页服务默认的80端口没有启动,即可判断主服务器处于故障状态。

在步骤130中,当监听到的主服务器故障时,启用第一服务器集群中的备用服务器以代替主服务器。

当主服务器接收外部网络的访问请求时,通过对主服务器进行持续的监听,一旦发现主服务器故障,即在非常短的时间内启动第一服务器集群中的备用服务器以替代该主服务器,使得外部网络与服务器集群之间的通信不会因主服务器出现故障而中断。

在一个具体的实施例中,第一服务器集群配置虚拟路由冗余协议后,通过ping程序定时探测第一服务器集群中的主服务器,如果主服务器坏掉,第一服务器集群会通过优先权等级选举策略选出一个新的主服务器,继续向外部网络提供数据服务,以使得第一服务器集群与外部网络进行通信不会被中断。

当管理云计算平台的主服务器故障时,立即启用备用服务器代替故障的主服务器,立即启用备用服务器代替故障的主服务器,快速恢复到原来的云计算平台部署状态。

在步骤150中,响应外部网络的访问请求,将接收到的访问请求逐一下发到第二服务器集群的各数据库服务器。

其中,外部网络的访问请求,是指终端用户通过手机APP或者终端设备向云计算平台发送的访问请求。通过第一服务器集群中的主服务器接收外部网络的访问请求,并将接收到不同的访问请求均匀分配到各数据库服务器。

具体的,当多个客户端集中于同一时间段向云计算平台发送访问请求,主服务器将接收的访问请求逐个下发给不同的数据库服务器,由不同的数据库服务器分别处理各个访问请求。通过不同的数据库服务器对客户端的各访问请求分别处理,提高了整个系统响应和处理外部网络的访问请求的能力。

更进一步,第一服务器集群中的主服务器听过轮询的访问向第二服务器集群中的各数据库服务器发送轮询指令。如果一个数据库服务器在设定的时间间隔内没有向应答,则判定数据库服务器发生故障,并将该数据库服务器剔除。

图2是图1对应实施例示出的方法中步骤110的一种具体实现流程图。图2所示,该步骤110还包括以下步骤:

在步骤111中,向第一服务器集群中的主服务器发送心跳检测指令。

通过备用服务器或者独立于第一服务器集群的外部服务器不间断的发送心跳检测指令给主服务器,当备用服务器或者独立于服务器集群的外部服务器在设定的时间间隔内没有收到该询问指令的应答指令,即可判定主服务器故障。

心跳检测指令,是指备用服务器或者独立于第一服务器集群的其它服务器

为了探测主服务器是否处于正常工作状态而向主服务器发送的探测指令。当主服务器处于故障状态,可能造成外部网络的访问请求不可以达到第一服务器集群。

在步骤113中,通过在预先设定的切换时间内未能接收主服务器发出的应答指令,判定主服务器故障。

通过监听第一服务器集群中的主服务器,通过在预先设定的切换时间内未能获得主服务器发出的应答指令,判定主服务器处于故障状态。

在一个具体的实施例中,心跳检测指令可以通过安装于备用服务器之上的Keepalived软件发送的数据报文来实现。其中,Keepalived软件是一个基于虚拟路由冗余协议而实现收发虚拟路由冗余报文的软件。

具体的,分别在主服务器和备用服务器上安装基于虚拟路由冗余协议的Keepalived软件。通过虚拟路由冗余协议配置第一服务器集群。主服务器和备用服务器之间利用Keepalived软件发送虚拟路由冗余协议报文进行通信,通过Keepalived软件提供的检测函数监听第一服务器集群中的主服务器的运行状态是否正常。

更进一步,通过安装于备用服务器上Keepalived软件或者安装在独立于服务器集群的外部服务器的Keepalived软件,不间断的发送心跳检测指令给安装于主数据库服务器的Keepalived软件。当安装于备用服务器上Keepalived软件或者安装在独立于服务器集群的外部服务器的Keepalived软件在设定的时间间隔内没有收到该心跳检测指令的应答指令,即可判定主服务器处于故障状态。

图3是图1对应实施例示出的方法中步骤130的一种具体实现流程图。如图3示,步骤130还包括以下步骤:

在步骤131中,获取由虚拟路由冗余协议配置的主服务器和备用服务器各自的优先权等级。

优先权等级,是指在配置了虚拟路由冗余协议的第一服务器集群中有多台服务器,但是这些服务器并不能同时工作,而是由一台主服务器同虚拟IP地址绑定而负责路由工作。第一服务器集群就通过这个虚拟IP地址来与其它网络进行通信。优先权等级最高的服务器成为主服务器并和虚拟IP地址进行绑定。优先权等级的配置原则可以依据链路的速度和成本、路由器性能和可靠性以及其它管理策略设定。

虚拟路由冗余协议,是指一种选择协议,它可以把一个虚拟IP地址动态分配给第一服务器集群中的一台服务器。绑定虚拟IP地址的服务器称为主服务器。

当主服务器故障时,重新确定服务器集群中的所有服务器的优先权等级,并获取由虚拟路由冗余协议配置后的服务器集群中的全部服务器各自的的优选权等级。

在步骤133中,根据获取的优先权等级,更新虚拟IP地址和第一服务器集群的服务器绑定。

将故障的主服务器的优先权等级设置优先权等级最低值,则备用服务器的优先权等级高于故障的主服务器的优先权等级,启动更新虚拟IP地址和第一服务器集群的服务器绑定。按照新确定的优先权等级,更新虚拟IP地址和服务器集群中的服务器绑定,以使备用服务器代替主服务器。

更进一步,更新虚拟IP地址和服务器集群中的服务器绑定,需要在代替主服务器的备份服务器上设置虚拟IP地址的同时,将该虚拟IP地址和原来的主服务器绑定解除。

在一个具体的实施例中,通过分别在主服务器和备用服务器上安装Keepalived软件为服务器集配置群虚拟冗余协议。主服务器和备用服务器之间通过基于虚拟路由冗余协议的Keepalived软件进行通信。当主服务器故障,通过Keepalived软件赋予备用服务器高于原来主服务器的优先权等级,该备用服务器便会剥夺当前低优先权等级的主服务器而成为新的主服务器并和服务器集群的虚拟IP地址进行绑定。

具体的,Keepalived软件将故障的主服务器的优先权等级设置为最低优先权等级。则备份服务器的优先权等级大于处于故障状态的主服务器的优选权登记,第一服务器集群将虚拟IP地址和备份服务器进行绑定,并将原来的主服务器和虚拟IP地址解除绑定。

在步骤135中,通过更新启用第一服务器集群中的备用服务器以代替主服务器

通过更新虚拟IP地址和第一服务器集群的服务器绑定,将第一服务器集群中的备用服务器配置为新的主服务器,并解除原来的主服务器和虚拟IP地址的绑定。避免了服务器集群中同时出现两个绑定虚拟IP地址的主服务器,确保外部网络访问服务器集群的请求可以达到服务器集群。

可见,通过虚拟IP地址和所述第一服务器集群的服务器绑定,能够及时启动第一服务器集群中的备用服务器以代替主服务器,使得外部网络访问请求能够及时达到第一服务器集群。

图4是另一示例性实施例示出的云计算平台的管理方法的流程图。如图4示,所述方法包括以下步骤:

在步骤1501中,向第二服务器集群中的各数据库服务器发送状态同步指令;

通过向第二服务器集群中的各数据库服务器发送发送状态指令,以使得第二服务器集群中的全部数据库服务器存储的内容保存一致。

状态同步指令,是指将第二服务器集群中的全部数据库服务器设置为数据库服务器数据同步状态的指令。

数据同步状态,是指第二服务器集群中的全部数据库服务器存储的内容保存一致的状态。通过向服务器集群发送服务器状态同步指令,将第二服务器集群设置数据库服务器同步状态,以使得第二服务器集群中的全部数据库服务器存储的内容保存一致。

在步骤1503中,根据状态同步指令,对数据库服务器存储的配置数据进行同步更新。

配置数据,是指的是管理和部署云计算平台所需要的全部数据。包括云计算平台磁盘与网络配置、各种节点的角色等。配置数据负责整个云计算平台部署过程中各项配置任务的编排。该配置数据同时也包括了云计算平台UI界面的底层数据。例如,云计算平台部署和管理工具Fuel配置软件的配置数据是核心运作模块nailgun。

在一个具体的实施例中,通过检测第二服务器集群中的全部数据库服务器中存储的配置数据内容变化,当任何一台数据库服务器有内容更新,则其余数据库服务器立刻复制该更新的内容。

图5是图1对应实施例示出的方法中步骤150的一种具体实现流程图。如图5所示,所述方法包括:

在步骤151中,获取第二服务器集群中各数据库服务器的IP地址。

在一个具体的实施例中,通过将第二服务器集群中主服务器设置为各数据库服务器反向代理服务器。通过设置为反向代理服务器的主服务器解析来自第二服务器集群中各数据库服务器的报文数据,获取该数据库服务器IP地址。

反向代理服务器,是指以代理服务器来接受外部网络的访问请求,然后将访问请求转发给内部网络的数据库服务器,并将从数据库服务器上得到的结果返回给外部网络。

在步骤153中,根据IP地址,将接收的访问请求逐一下发到数据库服务器。

当客户端终端集中于某个时间段发送访问请求,主服务器将接收的访问请求尽可能均匀的分摊到不同的数据库服务器。由全部的数据库服务器分别处理各个访问请求。其中,主服务器根据第二服务器集群中各数据库服务器的IP地址区分不同的数据库服务器,将不同的访问请求逐一下发到数据库服务器。将客户端的访问请求均分到不同数据库服务器进行处理,尽可能及时响应的对每个客户端访问请求。

在一个具体的实施例中,外部网络的客户端通过虚拟IP地址访问云计算平台。当来自客户端的访问请求到达主服务器时,主服务器将访问请求进行数据包装和转发,得到经过转化的访问请求的数据报文。并根据数据库服务器IP地址设定数据报文的目标IP地址。按照目标IP地址将数据报文下达到对应的数据库服务器。主服务通过有限状态机记录每台数据库服务器接收数据报文的情况,以使得该时间段的访问请求能均匀的分摊到不同的数据库服务器。

在另一示例性实施例示出的云计算平台的管理方法,所述方法还包括获取数据库服务器存储的配置数据,并根据获取的配置数据配置云计算平台。

具体的,根据获取的配置数据部署和管理云计算平台,对云计算平台的节点拓扑结构设置、存储磁盘空间分配、各节点网络设置以及计算资源分配进行部署和管理。

图6是另一示例性实施例示出的云计算平台的管理方法的示意图。

如图6所示,第一服务器集群包括包括主服务器2010和备用服务器2030。第二服务器集群3010包括3个数据库服务器,即MySQL数据库服务器1、MySQL数据库服务器2、MySQL数据库服务器3。部署的云计算平台为Openstack云计算平台4010。

其中,第一服务器集群中的主服务器和备用服务器安装haproxy负载均衡软件和Keepalive虚拟路由冗余协议部署工具软件。通过监听第一服务器集群中的主服务器2010,并由主服务器通过绑定的虚拟IP地址接收外部网络的访问请求。当监听到的主服务器故障时,更新虚拟IP地址和第一服务器集群的服务器绑定,通过更新启用第一服务器集群中的备用服务器2030以代替主服务器2010。响应外部网络的访问请求,将接收到的访问请求逐一下发到第二服务器集群的3个数据库服务器,即MySQL数据库服务器1、MySQL数据库服务器2、MySQL数据库服务器3。

图7是一示例性实施例示出的云计算平台的管理装置的框图。如图/所示,该装置包括但不限于:监听模块610,更新模块630,响应模块650。

监听模块610,用于监听第一服务器集群中的所述主服务器,并由主服务器通过绑定的虚拟IP地址接收外部网络的访问请求;

更新模块630,用于当监听到的主服务器故障时,启用所述第一服务器集群中的备用服务器以代替所述主服务器;

响应模块650,用于响应外部网络的访问请求,将接收到的访问请求逐一下发到第二服务器集群的各数据库服务器。

图8是根据图7对应实施例的装置中的监听装置在一个实施例的框图。如图7所示,该装置还包括:包括但不限于:检测指令发送单元613,判定单元615。

检测指令发送单元613,用于向第一服务器集群中的主服务器发送心跳检测指令;

判定单元615,用于根据在预先设定的切换时间内未能接收主服务器发出的响应指令,判定主服务器故障。

图9是根据图/对应实施例的装置中的更新模块在一个实施例的框图。如图8所示,所述更新模块包括但不限于:获取单元631,更新单元633,启用单元635。

获取单元631,获取由虚拟路由冗余协议配置的所述主服务器和备用服务器各自的优先权等级;

更新单元633,用于根据获取的所述优先权等级,更新所述虚拟IP地址和所述第一服务器集群的服务器绑定;

启用单元635,用于通过所述更新启用所述第一服务器集群中的备用服务器以代替所述主服务器。

图10是根据图7对应实施例的装置在另一个实施例的框图。如图10所示,该装置还包括:同步指令发送模块670,同步模块690。

同步指令发送模块670,用于向第二服务器集群中的各数据库服务器发送状态同步指令;

同步模块690,用于根据状态同步指令,对数据库服务器存储的配置数据进行同步更新。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1