一种云平台虚拟机高可用系统的制作方法

文档序号:36390433发布日期:2023-12-15 08:21阅读:23来源:国知局
一种云平台虚拟机高可用系统的制作方法

本发明属于云计算,更具体地,涉及一种云平台虚拟机高可用系统。


背景技术:

1、目前,云计算作为一种新兴技术,引起了继个人计算机、互联网技术后的第三次信息化技术浪潮。云计算是对包括cpu、内存、硬盘和网络等计算资源的池化,以便通过多租户形式共享给多个消费者,消费者使用云终端设备接入网络并使用云端的计算资源。消费者将本地计算机服务迁移至云端时,考虑最多的就是服务的可用性,其次才是性能。因此,如何保证云平台虚拟机的高可用尤为重要。

2、openstack架构是目前使用最为广泛的开源云操作系统,由七个基本组件和数十个可选组件构成,每个组件对外提供若干个restful api服务,组件之间的通信就是通过调用对方的restful api服务。openstack中通过将服务分为无状态服务和有状态服务,对于无状态服务的高可用,只需要在多个节点中都部署该服务,然后使用类似haproxy的负载均衡软件来转发请求即可达到高可用。对于有状态的服务,可采用a/a(主/主)或a/p(主/从)方式来搭建高可用。

3、a/a方式也叫做主/主模式,一般是原生实现的方式,也就是说同时有多个相同的服务在运行,当某个节点上的服务不能提供服务时,其它节点的该服务可以替代它进行服务,从而达到高可用。a/p方式也叫作主/从模式,需要通过第三方软件比如pacemaker来对备份服务进行激活等管理操作,也就是说有一个服务作为主服务在运行,另一个服务作为备份,并未运行,当主服务不能提供服务时,备份服务就会被激活并替代主服务继续提供服务。

4、现有openstack架构下虚拟机高可用方案实现上,主要有以下缺点:(1)通常考虑对外业务的虚拟机高可用,未充分考虑云平台管理虚拟机的高可用;(2)通过节点间心跳来确定计算节点的状态,计算节点状态监控和虚拟机状态监控网络未分离,方法并不可靠;(3)集群内虚拟机迁移未考虑业务特点与底层服务器性能的结合,未充分考虑资源性能的合理利用,会出现计算资源浪费或不能很好满足业务性能需求的情况。


技术实现思路

1、针对现有技术的以上缺陷或改进需求,本发明提供了一种云平台虚拟机高可用系统,其目的在于解决云平台中虚拟机可用性、可靠性以及资源利用率不足的技术问题。

2、为实现上述目的,本发明提供了一种云平台虚拟机高可用系统,所述系统中包括采用网络分离方式搭建的管理网络和生产网络;所述管理网络中部署有计算节点监控服务器和虚拟机监控服务器,所述生产网络中采用分布式存储构架部署云平台底层计算节点,虚拟机安装在所述云平台底层计算节点中;

3、所述计算节点监控服务器用于监控云平台底层计算节点状态;所述虚拟机监控服务器用于监控虚拟机状态,并在发现故障虚拟机后根据量化的可用性选择云平台底层计算节点进行故障虚拟机的迁移。

4、优选的,所述虚拟机监控服务器用于监控虚拟机的心跳状态,当发现虚拟机的心跳状态异常,则控制心跳状态异常的虚拟机进行重启,若重启失败,则根据云平台底层计算节点的可用性能和故障虚拟机业务所需资源进行匹配,选择合适的云平台底层计算节点进行故障虚拟机的迁移。

5、优选的,当发现故障虚拟机后,采用keepalived技术将故障虚拟机的ip资源和服务迁移到所选择云平台底层计算节点中的虚拟机上。

6、优选的,所述虚拟机监控服务器用于根据各云平台底层计算节点硬件网络的利用率量化各云平台底层计算节点的可用性能,利用率越高,可用性能越低。

7、优选的,故障虚拟机业务所需资源越高,匹配的云平台底层计算节点硬件网络可用性能越高。

8、优选的,所述可用性能包括cpu可用性能、网络可用性能、内存可用性能以及硬盘可用性能。

9、优选的,云平台底层计算节点的可用性能和故障虚拟机业务所需资源进行匹配时,匹配的优先级为:cpu可用性能>网络可用性能>内存可用性能>硬盘可用性能。

10、优选的,所述计算节点监控服务器和虚拟机监控服务器采用双机热备方式部署。

11、优选的,所述计算节点监控服务器和虚拟机监控服务器部署在管理网中,采用vlan技术进行隔离。

12、优选的,所述云平台底层计算节点部署在生产网中,不同云平台底层计算节点采用vlan技术进行隔离。

13、总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:

14、(1)本发明系统中,安装了虚拟机的云平台底层计算节点采用分布式存储构架部署,由此利用分布式构架提高云平台虚拟机的容错能力、故障转移能力及冗余备份能力,还通过分布式构架的共享存储技术,实现云平台虚拟机的热备,使得虚拟机的虚拟磁盘文件可以同时被多个物理主机访问,从而实现了虚拟机在不同物理主机之间的迁移和故障转移;同时采用keepalived技术,使用虚拟机监控服务器监控虚拟机状态,当发现故障虚拟机时,将虚拟ip地址迁移到另一台正常工作的虚拟机上,以确保业务的连续性,进一步提高了虚拟机的可用性;

15、(2)本发明系统中,采用网络分离的方式搭建管理网络和生产网络,由部署在管理网络中的计算节点监控服务器和虚拟机监控服务器共同完成系统的监控任务;部署在生产网络中的底层计算节点中安装虚拟机,由虚拟机完成系统的业务任务;由此将监控任务和业务任务在网络上隔离,提高监控任务和业务任务的可靠性,同时避免了云平台虚拟机由于监控错误导致无效迁移造成的系统性能损失;

16、(3)本发明系统中,若发现故障虚拟机,则对所有云平台底层计算节点的cpu、硬盘、内存和网络可用性能进行量化,若有云平台底层计算节点的可用性能匹配故障虚拟机业务所需资源,则选择该云平台底层计算节点进行故障虚拟机的迁移,由此在实现虚拟机高可用的同时提升系统的底层计算节点资源的利用率。



技术特征:

1.一种云平台虚拟机高可用系统,其特征在于,所述系统中包括采用网络分离方式搭建的管理网络和生产网络;所述管理网络中部署有计算节点监控服务器和虚拟机监控服务器,所述生产网络中采用分布式存储构架部署云平台底层计算节点,虚拟机安装在所述云平台底层计算节点中;

2.根据权利要求1所述的系统,其特征在于,所述虚拟机监控服务器用于监控虚拟机的心跳状态,当发现虚拟机的心跳状态异常,则控制心跳状态异常的虚拟机进行重启,若重启失败,则根据云平台底层计算节点的可用性能和故障虚拟机业务所需资源进行匹配,选择合适的云平台底层计算节点进行故障虚拟机的迁移。

3.根据权利要求2所述的系统,其特征在于,当发现故障虚拟机后,采用keepalived技术将故障虚拟机的ip资源和服务迁移到所选择云平台底层计算节点中的虚拟机上。

4.根据权利要求2所述的系统,其特征在于,所述虚拟机监控服务器用于根据各云平台底层计算节点硬件网络的利用率量化各云平台底层计算节点的可用性能,利用率越高,可用性能越低。

5.根据权利要求2所述的系统,其特征在于,故障虚拟机业务所需资源越高,匹配的云平台底层计算节点硬件网络可用性能越高。

6.根据权利要求3所述的系统,其特征在于,所述可用性能包括cpu可用性能、网络可用性能、内存可用性能以及硬盘可用性能。

7.根据权利要求6所述的系统,其特征在于,云平台底层计算节点的可用性能和故障虚拟机业务所需资源进行匹配时,匹配的优先级为:cpu可用性能>网络可用性能>内存可用性能>硬盘可用性能。

8.根据权利要求1所述的系统,其特征在于,所述计算节点监控服务器和虚拟机监控服务器采用双机热备方式部署。

9.根据权利要求1所述的系统,其特征在于,所述计算节点监控服务器和虚拟机监控服务器部署在管理网中,采用vlan技术进行隔离。

10.根据权利要求1所述的系统,其特征在于,所述云平台底层计算节点部署在生产网中,不同云平台底层计算节点采用vlan技术进行隔离。


技术总结
本发明公开了一种云平台虚拟机高可用系统,属于云计算技术领域。本发明中将云平台虚拟机部署在分布式存储架构中,由此利用分布式构架提高云平台虚拟机的容错能力、故障转移能力及冗余备份能力;本发明系统还采用Keepalived技术,使用虚拟机监控服务器监控虚拟机状态,当发现故障虚拟机时,将虚拟IP地址迁移到另一台正常虚拟机上,以确保业务的连续性,进一步提高了虚拟机的可用性;同时,则根据云平台底层计算节点的可用性能和故障虚拟机业务所需资源进行匹配,选择合适的云平台底层计算节点进行故障虚拟机的迁移;由此提高本系统的资源利用率。

技术研发人员:陆彦琦,代诗强,何龙,徐新羽,孙畅
受保护的技术使用者:中国船舶集团有限公司第七〇九研究所
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1