一种云数据库集群管理方法和系统、电子设备及存储介质与流程

文档序号:37669584发布日期:2024-04-18 20:42阅读:14来源:国知局
一种云数据库集群管理方法和系统、电子设备及存储介质与流程

本发明涉及云数据库,尤其涉及一种云数据库集群管理方法和系统、电子设备及存储介质。


背景技术:

1、随着云计算技术的快速发展,云数据库作为云计算的重要组成部分,其性能和稳定性直接影响到整个云计算系统的运行。

2、相关技术中,往往采用单独的数据库实例构建云数据库,这一方式在面对大规模数据处理、高并发访问、以及数据库集群状态感知和统一管理方面仍有不足。


技术实现思路

1、本发明实施例提供了一种云数据库集群管理方法和系统、电子设备及存储介质,旨在提高集群的高可用性和自动化水平。

2、为实现上述目的,本技术实施例的第一方面提出了一种云数据库集群管理方法,所述方法包括:

3、响应于接收到的云数据库集群创建请求,创建多个数据库实例,并基于多个所述数据库实例进行集群组建,得到目标集群;其中,所述目标集群包括第一数量个节点;

4、获取第一状态数据和第二状态数据;其中,所述第一状态数据用于表征所述目标集群的集群状态,所述第二状态数据用于表征所述目标集群中第二数量个节点的节点状态,所述第二数量小于或者等于第一数量;

5、基于所述第一状态数据和所述第二状态数据对所述目标集群进行故障检测,确定所述目标集群中的目标故障节点;

6、对所述目标集群中的所述目标故障节点进行删除,以更新所述目标集群,得到更新后目标集群;

7、如果确定所述更新后目标集群的当前节点数量小于所述第一数量,则对所述更新后目标集群进行节点补全。

8、在一些实施例,所述对所述更新后目标集群进行节点补全,包括:

9、确定所述当前节点数量与所述第一数量的差值;

10、基于所述差值进行数据库实例创建,以生成新增节点,并基于所述新增节点对所述更新后目标集群进行节点补全。

11、在一些实施例,所述目标集群包括一个主节点和多个备用节点,所述对所述目标集群中的所述目标故障节点进行删除,包括:

12、若确定所述目标故障节点为所述主节点,则对所述目标故障节点进行删除,并在多个所述备用节点中选取出一个备用节点作为所述更新后目标集群的主节点,并将未选取的所述备用节点作为所述更新后目标集群的备用节点,以得到所述更新后目标集群;

13、若确定所述目标故障节点为所述备用节点,则对所述目标故障节点进行删除,并将所述目标集群的所述主节点确定为所述更新后目标集群的主节点,将未删除的多个所述备用节点确定为所述更新后目标集群的备用节点,以得到所述更新后目标集群。

14、在一些实施例,基于所述第一状态数据和所述第二状态数据对所述目标集群进行故障检测,确定所述目标集群中的目标故障节点,包括:

15、基于所述第一状态数据和所述第二状态数据对所述节点进行过滤,得到候选故障节点;

16、获取所述候选故障节点的持续故障时长;

17、若所述持续故障时长超过预设时长阈值,则将所述候选故障节点确定为所述目标故障节点。

18、在一些实施例,所述云数据库集群创建请求包括集群配置信息、数据库配置信息、虚拟私有云信息和安全组信息,所述响应于接收到的云数据库集群创建请求,创建多个数据库实例,包括:

19、对所述集群配置信息、所述数据库配置信息、所述虚拟私有云信息和所述安全组信息进行参数校验;

20、如果确定所述参数校验通过,则调用创建任务对虚拟机实例进行创建,得到虚拟机;

21、基于所述虚拟私有云信息和安全组信息,为所述虚拟机创建网络接口,并配置网络资源;

22、基于所述数据库配置信息生成数据库初始化配置,并将所述数据库初始化配置注入到所述虚拟机;

23、基于所述数据库初始化配置在所述虚拟机上进行数据库实例创建,得到多个所述数据库实例。

24、在一些实施例,所述基于多个数据库实例进行集群组建,得到目标集群,包括:

25、获取每一所述数据库实例的网络数据;

26、基于所述集群配置信息对多个所述数据库实例进行节点配置,并基于所述网络数据将多个已配置的数据库实例配置到预设集群中,得到所述目标集群。

27、在一些实施例,所述获取第一状态数据和第二状态数据,包括:

28、基于第一预设时间周期对所述目标集群进行第一状态获取,得到所述第一状态数据,并对所述第一状态数据进行存储;

29、基于第二预设时间周期对所述目标集群中的节点进行第二状态获取,得到所述第二状态数据,并对所述第二状态数据进行存储。

30、为实现上述目的,本技术实施例的第二方面提出了一种云数据库集群管理系统,所述系统包括:

31、集群组建模块,用于响应于接收到的云数据库集群创建请求,创建多个数据库实例,并基于多个所述数据库实例进行集群组建,得到目标集群;其中,所述目标集群包括第一数量个节点;

32、状态数据获取模块,用于获取第一状态数据和第二状态数据;其中,所述第一状态数据用于表征所述目标集群的集群状态,所述第二状态数据用于表征所述目标集群中第二数量个节点的节点状态,所述第二数量小于或者等于第一数量;

33、故障检测模块,用于基于所述第一状态数据和所述第二状态数据对所述目标集群进行故障检测,确定所述目标集群中的目标故障节点;

34、故障清理模块,用于对所述目标集群中的所述目标故障节点进行删除,以更新所述目标集群,得到更新后目标集群;

35、故障补全模块,用于如果确定所述更新后目标集群的当前节点数量小于所述第一数量,则对所述更新后目标集群进行节点补全。

36、为实现上述目的,本技术实施例的第三方面提出了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,所述处理器、通信接口和存储器通过通信总线完成相互间的通信,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。

37、为实现上述目的,本技术实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。

38、本技术提出的云数据库集群管理方法和系统、电子设备及存储介质,其通过响应于接收到的云数据库集群创建请求,创建多个数据库实例,并基于多个数据库实例进行集群组建,得到目标集群;其中,目标集群包括第一数量个节点,通过分布在集群中的节点上的数据和工作负载,实现负载均衡和容错能力;并且在节点发生故障时,集群中的其他节点仍可提供服务,提高了高可用性和容灾能力。进一步地,获取第一状态数据和第二状态数据;其中,第一状态数据用于表征目标集群的集群状态,第二状态数据用于表征目标集群中第二数量个节点的节点状态,第二数量小于或者等于第一数量;基于第一状态数据和第二状态数据对目标集群进行故障检测,确定目标集群中的目标故障节点;通过对集群和集群中的节点进行状态监测,能够及时感知和响应节点或集群的故障,并对故障进行快速定位,进一步提高了高可用性。进一步地,对目标集群中的目标故障节点进行删除,以更新目标集群,得到更新后目标集群;如果确定更新后目标集群的当前节点数量小于第一数量,则对更新后目标集群进行节点补全,通过对目标故障节点的清理和补全操作,维持了集群的规模和正常运行状态,减少了潜在的服务中断时间,提高了集群的高可用性和自动化水平。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1