一种集群容灾的方法、装置、设备及介质与流程

文档序号:37381451发布日期:2024-03-22 10:33阅读:13来源:国知局
一种集群容灾的方法、装置、设备及介质与流程

本发明涉及计算机领域,并且更具体地涉及一种集群容灾的方法、装置、设备及可读介质。


背景技术:

1、随着云计算及数字经济的发展,海量数据需要通过云计算平台保存至存储系统中,云计算平台及存储系统的容灾备份技术显得尤为重要。现有的云平台容灾备份技术,主要通过采用存储系统远程复制技术,将主卷和备卷组成主从复制关系,通过映射主卷和备卷至云平台,正常情况下对主卷进行读写,由主端集群向备端集群在存储系统内部发起数据同步操作,当主端集群发生故障切换时,需要对主卷解映射后,将备卷映射至云平台,可以保证业务的恢复。

2、上述方法对于使用rbd(rados block device,rados块设备是ceph分布式存储系统对外提供的一种可靠的、分布式的、高性能的块存储资源)协议方式的分布式块存储设备存在以下问题:

3、(1)云平台挂载并读写主端集群卷,由于主端集群对备端集群卷无访问权限,从而无法向备卷发起数据同步操作,因此现有方法不支持rbd设备的远程复制,存在无法对rbd设备容灾备份的兼容性问题;

4、(2)传统的定时周期同步,无论主卷和备卷的数据差异量有多少,当到达设定的同步周期时即执行一次数据同步,当未到达设定的同步周期时,如果业务数据量较大且主端集群故障,此时主卷和备卷数据差异量巨大,可能会使用户丢失更多的数据,降低了系统的可靠性,当多个复制卷在同时达到设定的同步周期时,每个复制卷都需要执行数据同步,占用更多的存储系统带宽资源,会对存储系统产生较大压力,降低系统的稳定性。


技术实现思路

1、有鉴于此,本发明实施例的目的在于提出一种集群容灾的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够解决现有技术无法对rbd设备容灾备份的兼容性问题,能够使得数据同步更智能可控,能够提高存储系统的可靠性和稳定性。

2、基于上述目的,本发明的实施例的一个方面提供了一种集群容灾的方法,包括以下步骤:

3、建立云平台与主端集群和备端集群的cephx(为识别用户并防止中间人攻击,ceph用cephx认证系统来认证用户和守护进程,使用cephx协议对客户端进行身份认证)认证关系;

4、经由云平台向主端集群和备端集群下发创建异步远程复制卷的请求,请求中包括主端集群和备端集群的预设信息;

5、经由云平台设定复制卷的数据同步方式和数据同步策略;

6、监测主端集群和备端集群的健康状态,并根据健康状态将业务切换到主端集群或备端集群。

7、根据本发明的一个实施例,建立云平台与主端集群和备端集群的cephx认证关系包括:

8、在云平台中将rbd客户端包中的lib库安装到云平台宿主机节点;

9、分别将主端集群和备端集群的认证用户keyring文件和ceph配置文件拷贝到云平台宿主机节点中;

10、配置访问主端集群和备端集群指定存储池的cephx认证信息,以实现云平台宿主机节点对主端集群和备端集群的指定存储池及存储资源具有完全访问权限。

11、根据本发明的一个实施例,主端集群和备端集群的预设信息为四元组参数信息,四元组参数信息包括主端集群名称、主端集群cephx用户名称、备端集群名称和备端集群cephx用户名称。

12、根据本发明的一个实施例,经由云平台向主端集群和备端集群下发创建异步远程复制卷的请求,请求中包括主端集群和备端集群的预设信息包括:

13、经由云平台调用lib库接口创建异步远程复制卷;

14、经由云平台向主端集群和备端集群下发创建异步远程复制卷的请求,并在请求中加入主端集群和备端集群的四元组参数信息;

15、分别在主端集群和备端集群创建与远程复制卷同名的卷,并配置主端集群和备端集群中的卷的异步远程复制关系;

16、分别将集群四元组参数信息标记至主端集群的卷和备端集群的卷中,主端集群的卷和备端集群的卷组成备份卷;

17、响应于备份卷创建完成,执行一次初始全量同步操作,并将后续数据同步的方式设定为增量同步方式;

18、响应于需要进行数据同步操作,主端集群读取主卷中标记的备端集群信息并获取备端集群的访问权限;

19、主端集群读取主卷中标记的备端集群的认证信息,并使用访问备端集群的认证信息打开备端集群的备份卷进行数据同步。

20、根据本发明的一个实施例,经由云平台设定复制卷的数据同步方式和数据同步策略包括:

21、经由云平台调用lib库接口设定备份卷的数据同步方式为定量同步,并设定周期同步的差异数据量为预设值,并计算数据同步需要的耗时作为数据同步周期;

22、获取集群提供给数据备份的总带宽和数据同步已占用带宽,数据同步周期为:预设值/(总带宽-已占用带宽);

23、云平台基于使用状态动态调整数据同步周期和数据同步速率。

24、根据本发明的一个实施例,监测主端集群和备端集群的健康状态,并根据健康状态将业务切换到主端集群或备端集群包括:

25、云平台每经过阈值时间通过心跳监测主端集群和备端集群的健康状态;

26、响应于监测到主端集群故障,云平台将主端集群的主卷卸载,并将复制卷状态置为备端集群为主卷,并将业务切换备端集群。

27、根据本发明的一个实施例,监测主端集群和备端集群的健康状态,并根据健康状态将业务切换到主端集群或备端集群包括:

28、响应于监测到主端集群故障恢复,执行数据的同步操作以将备端集群的主卷数据同步到主端集群的备份卷中;

29、响应于数据同步完成,将业务切换至主端集群。

30、本发明的实施例的另一个方面,还提供了一种集群容灾的装置,装置包括:

31、建立模块,建立模块配置为建立云平台与主端集群和备端集群的cephx认证关系;

32、创建模块,创建模块配置为经由云平台向主端集群和备端集群下发创建异步远程复制卷的请求,请求中包括主端集群和备端集群的预设信息;

33、设定模块,设定模块配置为经由云平台设定复制卷的数据同步方式和数据同步策略;

34、监测模块,监测模块配置为监测主端集群和备端集群的健康状态,并根据健康状态将业务切换到主端集群或备端集群。

35、本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:

36、至少一个处理器;以及

37、存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。

38、本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。

39、本发明具有以下有益技术效果:本发明实施例提供的集群容灾的方法,通过建立云平台与主端集群和备端集群的cephx认证关系;经由云平台向主端集群和备端集群下发创建异步远程复制卷的请求,请求中包括主端集群和备端集群的预设信息;经由云平台设定复制卷的数据同步方式和数据同步策略;监测主端集群和备端集群的健康状态,并根据健康状态将业务切换到主端集群或备端集群的技术方案,能够解决现有技术无法对rbd设备容灾备份的兼容性问题,能够使得数据同步更智能可控,能够提高存储系统的可靠性和稳定性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1