一种用于双活数据中心的仲裁方法、装置及系统与流程

文档序号:35283457发布日期:2023-09-01 03:57阅读:15来源:国知局
一种用于双活数据中心的仲裁方法、装置及系统与流程

本技术涉及云计算,特别涉及一种用于双活数据中心的仲裁方法、装置及系统。


背景技术:

1、数据中心为软件应用提供资源,此类资源包括存储器、处理器、网络带宽等。出于灾备(disaster recovery)的目的,一般都会建设至少两个数据中心,该至少两个数据中心中的若干个数据中心承担用户的业务,其它的数据中心备份数据、配置、业务等。其中,双活数据中心是指两个数据中心同时承担业务且相互备份,以提高两个数据中心的整体服务能力和系统资源利用率。

2、双活数据中心中的两个数据中心之间会每隔设定时间向对方发送一个心跳包,若在设定时间内未接收到对方的心跳包,则备份中断。此时如果两个数据中心都继续承担业务,就会出现数据不一致的问题。仲裁(arbitrate,arb)机制是当前避免出现数据不一致问题的手段之一,仲裁机制的实现方式为:两个数据中心分别向独立于两个数据中心设置的仲裁设备发送仲裁请求,仲裁设备根据仲裁请求确定获胜的数据中心,获胜的数据中心继续提供服务(即承担业务),没有获胜的数据中心停止提供服务。

3、随着云计算、大数据的发展,越来越多的企业用户把应用、数据、系统进行集中处理,数据大集中的同时也面临风险。随着云资源的规模不断扩大,承载的业务不断增加,对可靠性要求越来越高,如何高效、可靠地进行仲裁,以保障高可靠性,仍为亟需解决的重要问题。


技术实现思路

1、本技术实施例提供了一种用于双活数据中心的仲裁方法、装置及系统,有助于在双活容灾场景中提供高效、可靠的仲裁机制。

2、第一方面,本技术实施例提供了一种用于双活数据中心的仲裁方法,该双活数据中心可以包括所述第一数据中心和所述第二数据中心,所述仲裁方法可由仲裁设备实现,该方法可以包括:当发生故障事件时,在所述第一数据中心中确定故障对象;当所述故障对象包括所述第一数据中心的主节点时,从多个备选节点中选择目标节点代替所述第一数据中心中的故障主节点提供服务,所述多个备选节点包括所述第一数据中心的备选节点和/或所述第二数据中心的备选节点;当所述故障对象不包括所述第一数据中心的主节点时,使所述第一数据中心继续提供服务。

3、通过上述方法,仲裁设备可以在发生故障事件时,利用备用节点代替故障节点提供服务,从而利用故障点转移的方式来保障业务连续性。

4、需要说明的是,本技术实施例中,故障对象可能的形态,可以包括但不限于是数据中心、数据中心中的节点、或者部署在数据中心的节点的组件。相应地,用于在发生故障事件时代替故障对象提供服务的备选对象,可以与故障对象的形态相同,包括但不限于是数据中心、数据中心中的节点、或者部署在数据中心的某个节点的组件。本技术实施例中,仲裁过程中可以根据涉及的具体故障对象的形态以及具体故障情形进行仲裁管理。

5、比如,从数据中心下的节点粒度而言,第一数据中心中可以包括关联同一服务的主节点和备节点,第二数据中心中可以包括关联同一服务的主节点和备节点,当发生故障事件时,仲裁方法可以是前文描述中,从多个备选节点中选择目标节点代替故障的主节点提供服务,所述多个备选节点包括所述第一数据中心的备选节点和/或所述第二数据中心的备选节点;当所述故障对象不包括所述第一数据中心的主节点时,则无需进行上述节点代替步骤。

6、再比如,从数据中心粒度而言,第一数据中心可以是关联同一服务的主数据中心,第二数据中心可以是备选数据中心,当发生故障事件时,仲裁方法可以包括:当所述故障对象包括所述第一数据中心时,以所述第二数据中心代替所述第一数据中心提供服务;当所述故障对象不包括所述第一数据中心时,使所述第一数据中心继续提供服务。相似地,该第二数据中心为主节点时,则可以在该第二数据中心发生故障事件时,以备选的该第一数据中心代替该第二数据中心提供服务。

7、又比如,从部署在节点的组件粒度而言,同一服务的处于主状态(比如激活状态)的组件以及处于备用状态的组件可以部署在相同或不同的节点(可以是相同数据中心的节点,也可以是不同数据中心的节点),当发生故障事件时,仲裁方法可以包括:基于组件粒度,当所述故障对象包括所述第一数据中心/第二数据中心的处于主状态的组件时,从该故障组件的多个备用组件中选择目标组件代替所述故障组件提供服务,该故障组件的多个备用组件可以包括第一数据中心的备用组件和/或第二数据中心的备用组件;当故障对象不包括处于主状态的组件时,使所述处于主状态的组件继续提供服务。

8、本技术实施例中,租户可以根据自身需要的应用场景或业务场景,自主选择和配置故障事件的检测粒度以及不同粒度下故障对象对应的仲裁机制,从而可以从不同的层面实施对双活数据中心的可靠、高效的管理,提升仲裁系统整体的可靠性。

9、结合第一方面,一种可选的实现方式中,所述当发生故障事件时,在所述第一数据中心中确定故障对象,包括:当发生所述故障事件时,在所述第一数据中心、所述第二数据中心和仲裁设备中确定所述故障对象。

10、结合第一方面,一种可选的实现方式中,所述多个备选节点中的每个备选节点满足以下至少一项条件:所述备选节点的数据同步率大于或等于第一阈值,其中,所述数据同步率用于表征所述备选节点与相应主节点之间的数据同步状态;或者,所述备选节点的负载小于或等于第二阈值。

11、结合第一方面,一种可选的实现方式中,所述备选节点的负载包括以下至少一项:中央处理器cpu负载、内存负载、磁盘读/写负载、网络延时或丢包率。

12、结合第一方面,一种可选的实现方式中,所述第一数据中心的备选节点的优先级高于所述第二数据中心的备选节点的优先级。

13、结合第一方面,一种可选的实现方式中,所述方法还包括:在无备选节点时,向租户发送第一告警信息,并使所述第一数据中心继续提供服务;当所述故障对象还包括所述仲裁设备时,向所述租户发送第二告警信息。

14、结合第一方面,一种可选的实现方式中,所述方法还包括:接收来自租户的用户设备ue的注册信息,所述注册信息用于指示待部署到所述第一数据中心和/或所述第二数据中心的组件;根据所述注册信息,在所述仲裁设备注册所述组件,并在所述第一数据中心的相应节点和/或所述第二数据中心的相应节点部署所述组件。

15、结合第一方面,一种可选的实现方式中,所述注册信息包括所述组件的以下至少一项信息:类型、服务名称、组件名称、父节点、关联的管理账户信息、关联的脚本信息、待部署节点的标识、通信地址、所属站点或所包括的组件的主-备状态。

16、结合第一方面,一种可选的实现方式中,所述方法还包括:接收来自客户端的监测数据,所述监测数据用于指示部署在所述客户端所属节点的组件是否发生所述故障事件。

17、结合第一方面,一种可选的实现方式中,所述方法还包括:接收来自租户的ue的查询请求,所述查询请求用于指示待查询的目标组件;根据所述查询请求向所述ue反馈所述目标组件的状态信息和/或监控指标数据,所述目标组件的状态信息和/或监控指标数据用于指示是否发生所述故障事件。

18、结合第一方面,一种可选的实现方式中,所述方法还包括:接收来自租户的ue的变更请求,所述变更请求用于指示对部署在所述第一数据中心和/或所述第二数据中心的目标组件的状态变更;根据所述变更请求,向客户端发送变更指令,所述变更指令用于指示对所述目标组件执行状态变更操作。

19、结合第一方面,一种可选的实现方式中,所述状态变更操作包括以下至少一项:启动、停止、倒换。

20、结合第一方面,一种可选的实现方式中,所述仲裁设备为云服务器。

21、第二方面,本技术实施例提供了一种用于双活数据中心的仲裁方法,该方法可由用户设备实现,该用户设备可以是用户侧的任何电子设备,包括但不限于智能手机、笔记本电脑、台式电脑等。方法可以包括:显示仲裁管理界面;通过所述仲裁管理界面,获取租户的注册信息,所述注册信息用于指示需要部署到第一数据中心和/或第二数据中心的组件;向仲裁设备发送所述注册信息。

22、结合第二方面,一种可选的实现方式中,所述注册信息包括所述组件的以下至少一项信息:类型、服务名称、组件名称、父节点、关联的管理账户信息、关联的脚本信息、待部署节点的标识、通信地址、所属站点或所包括的组件的主-备状态。

23、结合第二方面,一种可选的实现方式中,所述仲裁方法还包括:通过所述仲裁管理界面,获取所述租户的查询请求,所述查询请求用于指示待查询的目标组件;向所述仲裁设备发送所述查询请求;从所述仲裁设备接收响应于所述查询请求的状态信息和/或监控指标数据;显示所述状态信息和/或所述监控指标数据。

24、结合第二方面,一种可选的实现方式中,所述仲裁方法还包括:通过所述仲裁管理界面,获取所述租户的变更请求,所述变更请求用于指示对部署在所述第一数据中心和/或所述第二数据中心的目标组件的状态变更;向所述仲裁设备发送所述变更请求,以使所述仲裁设备对所述目标组件执行状态变更操作。

25、结合第二方面,一种可选的实现方式中,所述状态变更操作包括以下至少一项:启动、停止、倒换。

26、结合第二方面,一种可选的实现方式中,所述仲裁设备为云服务器。

27、第三方面,本技术实施例提供了一种用于双活数据中心的仲裁装置,所述双活数据中心包括所述第一数据中心和所述第二数据中心,所述仲裁装置包括:确定单元,用于当发生故障事件时,在所述第一数据中心中确定故障对象;仲裁单元,用于当所述故障对象包括所述第一数据中心的主节点时,从多个备选节点中选择目标节点代替所述第一数据中心中的主节点提供服务,其中,所述多个备选节点包括所述第一数据中心的备选节点和/或所述第二数据中心的备选节点;当所述故障对象不包括所述第一数据中心的主节点时,使所述第一数据中心继续提供服务。

28、结合第三方面,一种可选的实现方式中,所述确定单元用于:当发生所述故障事件时,在所述第一数据中心、所述第二数据中心和仲裁设备中确定所述故障对象。

29、结合第三方面,一种可选的实现方式中,所述多个备选节点中的每个备选节点满足以下至少一项条件:所述备选节点的数据同步率大于或等于第一阈值,其中,所述数据同步率用于表征所述备选节点与相应主节点之间的数据同步状态;或者,所述备选节点的负载小于或等于第二阈值。

30、结合第三方面,一种可选的实现方式中,所述备选节点的负载包括以下至少一项:中央处理器cpu负载、内存负载、磁盘读/写负载、网络延时或丢包率。

31、结合第三方面,一种可选的实现方式中,所述第一数据中心的备选节点的优先级高于所述第二数据中心的备选节点的优先级。

32、结合第三方面,一种可选的实现方式中,所述仲裁单元还用于:在当前无的备选节点时,向租户发送第一告警信息,所述第一数据中心继续提供服务;当所述故障对象还包括所述仲裁设备时,向所述租户发送第二告警信息。

33、结合第三方面,一种可选的实现方式中,所述装置还包括:通信单元,用于接收来自租户的用户设备ue的注册信息,所述注册信息用于指示待部署到所述第一数据中心和/或所述第二数据中心的组件;部署单元,用于根据所述注册信息,在所述仲裁设备注册所述组件,并在所述第一数据中心的相应节点和/或所述第二数据中心的相应节点部署所述组件。

34、结合第三方面,一种可选的实现方式中,所述注册信息包括所述组件的以下至少一项信息:类型、服务名称、组件名称、父节点、关联的管理账户信息、关联的脚本信息、待部署节点的标识、通信地址、所属站点或所包括的组件的主-备状态。

35、结合第三方面,一种可选的实现方式中,所述装置还包括:通信单元,用于接收来自客户端的监测数据,所述监测数据用于指示部署在所述客户端所属节点的组件是否发生所述故障事件。

36、结合第三方面,一种可选的实现方式中,所述仲裁单元用于:通过所述通信单元接收来自租户的ue的查询请求,所述查询请求用于指示待查询的目标组件;根据所述查询请求,通过所述通信单元向所述ue反馈所述目标组件的状态信息和/或监控指标数据,所述目标组件的状态信息和/或监控指标数据用于指示是否发生所述故障事件。

37、结合第三方面,一种可选的实现方式中,所述仲裁单元用于:通过通信单元接收来自租户的ue的变更请求,所述变更请求用于指示对部署在所述第一数据中心和/或所述第二数据中心的目标组件的状态变更;根据所述变更请求,通过通信单元向客户端发送变更指令,所述变更指令用于指示对所述目标组件执行状态变更操作。

38、结合第三方面,一种可选的实现方式中,所述状态变更操作包括以下至少一项:启动、停止、倒换。

39、结合第三方面,一种可选的实现方式中,所述仲裁设备为云服务器。

40、第四方面,本技术实施例提供了一种用于双活数据中心的仲裁装置,所述仲裁装置包括:

41、显示单元,用于显示仲裁管理界面;

42、获取单元,用于通过所述仲裁管理界面,获取租户的注册信息,所述注册信息用于指示需要部署到第一数据中心和/或第二数据中心的组件;

43、通信单元,用于向仲裁设备发送所述注册信息。

44、结合第四方面,一种可选的实现方式中,所述注册信息包括所述组件的以下至少一项信息:类型、服务名称、组件名称、父节点、关联的管理账户信息、关联的脚本信息、待部署节点的标识、通信地址、所属站点或所包括的组件的主-备状态。

45、结合第四方面,一种可选的实现方式中,所述获取单元还用于:通过所述仲裁管理界面,获取所述租户的查询请求,所述查询请求用于指示待查询的目标组件;所通信单元还用于向所述仲裁设备发送所述查询请求;从所述仲裁设备接收响应于所述查询请求的状态信息和/或监控指标数据;所述显示单元还用于显示所述状态信息和/或所述监控指标数据。

46、结合第四方面,一种可选的实现方式中,所述获取单元还用于:通过所述仲裁管理界面,获取所述租户的变更请求,所述变更请求用于指示对部署在所述第一数据中心和/或所述第二数据中心的目标组件的状态变更;所通信单元还用于向所述仲裁设备发送所述变更请求,以使所述仲裁设备对所述目标组件执行状态变更操作。

47、结合第四方面,一种可选的实现方式中,所述状态变更操作包括以下至少一项:启动、停止、倒换。

48、结合第四方面,一种可选的实现方式中,所述仲裁设备为云服务器。

49、第五方面,本技术实施例提供了一种用于双活数据中心的仲裁系统,所述仲裁系统包括仲裁设备和用户设备,所述仲裁设备用于实现如上述第一方面以及第一方面中任一可能设计所述的仲裁方法,所述用户设备用于实现上述第二方面以及第二方面中任一可能设计所述的仲裁方法。

50、第六方面,本技术实施例提供了一种计算机可读介质,用于存储计算机程序,该计算机程序包括用于执行上述第一方面以及第一方面中任一可能设计所述的仲裁方法的指令,或者执行上述第二方面以及第二方面中任一可能设计所述的仲裁方法的指令。

51、本技术在上述各方面提供的实现的基础上,还可以进行进一步组合以提供更多实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1