一种无中心的监控管理节点异地冗余方法_3

文档序号:9600701阅读:来源:国知局
待恢复状态,不间断尝试获取备份组信息。
[0063]例如主机服务器A发现备份服务器B故障,则获取备份组信息,启动切换备份流程,将服务器C切换为备份服务器。
[0064]本实施例冗余方法还包括步骤:冗余设备集合的主机服务器从故障状态或待恢复状态恢复,使用备份信息查询流程从参考设备集合中得到备份组信息,如果备份组信息为空则进行备份初始化流程;如备份组信息存在,根据备份组信息设置主机服务器和备份服务器的工作模式。
[0065]例如服务器A故障恢复,则使用备份信息查询流程从参考设备集合中得到备份组信息,如果备份组信息为空则进行备份初始化流程,成功后服务器A工作在主机模式,服务器B工作在备份服务器模式。如果有备份信息存在,则按照备份信息中的设置来工作。在服务器A恢复后,其对应的监控管理节点可以执行手动切换,将服务器A切换回本监控管理节点的主机服务器。
[0066]本实施例冗余方法还包括步骤:冗余设备集合的备份服务器从故障状态或待恢复状态恢复,使用备份信息查询流程从参考设备集合中得到备份组信息,如果备份组信息为空,则对主机服务器进行故障检测,如主机服务器故障,则按照备份服务器检测到主机服务器故障的处理流程处理,如备份组信息存在,根据备份组信息设置冗余设备集合中主机服务器和备份服务器的工作模式。
[0067]例如:服务器B故障恢复,则使用备份信息查询流程从参考设备集合中得到备份组信息。如果备份组信息为空,则对主机服务器进行故障检测,如主机服务器故障则服务器B工作在主机服务器模式;如主机服务器正常,则作为主机服务器的备份定时检测主机是否故障。如果备份组信息存在,根据备份组信息中的设置来工作。
[0068]本实施例冗余方法还包括步骤:参考设备集合的成员从故障状态恢复,使用备份信息查询流程得到备份组信息,保存到本地,用于后续被冗余设备集合查询。
[0069]图3示出了切换备份流程,包括:
[0070]2.1、主机服务器按照顺序从冗余设备集合取出工作正常的待选备份服务器作为新备份服务器,设置新备份组信息,主机服务器不变,原备份服务器切换成待选备份服务器。
[0071]2.2、使用备份信息切换流程把备份组信息更新到参考设备集合,备份信息更新成功则将取出的新备份服务器切换为备份服务器工作模式,若备份信息更新失败则认为主机服务器自身网络被隔离,进入待恢复状态,不间断尝试获取备份组信息。
[0072]图4示出了备份信息切换流程,在备份服务器检测到主机服务器故障,或主机服务器检测到备份服务器故障时,以及切换备份流程需要用到该流程,该流程步骤如下:
[0073]3.1、冗余设备集合的服务器生成新的发送序号N,向参考设备集合的所有成员发送携带冗余设备集合编号、初始时间、发送序号N的切换许可请求。
[0074]发送序号N生成规则为服务器A在冗余设备集合的序号+X*冗余设备集合的长度,X为正整数,按此规则生成大于本地保存的序号的最小值为新的发送序号。发送序号N生成规则保证冗余设备集合生成唯一性,避免冗余设备集合的不同服务器生成相同序号引起逻辑混乱。
[0075]如果是备份服务器检测到主机服务器故障时,则备份服务器来发送切换许可请求;如果是主机服务器检测到备份服务器故障时,则主机服务器来发送切换许可请求。
[0076]3.2、参考设备集合的成员接收到切换许可请求后,根据冗余设备集合编号查找本地保存备份组信息,找不到备份组信息则返回响应成功,找到备份组信息则进入下一步初始时间判断流程。
[0077]3.3、参考设备集合的成员的初始时间判断,判断切换许可请求的初始时间与本地保存的初始时间关系,切换许可请求的初始时间大于本地保存的初始时间则返回响应成功,切换许可请求的初始时间小于本地保存的初始时间则不响应该切换许可请求,等于则进入下一步发送序号判断流程。
[0078]3.4、参考设备集合的成员的发送序号判断,判断切换许可请求的发送序号与本地保存的发送序号关系,切换许可请求的发送序号大于等于本地保存的发送序号则返回响应成功,切换许可请求的发送序号小于本地保存的发送序号则不响应切换许可请求。
[0079]3.5、冗余设备集合的服务器接收参考设备集合中设备返回的响应,如果在规定的时间段内收到的响应超过设定的比例,认为发送切换许可请求成功,否则认为失败。
[0080]3.6、冗余设备集合的服务器向参考设备集合的所有成员发送设置备份组信息请求,携带备份组信息。备份组信息包含冗余设备集合编号,初始时间T,发送序号N,主机服务器,备份服务器。
[0081]3.7、参考设备集合的成员接收到设置备份组请求,返回响应并保存备份组信息到本地。
[0082]3.8、冗余设备集合的服务器在规定的时间段内收到的响应,如果超过设定的比例,则认为设置备份组成功,否则认为失败。
[0083]3.9、冗余设备集合的服务器保存备份组信息到本地磁盘。
[0084]图5示出了备份信息查询流程,在主机服务器检测到备份服务器故障、或主机服务器从故障状态或待恢复状态恢复、或备份服务器从故障状态或待恢复状态恢复、或参考设备集合的成员从故障状态恢复时,都需要使用备份信息查询流程,备份信息查询流程步骤如下:
[0085]4.1冗余设备集合的服务器向参考设备集合的所有成员发送备份信息查询消息,携带参数:冗余设备集合编号。
[0086]4.2参考设备集合的成员接收到备份信息查询消息后,根据冗余设备集合编号查找本地保存的备份组信息,找不到本地保存的备份组信息则返回响应成功并携带备份组信息为空,找到本地保存的备份组信息也响应成功并携带找到的备份组信息。
[0087]4.3冗余设备集合的服务器接收参考设备集合中设备返回的响应,如果在规定的时间段内收到的响应超过设定的比例,认为查询成功,否则认为失败。
[0088]4.4冗余设备集合的服务器,从收到的响应中取出初始时间最迟的成员,再从初始时间最迟的成员中取出发送序号最大的响应,从该响应得到备份组信息作为此次查询结果Ο
[0089]其中响应消息中包括备份组信息的初始时间、发送序号。
[0090]本实施例在监控管理节点分布在不同地点时,一个监控管理节点的冗余设备集合中的主机服务器位于本监控管理节点内,备份服务器和待选备份服务器位于其他监控管理节点内,可以实现分布在异地的监控管理节点之间的异地冗余,并且在多个监控管理节点之间实现几台备份服务器对多个主机服务器的备份,增加了冗余的可靠性,大大节省了设备成本的开支。
[0091]上述的对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
【主权项】
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1