一种堆叠系统故障处理方法、设备及堆叠系统的制作方法

文档序号:9790829阅读:965来源:国知局
一种堆叠系统故障处理方法、设备及堆叠系统的制作方法
【技术领域】
[0001]本发明涉及通信技术领域,尤其涉及一种堆叠系统故障处理方法、设备及堆叠系统。
【背景技术】
[0002]在网络连接中,为了保持网络的稳定性与可靠性,通常都使用一些备份连接,以提高网络的健壮性,这里的备份连接被称为冗余链路.但是冗余链路也会使网络存在环路,使网络资源消耗增加,甚至造成网络中断。针对上述问题,现有技术提出了一种堆叠技术,能够在提高网络的健壮性的同时,降低网络资源消耗并简化网络设计。堆叠技术是通过堆叠链路连接将多台网络设备如交换机连接在一起组成堆叠系统(Stacking System,SS),以便在有限的空间内提供尽可能多的端口。具体的,通过堆叠技术形成的堆叠系统常常由多台配置相同的设备通过堆叠链路连接而成,对外呈现为一台虚拟的较大型的设备。堆叠系统中的这些网络设备统称为堆叠系统的成员设备,参与堆叠的成员设备中,其中一台设备为主控设备(Master),其他设备都为从属设备(Slave)。其中主控设备处于激活状态(Active),充当管理者和控制者的角色,其配置生效;而从属设备则处于备用状态(Standby),其配置不生效。
[0003]但是,堆叠系统通常会出现一系列的异常情况,虽然现有技术中针对堆叠系统分裂、堆叠系统合并等情况存在相应的检测与自动恢复对策,但针对出上述情况以外的其他堆叠系统异常,则无相应的自动恢复措施。例如在堆叠系统中,堆叠成员设备之间通过堆叠线路传递报文,当因堆叠线路自身原因导致报文丢失时,需要针对报文具体类型而进行不同的异常恢复处理,处理过程复杂;又如在堆叠系统中,堆叠成员设备之间通过堆叠线路传递报文,在堆叠系统由多个堆叠成员组成的情况下,会存在部分堆叠线路的数据流量负载过重,而部分堆叠线路的数据流量负载较轻的情况,由于堆叠系统内成员设备之间的转发路径是提前确定的,所以不能实时感知变化并进行流量的负载调节。在上述情况中,成员设备均自行处理相关的异常并进行故障恢复,或者需要用户感知相关异常或故障后进行人为干预,才能使堆叠系统恢复正常,从而使堆叠系统占用资源较多,降低了堆叠系统的效率,并使堆叠系统稳定性变差。

【发明内容】

[0004]本发明的实施例提供的一种堆叠系统故障处理方法、设备及堆叠系统,能够提高堆叠系统故障处理的效率,减少堆叠系统中进行故障处理所消耗资源,保证堆叠系统的容错性及稳定性。
[0005]为达到上述目的,本发明的实施例采用如下技术方案:
[0006]第一方面,本发明实施例提供了一种堆叠系统故障处理方法,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括一个主控设备,包括:主控设备检测堆叠系统中是否有成员设备为故障设备;若堆叠系统中有成员设备为故障设备,主控设备向堆叠系统中所有成员设备发送故障处理信息,以便于堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
[0007]在第一方面的第一种可能的实现方式中,该方法还包括:主控设备获取堆叠系统中成员设备的设备信息,并根据设备信息检测堆叠系统中是否存在故障设备;若堆叠系统中存在故障设备,主控设备根据设备信息与故障类型信息获取故障处理信息,并向堆叠系统中所有成员设备发送故障处理信息,主控设备预设故障类型信息。
[0008]结合第一方面或者第一方面第一种可能的实现方式,在第二种可能的实现方式中,故障处理信息包括:成员设备标识、故障模块标识、故障事件标识、故障优先级、故障恢复行为标识。
[0009]结合第一方面第一种可能的实现方式,在第三种可能的实现方式中,故障类型信息包括:故障模块标识、故障事件标识、故障优先级、故障恢复行为标识。
[0010]第二方面,本发明实施例提供了一种堆叠系统故障处理方法,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括一个主控设备,该方法包括:成员设备接收主控设备发送的故障处理信息;当堆叠系统中所有成员设备均收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
[0011]在第二方面的第一种可能的实现方式中,该方法还包括:当堆叠系统中所有成员设备收到故障处理信息后,成员设备根据自身设备信息与故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次执行相应的故障恢复行为。
[0012]结合第二方面,或者第二方面第一种可能的实现方式,在第二种可能的实现方式中,该方法还包括:当成员设备为故障设备时,设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格;当成员设备为非故障设备时,设置所述非故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。
[0013]第三方面,本发明实施例提供了一种主控设备,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括主控设备,该主控设备包括:检测单元,用于检测堆叠系统中是否有成员设备为故障设备;发送单元,用于当检测单元检测到堆叠系统中有成员设备为故障设备,向堆叠系统中所有成员设备发送故障处理信息,以便于堆叠系统中所有成员设备收到故障处理信息,成员设备根据故障处理信息进行故障恢复。
[0014]在第三方面的第一种可能的实现方式中,该主控设备还包括:获取单元,用于获取堆叠系统中成员设备的设备信息;检测单元具体用于根据设备信息检测堆叠系统中是否存在故障设备;若检测单元检测到堆叠系统中存在故障设备,获取单元还用于根据设备信息与故障类型信息获取故障处理信息;发送单元具体用于向堆叠系统中所有成员设备发送故障处理信息,主控设备预设故障类型信息。
[0015]第四方面,本发明实施例提供了一种成员设备,应用于由多个成员设备组成的堆叠系统,多个成员设备中包括主控设备,该成员设备包括:接收单元,用于接收主控设备发送的故障处理信息;处理单元,用于当堆叠系统中所有成员设备均收到故障处理信息,根据故障处理信息进行故障恢复。
[0016]在第四方面的第一种可能的实现方式中,成员设备还包括:处理单元还用于当堆叠系统中所有成员设备收到故障处理信息后,根据成员设备自身设备信息与故障处理信息,获取相应的故障恢复行为与故障优先级,并根据故障优先级依次执行相应的故障恢复行为。
[0017]结合第四方面或者第四方面第一种可能的实现方式,在第二种可能的实现方式中,该成员设备还包括:处理单元还用于当成员设备为故障设备时,设置故障设备的堆叠主控角色选举资格为无效,并通知堆叠系统内其它成员设备,故障设备不具有主控角色选举资格;当所述成员设备为非故障设备时,设置所述故障设备的堆叠主控角色选举资格为有效,并通知堆叠系统内其它成员设备,非故障设备具有主控角色选举资格。
[0018]第五方面,本发明实施例提供了一种堆叠系统,由多个成员设备组成,包括一个第三方面或第三方面任一种可能的实现方式中的主控设备,和至少一个第四方面或第四方面任一种可能的实现方式中的成员设备。
[0019]本发明的实施例提供的一种堆叠系统故障处理方法、设备及堆叠系统,包括:首先主控设备检测堆叠系统中是否有成员设备为故障设备;其次主控设备向堆叠系统中所有成员设备发送故障处理信息;成员设备判断是否堆叠系统中所有成员设备收到故障处理信息;成员设备根据故障处理信息进行故障恢复。因此上述实施例提供的堆叠系统故障处理方法在堆叠系统中存在故障设备且线路连接正常时,主控设备通过向堆叠系统中所有成员设备发送统一的故障恢复信息,使成员设备在堆叠系统中所有成员设备均收到该故障恢复信息后,能够根据自身设备信息与该故障恢复信息,获取该成员设备针对自身故障或堆叠系统中其他成员设备故障在自身进行故障恢复所需要的故障恢复信息,从而使堆叠系统中的成员设备能够根据主控设备发送的统一的故障恢复信息,在堆叠系统中出现不同的故障时,获取相应的故障恢复信息,并根据该故障恢复信息进行故障恢复,从而提高堆叠系统故障处理的效率,减少堆叠系统中进行故障处理所消耗资源,保证堆叠系统的容错性及稳定性。
【附图说明】
[0020]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为本发明的实施例提供
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1