一种堆叠系统故障处理方法以及设备与流程

文档序号:16309378发布日期:2018-12-19 05:12阅读:473来源:国知局
一种堆叠系统故障处理方法以及设备与流程

本发明涉及通信技术领域,尤其涉及一种堆叠系统故障处理方法以及设备。

背景技术

堆叠技术是通过堆叠链路连接将多台物理设备连接在一起组成堆叠系统(stackingsystem,ss),并从组成堆叠系统的多台物理设备中选择一台物理设备作为主控设备(master),从而对多台物理设备的管理面以及数据面进行统一管理的技术。其中,组成堆叠系统的多个物理设备统称为堆叠系统的成员设备;选择出对各成员设备进行统一管理的成员设备称为堆叠系统的主控设备,其他成员设备称为堆叠系统的从属设备(slave)。

一个成员设备可能包括多张业务板卡(lpu),且多张lpu之间通过交换矩阵板卡(sfu)进行流量转发。在堆叠系统中,当某个成员设备的交换矩阵板卡发生故障时,堆叠系统中其他成员设备无法感知,因此堆叠系统内部的控制面管理信息以及数据面数据信息仍会按照原路径传输,而这会导致堆叠系统中的控制面和数据面异常,进而导致网络故障。现有技术中,当堆叠系统的某一设备的交换矩阵板卡发生故障时的处理方案为:需要人工感知故障设备位置,并将故障设备切换为单机模式或者将故障设备退出堆叠系统。然而,在堆叠系统中若将故障设备切换为单机模式或者将故障设备退出堆叠系统,对堆叠系统影响较大,甚至可能会导致堆叠系统出现分裂等异常,特别是链式堆叠环境下的堆叠系统,将故障设备切换为单机模式或者将故障设备退出堆叠系统,则会直接导致堆叠系统出现分裂。同时由于需要人为查找故障点,效率及故障恢复时间也较长,因此感知且处理堆叠系统的成员设备的交换矩阵板卡故障,减小对堆叠系统的影响是一个亟待解决的问题。



技术实现要素:

本发明的实施例提供一种堆叠系统故障处理方法以及设备,用于在堆叠系统的成员设备的交换矩阵板卡故障时,减小对堆叠系统的影响。

为达到上述目的,本发明的实施例采用如下技术方案:

第一方面,本发明实施例提供了一种堆叠系统故障处理方法,应用于堆叠系统的主控设备,所述方法包括:

接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障;

向所述堆叠系统的所有从属设备发送第二通知报文;所述第二通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。

可选的,若所述堆叠系统为非链形堆叠系统,则在接收到从属设备发送的第一通知报文之后,所述方法还包括:

获取第一广播转发路径,所述第一广播转发路径中发送所述第一通知报文的从属设备为广播断环点;

向所述堆叠系统的所有从属设备发送所述第一广播转发路径,所述广播转发路径用于指示所述堆叠系统的所有从属设备将根据所述广播转发路径对广播形式的报文进行转发。

可选的,在接收到从属设备发送的第一通知报文之后,所述方法还包括:

禁止开启发送所述第一通知报文的从属设备的业务板卡的业务端口。

可选的,所述方法还包括:

接收发送所述第一通知报文的从属设备发送的第三通知报文,所述第三通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡的故障已恢复;

向所述堆叠系统的所有从属设备发送第四通知报文;所述第四通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为正常状态,并重新计算单播转发路径。

第二方面,本发明的实施例提供一种堆叠系统故障处理方法,应用于堆叠系统的从属设备,所述方法包括:

检测本设备的交换矩阵板卡是否发生故障;

若确定交换矩阵板卡发生故障,则关闭本设备的所有业务板卡上的业务端口,并向所述堆叠系统的主控设备发送第一通知报文;

所述第一通知报文用于指示本设备的交换矩阵板卡发生故障。

可选的,若所述堆叠系统为非链形堆叠系统,则在向所述堆叠系统的主控设备发送第一通知报文之后,所述方法还包括:

接收所述主控设备发送的第一广播转发路径,所述第一广播转发路径中所述从属设备为广播断环点;

根据所述第一广播转发路径禁止对广播形式的报文进行转发。

可选的,所述方法还包括:

确定设备的堆叠端口是否设置在多张业务板卡上;

若是,则确定是否存在目标业务板卡,所述目标业务板卡为堆叠端口直连的对端成员设备包括本设备的所有直连成员设备的业务板卡;

若仅存在一张目标业务板卡,则关闭本设备上除所述目标业务板卡以外其他业务板卡上的堆叠端口;

若存在多张目标业务板卡,则根据第一预设规则在所述多张目标业务板卡中选取第一业务板卡,并关闭所述本设备上除所述第一业务板卡以外其他业务板卡上的堆叠端口;

若不存在目标业务板卡,则根据第二预设规则在所述本设备的业务板卡中选取目标业务板卡集合,并关闭所述本设备上除所述目标业务板卡集合中的业务板卡以外其他业务板卡上的堆叠端口;所述目标业务板卡集合中的业务板卡的堆叠端口的对端成员设备的合集包括所述本设备的所有直连成员设备。

可选的,所述方法还包括:

当确定交换矩阵板卡的故障修复之后,向所述主控设备发送第三通知报文并开启所有业务板卡的所有端口;所述第三通知报文用于指示所述本设备的交换矩阵板卡的故障已恢复。

第三方面,本发明的实施例提供一种堆叠系统故障处理方法,应用于堆叠系统的从属设备,所述方法包括:

接收所述堆叠系统的主控设备在接收到第一通知报文后发出的第二通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障,所述第二通知报文用于指示本设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。

可选的,当所述堆叠系统为非链式堆叠系统,所述计算获取目标单播转发路径包括:

在本设备到所述目的设备的路径中选取不经过发送所述第一通知报文的从属设备的路径作为所述单播转发路径。

第四方面,本发明的实施例提供一种堆叠系统的主控设备,包括:

接收单元,接收所述堆叠系统的从属设备发送的第一通知报文,所述第一通知报文用于指示所述从属设备的交换矩阵板卡发生故障;

发送单元,用于向所述堆叠系统的所有从属设备发送第二通知报文;所述第二通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含所述从属设备。

可选的,所述主控设备还包括:获取单元;

若所述堆叠系统为非链形堆叠系统,则所述获取单元,用于在所述接收单元接收到所述第一通知报文之后,获取第一广播转发路径,所述第一广播转发路径中发送所述第一通知报文的从属设备为广播断环点;

所述发送单元,还用于向所述堆叠系统的所有从属设备发送所述第一广播转发路径,所述第一广播转发路径用于指示所述堆叠系统的所有从属设备将根据所述第一广播转发路径对广播形式的报文进行转发。

可选的,所述主控设备还包括:处理单元;

所述处理单元,用于在所述接收单元接收到所述第一通知报文之后,禁止开启发送所述第一通知报文的从属设备的业务板卡的业务端口。

可选的,所述接收单元,还用于接收发送所述第一通知报文的从属设备发送的第三通知报文,所述第三通知报文用于指示所述从属设备的交换矩阵板卡的故障已恢复;

所述发送单元,还用于向所述堆叠系统的所有从属设备发送第四通知报文;所述第四通知报文用于指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为正常状态,并重新计算单播转发路径。

第五方面,本发明的实施例提供一种堆叠系统的从属设备,包括:

检测单元,用于检测本设备的交换矩阵板卡是否发生故障;

处理单元,用于在所述检测单元确定本设备的交换矩阵板卡发生故障时,关闭本设备的所有业务板卡上的业务端口;

发送单元,用于在所述检测单元确定本设备的交换矩阵板卡发生故障时,向所述堆叠系统的主控设备发送第一通知报文,所述第一通知报文用于指示本设备的交换矩阵板卡发生故障。

可选的,所述从属设备还包括接收单元;

若所述堆叠系统为非链形堆叠系统,则所述接收单元,用于在向所述堆叠系统的主控设备发送第一通知报文之后,接收所述主控设备发送的第一广播转发路径,所述第一广播转发路径中本设备为广播断环点;

所述处理单元,还用于根据所述第一广播转发路径禁止对广播形式的报文进行转发。

可选的,所述处理单元,还用于确定本设备的堆叠端口是否设置在多张业务板卡上;若是,则确定是否存在目标业务板卡,所述目标业务板卡为堆叠端口直连的对端成员设备包括本设备的所有直连成员设备的业务板卡;若仅存在一张目标业务板卡,则关闭本设备上除所述目标业务板卡以外其他业务板卡上的堆叠端口;若存在多张目标业务板卡,则根据第一预设规则在所述多张目标业务板卡中选取第一业务板卡,并关闭本设备上除所述第一业务板卡以外其他业务板卡上的堆叠端口;若不存在目标业务板卡,则根据第二预设规则在本设备的业务板卡中选取目标业务板卡集合,并关闭本设备上除所述目标业务板卡集合中的业务板卡以外其他业务板卡上的堆叠端口;所述目标业务板卡集合中的业务板卡的堆叠端口的对端成员设备的合集包括本设备的所有直连成员设备。

可选的,所述发送单元,还用于确定交换矩阵板卡的故障修复之后,向所述主控设备发送第三通知报文,所述第三通知报文用于指示本设备的交换矩阵板卡的故障已恢复;

所述处理单元,还用于确定交换矩阵板卡的故障修复之后,开启所有业务板卡的所有端口。

第六方面,提供一种堆叠系统的从属设备,包括:

接收单元,用于接收所述堆叠系统的主控设备在接收第一通知报文后发出的第二通知报文,所述第一通知报文用于指示发送所述第一通知报文的从属设备的交换矩阵板卡发生故障,所述第二通知报文用于指示本设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并重新计算单播转发路径;

处理单元,用于将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,所述目标单播转发路径中不包含发送所述第一通知报文的从属设备。

可选的,当所述堆叠系统为非链式堆叠系统,所述处理单元,具体用于在本设备到所述目的设备的路径中选取不经过发送所述第一通知报文的从属设备的路径作为所述目标单播转发路径。

本发明实施提供的堆叠系统故障处理方法,在接收所述堆叠系统的从属设备发送的用于指示所述从属设备的交换矩阵板卡发生故障的第一通知报文时,向所述堆叠系统的所有从属设备发送向所述堆叠系统的所有从属设备发送用于将发送所述第一通知报文的从属设备的软件状态设置为异常,且计算获取目标单播转发路径的第二通知报文,由于在堆叠系统的从属设备的交换矩阵板卡发生故障时,本发明实施例未将故障设备直接退出堆叠系统,而是指示堆叠系统的所有从属设备将发送所述第一通知报文的从属设备的软件状态设置为异常状态,并计算获取不包含发送所述第一通知报文的从属设备的目标单播转发路径,因此可以在对堆叠系统的成员设备的交换矩阵板卡发生的故障进行处理时减小对堆叠系统的影响。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的堆叠故障处理方法所应用的堆叠系统的示意图;

图2为本发明实施例提供的堆叠故障处理方法所应用的另一种堆叠系统的示意图;

图3为本发明实施例提供的堆叠故障处理方法的交互流程图之一;

图4为本发明实施例提供的堆叠故障处理方法的交互流程图之二;

图5为本发明实施例提供的堆叠故障处理方法的交互流程图之三;

图6为本发明实施例提供的堆叠故障处理方法的交互流程图之四;

图7为本发明实施例提供的主控设备的示意性结构图;

图8为本发明实施例提供的从属设备的示意性结构图;

图9为本发明实施例提供的另一从属设备的示意性结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不是在对数量和执行次序进行限定。

在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本发明的描述中,除非另有说明,“多个”的含义是指两个或两个以上。例如,多个感应单元是指两个或两个以上的感应单元。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

参照图1所示,本发明的实施例提供的堆叠系统故障处理方法应用的堆叠系统包括:多个成员设备(图1中以包括4个成员设备为例示出),其中,成员设备11为堆叠系统的主控设备,成员设备12、成员设备13以及成员设备14为堆叠系统的从属设备;成员设备11、成员设备12、成员设备13、成员设备14依次通过堆叠端口连接形成链式堆叠系统。

参照图2所示,本发明的实施例提供的堆叠系统故障处理方法应用的另一种堆叠系统包括:多个成员设备(图2中以包括4个成员设备为例示出),其中,成员设备21为堆叠系统的主控设备,成员设备22、成员设备23以及成员设备24为堆叠系统的从属设备;成员设备21、成员设备22、成员设备23、成员设备24依次通过堆叠端口连接,且成员设备21与成员设备24通过堆叠端口连接,形成环形堆叠系统

(非链形堆叠系统的一种实例)。

此外,上述堆叠系统的成员设备可以为路由器、交换机以及类似设备。

本发明实施例提供一种堆叠系统故障处理方法,参照图3所示,图3中以堆叠系统的第一从属设备31的交换矩阵板卡发生了故障为例对发生故障的从属设备31、堆叠系统的主控设备32以及堆叠系统中出发生故障的从属设备31以外的其他第二从属设备33在堆叠系统故障处理方法中执行的动作进行说明。

需要说明的是,堆叠系统中还可以包括多个第二从属设备33,但每一个第二从属设备33执行的动作均相同,为简化描述,本发明实施例中以堆叠系统中包括一个第二从属设备33为例进行说明。

具体的,参照图3所示,本发明实施例提供的堆叠系统故障处理方法包括:

s11、第一从属设备检测本设备的交换矩阵板卡是否发生故障。

具体的,堆叠系统中每一个成员设备都会有对于交换矩阵板卡的保活机制,利用对于交换矩阵板卡的保活机制,各成员设备可以检测交换矩阵板卡物理在位状态、转发流量监控等状态,从而确定自身机框内的交换矩阵板卡是否发生故障。

在上述步骤s11中,若各成员设备均确认自身机框内的交换矩阵板卡未发生故障,则按照现有技术中堆叠系统的工作机制正常工作,若第一从属设备(可以为堆叠系统的任意从属设备)确认自身机框内的交换矩阵板卡发生了故障,则执行如下步骤s12和s13。

s12、第一从属设备关闭本设备所有业务板卡上的业务端口。

需要说明的是,本发明实施例中的业务板卡上的业务端口是指除业务板上的堆叠端口以外的所有端口,因此上述步骤s12中仅关闭第一从属设备的所有业务板卡上的业务端口,而不包括第一从属设备的业务板卡上的堆叠端口。

示例性的,若第一从属设备包括:业务板卡1和业务板卡2,并且业务板卡1上分布有端口1和端口2,业务板卡2上分布有端口3和端口4,其中,端口2为堆叠端口,而端口1、端口3、端口4为业务端口,则执行上述步骤s12即为:关闭端口1、端口3、端口4,保持端口2开启。

s13、第一从属设备向堆叠系统的主控设备发送第一通知报文。

其中,第一通知报文用于指示第一从属设备的交换矩阵板卡发生故障。

对应的,堆叠系统的主控设备接收第一从属设备发送的第一通知报文。

即,堆叠系统的从属设备在确认自身机框内的交换矩阵板卡发生故障后通知堆叠系统的主控设备,堆叠系统的主控设备将第一从属设备的软件状态设置为异常状态。

s14、主控设备向堆叠系统的所有从属设备发送第二通知报文。

其中,第二通知报文用于指示堆叠系统的所有从属设备将发送第一通知报文的从属设备(第一从属设备)的软件状态设置为异常状态,并计算获取目标单播转发路径。

其中,目标单播转发路径中不包含发送第一通知报文的从属设备(第一从属设备)。

对应的,第二从属设备接收主控设备发送的第二通知报文。

s15、第二从属设备将发送第一通知报文的从属设备(第一从属设备)的软件状态设置为异常状态,并计算获取目标单播转发路径。

具体的,上述将第一从属设备的软件状态设置为异常状态后,计算获取目标单播转发路径,包括:

1、若堆叠系统为链式堆叠系统,则维持原有转发路径。

由于链式堆叠系统任意设备到目的设备的单播转发路径都是唯一的,因此当堆叠系统为链式堆叠系统时,维持原有转发路径。

2、若堆叠系统为非链式堆叠系统,则计算获取目标单播转发路径包括:

在第二从属设备到目的设备的路径中选取不经过第一从属设备的路径为作为单播转发路径。

具体的,上述堆叠系统为非链式堆叠系统具体可以为堆叠系统为图2所示的环形堆叠系统。

此外,上述在第二从属设备到目的设备的路径中选取不经过第一从属设备的路径包括如下两种情况:

2.1、第二从属设备与目的设备为直连设备。

由于第二从属设备与目的设备为直连设备,因此第二从属设备到目的设备的最短路径必然不需要经过第一从属设备,因此当第二从属设备与目的设备为直连设备时,维持原有路径计算原则(可以为最短路径计算原则)。

2.2、第二从属设备与目的设备不为直连设备。

第二从属设备与目的设备不为直连设备,因此第二从属设备到目的设备可能包括多条路径,此时从多条第二从属设备到目的设备的路径中选取一条不经过第一从属设备的路径为第二从属设备到目的设备的单播路径。此外,若第二从属设备到目的设备的路径中包括多条不经过第一从属设备的路径,则可以根据最短路径等计算原则从多条不经过第一从属设备的路径中选取单播路径。

本发明实施提供的堆叠系统故障处理方法,在接收堆叠系统的从属设备发送的用于指示从属设备的交换矩阵板卡发生故障的第一通知报文时,向堆叠系统的所有从属设备发送向堆叠系统的所有从属设备发送用于将发送第一通知报文的从属设备的软件状态设置为异常,且计算获取目标单播转发路径的第二通知报文,由于在堆叠系统的从属设备的交换矩阵板卡发生故障时,本发明实施例未将故障设备直接退出堆叠系统,而是指示堆叠系统的所有从属设备将发送第一通知报文的从属设备的软件状态设置为异常状态,并计算获取不包含发送第一通知报文的从属设备的目标单播转发路径,因此可以在对堆叠系统的成员设备的交换矩阵板卡发生的故障进行处理时减小对堆叠系统的影响。

进一步的,参照图4所示,若堆叠系统为非链形堆叠系统,则在上述步骤s13之后,本发明实施例提供的堆叠系统故障处理方法还包括:

s16、主控设备获取第一广播转发路径。

其中,第一广播转发路径中发送第一通知报文的从属设备(第一从属设备)为广播断环点。

s17、主控设备向堆叠系统的所有从属设备发送第一广播转发路径。

其中,第一广播转发路径用于指示堆叠系统的所有从属设备将根据第一广播转发路径对广播形式的报文进行转发。

对应的,第一从属设备以及第二从属设备均接收主控设备发送的第一广播转发路径。

s18、第一从属设备根据第一广播转发路径禁止对广播形式的报文进行转发。

即,第一从属设备关闭广播流量转发能力。

此外,第二从属设备根据第一广播转发路径对广播形式的报文进行转发。

上述实施例在堆叠系统为非链形堆叠系统时,主控设备获取将第一从属设备作为广播断环点的第一广播路径,并讲话第一广播路径发送堆叠系统的各个从属设备,因此在广播流量转发时可以避免经过第一从属设备,因此上述实施例可以避免第一从属设备的交换矩阵板卡的故障对广播流量转发的影响。

可选的,上述实施例提供的堆叠系统故障处理方法还包括:

主控设备在接收到第一通知报文之后,禁止开启发送第一通知报文的从属设备(第一从属设备)的业务板卡的业务端口。

可选的,参照图5所示,在上述实施例的基础上,本发明实施例提供的堆叠系统故障处理方法还包括:

s51、第一从属设备确定第一从属设备的堆叠端口是否设置在多张业务板卡上。

在上述步骤s51中,若确定堆叠端口设置在同一张业务板卡上,则流程结束,若确定堆叠端口设置在多张业务板卡上,则执行下述步骤s52。

s52、确定是否存在目标业务板卡。

其中,目标业务板卡为堆叠端口的对端成员设备包括第一从属设备的所有直连成员设备的业务板卡。

在上述步骤s52中,若仅存在一张目标业务板卡,则执行下述步骤s53,若存在多张目标业务板卡,则执行下述步骤s54,若不存在目标业务板卡,则执行下述步骤s55。

s53、关闭第一从属设备上除目标业务板卡以外其他业务板卡上的堆叠端口。

s54、根据第一预设规则在多张目标业务板卡中选取第一业务板卡,并关闭第一从属设备上除第一业务板卡以外其他业务板卡上的堆叠端口。

可选的,根据第一预设规则在多张目标业务板卡中选取第一业务板卡,包括:

在多张目标业务板卡中选取槽位号最小的业务板卡最为第一业务板卡。

s55、根据第二预设规则在第一从属设备的业务板卡中选取目标业务板卡集合,并关闭第一从属设备上除目标业务板卡集合中的业务板卡以外其他业务板卡上的堆叠端口。

其中,目标业务板卡集合中的业务板卡的堆叠端口的对端成员设备的合集包括第一从属设备的所有直连成员设备。

可选的,在执行上述方法后,第一从属设备还用于将需要跨业务板卡转发的报文trap上中央处理器,由中央处理器通过内部管理通道转发至目的成员设备所连接的堆叠端口所在业务板卡。

需要说明的是,本发明实施例中不限定上述图中5所示步骤s51至s55与上述图4中所示步骤s12至s18的先后顺序。

可选的,根据第二预设规则在第一从属设备的业务板卡中选取目标业务板卡集合,包括:

在第一从属设备的业务板卡中选取直连成员设备数最多的板卡。

例如:如业务板卡1上的堆叠端口连接的对端成员设备有成员1,成员2,业务板卡2上的堆叠端口连接的对端成员设备有成员1,此时关闭业务板卡2上的堆叠端口。

即,当不存在目标业务板卡时,在确保每一个直连的成员设备通过业务板卡的堆叠端口连接的基础上,使堆叠端口开启的业务板卡的数量尽量的少。

再进一步的,参照图6所示,当确定交换矩阵板卡的故障修复之后本发明实施例提供的堆叠系统故障处理方法,还包括:

s19、第一从属设备开启所有业务板卡的所有端口。

s110、向主控设备发送第三通知报文。

其中,第三通知报文用于指示第一从属设备的交换矩阵板卡的故障已恢复。

对应的,主控制设备接收第一从属设备发送的第三通知报文。

s111、主控设备向堆叠系统的所有从属设备发送第四通知报文。

其中,第四通知报文用于指示堆叠系统的所有从属设备将发送第一通知报文的从属设备或发送第三通知报文的从属设备(第一从属设备)的软件状态设置为正常状态,并重新计算转发路径。

对应的,第二从属设备接收主控设备发送的第四通知报文。

s112、第二从属设备将发送第一通知报文的从属设备或发送第三通知报文的从属设备(第一从属设备)的软件状态设置为正常状态,并重新计算单播转发路径。

需要说明的是,上述步骤s112中第二从属设备将第一从属设备的软件状态设置为正常状态后从新重新计算的转发路径可以广播转发路径,且重新计算的单播和广播转发路径中可以包括第一从属设备。

进一步可选的,上述方法还包括:第一从属设备、主控设备以及第二从属设备将上报故障发生日志、故障处理日志以及故障恢复日志。

进一步的,下以对上述主控设备、第一从属设备以及第二从属设备的堆叠故障处理方式进行总结说明:

一、主控设备

1、当堆叠系统的主控设备接收到第一通知报文之后,执行动作包括:

1.1、如果堆叠系统为非链形堆叠系统,则将第一从属设备预设计为广播断环点后,重新计算广播转发路径并通知全网修改广播转发表项;

1.2、将第一从属设备的交换矩阵板卡发生故障通知堆叠系统内的各个成员设备,并指示堆叠系统内各个成员设备重新计算单播转发路径;

1.3、将故障设备的软件状态修改为异常状态,并禁止开启第一从属设备的业务板卡的业务端口;

1.4、上报故障发生日志及故障处理日志。

2、当堆叠系统的主控设备接收到第三通知报文之后,执行动作包括:

2.1、将第一从属设备的软件状态修改为正常状态;

2.2、将第一从属设备的交换矩阵板卡已修复通知堆叠系统中的各个成员设备,并指示堆叠中的各个成员设备重新计算单播转发路径。

2.3、上报故障恢复日志。

二、第一从属设备(交换矩阵板卡发生故障的从属设备)

1、当第一从属设备检测到交换矩阵板卡发生故障之后,执行动作包括:

1.1、向堆叠系统的主控设备发送第一通知报文;

1.2、关闭业务板卡上除堆叠端口以外的其他端口;

1.3、接收堆叠系统的主控设备发送的第一广播转发路径,并根据第一广播转发路径禁止转发广播流量。

1.4、如果堆叠端口分布在多张业务板卡,且仅存在一张堆叠板卡上的堆叠成员端口,其对端成员设备能够覆盖本设备的所有直连成员设备,则仅保留该板卡上的所有堆叠端口,将其余的堆叠成员端口关闭;如果堆叠端口分布在多张业务板卡,且存在多张堆叠板卡上的堆叠成员端口,如果堆叠端口分布在多张业务板卡,且仅存在一张堆叠板卡上的堆叠成员端口,则根据一定的选择原则(如槽位号最小),保留一张堆叠板卡,将其余满足/不满足条件的堆叠成员端口关闭;如果堆叠端口分布在多张业务板卡,且不存在堆叠板卡上的堆叠成员端口,其对端成员设备能够覆盖本设备的所有直连成员设备,则在确保每个成员设备能通过业务板卡上的堆叠端口可达的基础上,使堆叠端口开启的业务板卡的数量尽量的少;在此前提下,将需要跨卡转发的报文trap上中央处理器,由中央处理器通过内部管理通道转发至目的成员设备所连接的堆叠端口所在业务板卡。

1.5、堆叠系统内部管理通道仍然保留,允许通过内部通道访问故障设备并进行相关管理操作。

1.6、上报故障发生日志及故障处理日志。

2、当检测到交换矩阵板卡发生的故障已被修复之后,执行动作包括:

2.1、向堆叠系统的主控设备发送第三通知报文;

2.2、开启业务端口及堆叠端口;

2.3、上报故障恢复日志

三、第二从属设备(堆叠系统中除交换矩阵板卡发生故障的从属设备以外的任意其他从属设备)

1、当接收堆叠系统的主控设备发送的第二通知报文之后,执行动作包括:

1.1、将故障设备的软件状态修改为异常状态;

1.2、重新计算单播转发路径。

2、当接收堆叠系统的主控设备发送的第四通知报文之后,执行动作包括:

2.1、将故障设备的软件状态修改为正常状态;

2.2、重新计算单播转发路径。

本发明再一实施例提供一种堆叠系统的主控设备,具体的,参照图7所示,该主控设备700包括:

接收单元71,接收堆叠系统的从属设备发送的第一通知报文,第一通知报文用于指示发送第一通知报文的从属设备的交换矩阵板卡发生故障;

发送单元72,用于向堆叠系统的所有从属设备发送第二通知报文;第二通知报文用于指示堆叠系统的所有从属设备将发送第一通知报文的从属设备的软件状态设置为异常状态,并计算获取目标单播转发路径,目标单播转发路径中不包含发送第一通知报文的从属设备。

可选的,主控设备700还包括:获取单元73;

若堆叠系统为非链形堆叠系统,则获取单元73,用于在接收单元71接收到第一通知报文之后,获取第一广播转发路径,第一广播转发路径中发送第一通知报文的从属设备为广播断环点;

发送单元72,还用于向堆叠系统的所有从属设备发送第一广播转发路径,第一广播转发路径用于指示堆叠系统的所有从属设备将根据第一广播转发路径对广播形式的报文进行转发。

可选的,主控设备700还包括:处理单元74;

处理单元74,用于在接收单元71接收到第一通知报文之后,禁止开启发送第一通知报文的从属设备的业务板卡的业务端口。

可选的,接收单元71,还用于接收从属设备发送的第三通知报文,第三通知报文用于指示从属设备的交换矩阵板卡的故障已恢复;

发送单元72,还用于向堆叠系统的所有从属设备发送第四通知报文;第四通知报文用于指示堆叠系统的所有从属设备将发送第一通知报文的从属设备的软件状态设置为正常状态,并重新计算单播转发路径。

本发明再一实施例提供一种堆叠系统的从属设备,具体的,参照图8所示,该从属设备800包括:

检测单元81,用于检测本设备的交换矩阵板卡是否发生故障;

处理单元82,用于在检测单元81确定本设备的交换矩阵板卡发生故障时,关闭从属设备的所有业务板卡上的业务端口;

发送单元83,用于在检测单元81确定交换矩阵板卡发生故障时,向堆叠系统的主控设备发送第一通知报文,第一通知报文用于指示发送第一通知报文的从属设备的交换矩阵板卡发生故障。

可选的,该从属设备800还包括:接收单元84;

若堆叠系统为非链形堆叠系统,则接收单元84,用于在向堆叠系统的主控设备发送第一通知报文之后,接收主控设备发送的第一广播转发路径,第一广播转发路径中发送第一通知报文的从属设备为广播断环点;

处理单元82,还用于根据第一广播转发路径禁止对广播形式的报文进行转发。

可选的,处理单元82,还用于确定本设备的堆叠端口是否设置在多张业务板卡上;若是,则确定是否存在目标业务板卡,目标业务板卡为堆叠端口直连的对端成员设备包括本设备的所有直连成员设备的业务板卡;若仅存在一张目标业务板卡,则关闭本设备上除目标业务板卡以外其他业务板卡上的堆叠端口;若存在多张目标业务板卡,则根据第一预设规则在多张目标业务板卡中选取第一业务板卡,并关闭本设备上除第一业务板卡以外其他业务板卡上的堆叠端口;若不存在目标业务板卡,则根据第二预设规则在本设备的业务板卡中选取目标业务板卡集合,并关闭本设备上除目标业务板卡集合中的业务板卡以外其他业务板卡上的堆叠端口;目标业务板卡集合中的业务板卡的堆叠端口的对端成员设备的合集包括本设备的所有直连成员设备。

可选的,发送单元83,还用于确定交换矩阵板卡的故障修复之后,向主控设备发送第三通知报文,第三通知报文用于指示发送第一通知报文的从属设备的交换矩阵板卡的故障已恢复;

处理单元82,还用于确定交换矩阵板卡的故障修复之后,开启所有业务板卡的所有端口。

本发明再一实施例提供一种堆叠系统的从属设备,具体的,参照图9所示,该从属设备900包括:

接收单元91,用于接收堆叠系统的主控设备在接收到第一通知报文后发出的第二通知报文,第一通知报文用于指示发送第一通知报文的从属设备的交换矩阵板卡发生故障,第二通知报文用于指示本设备发送第一通知报文的从属设备的软件状态设置为异常状态,并重新计算单播转发路径;

处理单元92,用于将发送第一通知报文的从属设备的软件状态设置为异常状态并计算获取目标单播转发路径,目标单播转发路径中不包含发送第一通知报文的从属设备。

可选的,当堆叠系统为非链式堆叠系统,处理单92元,具体用于在本设备到目的设备的路径中选取不经过发送第一通知报文的从属设备的路径作为目标单播转发路径。

本发明实施例提供的主控设备,在接收堆叠系统的从属设备发送的用于指示从属设备的交换矩阵板卡发生故障的第一通知报文时,向堆叠系统的所有从属设备发送向堆叠系统的所有从属设备发送用于将发送第一通知报文的从属设备的软件状态设置为异常,且计算获取目标单播转发路径的第二通知报文,由于在堆叠系统的从属设备的交换矩阵板卡发生故障时,本发明实施例未将故障设备直接退出堆叠系统,而是指示堆叠系统的所有从属设备将发送第一通知报文的从属设备的软件状态设置为异常状态,并计算获取不包含发送第一通知报文的从属设备的目标单播转发路径,因此可以在对堆叠系统的成员设备的交换矩阵板卡发生的故障进行处理时减小对堆叠系统的影响。

需要说明的是,在具体实现过程中,上述如图所示的方法流程中控制器和网络节点所执行的各步骤均可以通过硬件形式的处理器执行存储器中存储的软件形式的计算机执行指令实现,为避免重复,此处不再赘述。而上述认证服务器所执行的动作所对应的程序均可以以软件形式存储于该认证服务器的存储器中,以便于处理器调用执行以上各个模块对应的操作。

上文中的存储器可以包括易失性存储器(volatilememory),例如随机存取存储器(random-accessmemory,ram);也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-onlymemory,rom),快闪存储器(flashmemory),硬盘(harddiskdrive,hdd)或固态硬盘(solid-statedrive,ssd);还可以包括上述种类的存储器的组合。

上文所提供的装置中的处理器可以是一个处理器,也可以是多个处理元件的统称。例如,处理器可以为中央处理器(centralprocessingunit,cpu;也可以为其他通用处理器、数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等;还可以为专用处理器,该专用处理器可以包括基带处理芯片、射频处理芯片等中的至少一个。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1