故障处理方法和装置制造方法

文档序号:7819698阅读:287来源:国知局
故障处理方法和装置制造方法
【专利摘要】本发明提供了一种故障处理方法和装置,技术方案为:跨设备聚合中的主设备和备设备之间的ISC链路故障且保活链路连通时,如果主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路,则切换主设备与备设备的主备角色,在主设备切换为备设备后关闭其所有跨设备聚合口,在备设备切换为主设备后恢复其被关闭的所有跨设备聚合口。本发明可以避免跨设备聚合的上下行链路连通异常。
【专利说明】故障处理方法和装置

【技术领域】
[0001]本发明涉及通信【技术领域】,特别涉及一种故障处理方法和装置。

【背景技术】
[0002]跨设备聚合使用私有协议将两台设备实现之间的跨设备端口聚合,提供设备级冗余保护。跨设备聚合的两台设备之间需要提供两个专用链路:数据同步链路:ISC链路(Inter-Switch-Connect Link),用于设备间交互控制报文,同时还用于跨设备流量的转发;保活链路(Layer3Peer_keepalive Link):用于在ISC链路发生故障时通过发送保活(keepalive)报文判断故障类型是ISC链路故障还是对端设备故障。
[0003]参见图1,图1是现有技术跨设备聚合组网示意图,如图1所示:设备A和设备B组成一个跨设备聚合;设备C和设备D组成一个跨设备聚合;设备E和设备F通过由设备A和设备B组成的跨设备聚合以及由设备C和设备D组成的跨设备聚合相连,其中,设备E与由设备A和设备B组成的跨设备聚合之间的聚合链路为bagglO,由设备A和设备B组成的跨设备聚合与由设备C和设备D组成的跨设备聚合之间的聚合链路为bagg20,由设备C和设备D组成的跨设备聚合与设备F之间的聚合链路为bagg30。
[0004]在图1所示组网中,未知单播报文从设备F到设备E的转发流程如图2所示:
[0005]Al)报文从设备F发到设备C,设备C通过bagg20和ISC链路分别向上游设备A和对端设备D各转发一份。设备F的MAC地址学习在设备C的bagg30上,并同步到设备D的 bagg30 上。
[0006]BI)报文到设备D以后,设备D发现是从ISC链路上来的报文,丢弃;报文到达设备A时,设备A判断报文从非ISC链路上来的,就通过bagglO和ISC链路分别向上游设备E和对端设备B各转发一份。设备F的MAC地址学习在设备A的bagg20上,并同步到设备B 的 bagg20 上。
[0007]Cl)报文到达设备B以后,设备B判断是从ISC链路上来的报文,丢弃;报文到达设备E,设备F的MAC地址学习在设备E的bagglO上。
[0008]上述未知单播报文转发流程是以设备C及设备A上连接上游设备的聚合接口均UP为前提的,如果设备C和/或设备A上连接上游设备的聚合接口 DOWN,则上述流程会发生变化,以设备A上连接上游设备的聚合接口(也即设备A上的bagglO连接接口)D0WN,则上述步骤Cl变化为:
[0009]Cl’)报文到达设备B以后,设备B判断是从ISC链路上来的报文,通过bagglO向上游设备E转发一份;报文到达设备E,设备F的MAC地址学习在设备E的bagglO上。
[0010]在图1所示组网中,已知单播报文从设备E到设备F的转发流程如图3所示:
[0011]A2)报文从设备E发到设备B ;
[0012]B2)由于设备A已经把设备F的MAC地址同步到设备B上的bagg20上,设备B将报文通过bagg20的Eth2/0/l转发到设备C (也可以通过bagg20的Eth2/0/2转发到设备C),而不会从ISC链路转发出去。
[0013]C2)报文到达设备C以后,由于设备F的MAC地址学习在bagg30上,因此设备C直接通过bagg30转发报文到设备F。
[0014]上述已知单播报文转发流程是以设备B及设备C上连接下游设备的聚合接口均UP为前提的,如果设备B和/或设备C上连接上游设备的聚合接口 DOWN,则上述流程会发生变化,以设备C上连接下游设备的聚合接口(也即设备C上的bagg30连接接口)D0WN为例,上述步骤C2变化为:
[0015]C2’)报文到达设备C以后,设备C将报文通过ISC链路转发到设备D,由于设备F的MAC地址已经同步给设备D的bagg30,因此设备D将报文通过bagg30转发给设备F。
[0016]跨设备聚合中的两台设备分为主(primary)设备和备(secondary)设备。在现有实现中,当跨设备聚合中两台设备之间的ISC链路故障且保活链路正常的情况下,需要DOWN掉备设备上所有跨设备聚合接口,从而停止备设备上所有跨设备聚合组的转发,而主设备上的跨设备聚合组则继续转发。例如在图1所示组网中,假设设备A为主设备,设备B为备设备,如果设备A和设备B之间的ISC链路故障且保活链路正常,那么设备B上的端口Eth2/0/1 > Eth2/0/1 > Eth2/0/3 就会被 shutdown。
[0017]然而,上述当跨设备聚合中两台设备之间的ISC链路故障且保活链路正常的情况下,DOWN掉备设备上所有跨设备聚合接口,从而停止备设备上所有跨设备聚合组的转发的故障处理方法会带来新的问题。例如,上述设备A和设备B之间的ISC链路故障且保活链路正常时,设备B上的端口 Eth2/0/3被shutdown,此后如果设备A上的端口 Ethl/0/3故障,那么设备E到下游将不存在连通的链路,然而此时设备B上的端口 Eth2/0/l、Eth2/0/l、Eth2/0/3的连接链路实际上是连通的,并未出现故障,只是因为这些端口被shutdown而不能收发流量。可以看出,上述将备设备的所有跨设备聚合口 shutdown的故障处理方法,可能会导致跨设备聚合的上下行链路连通异常。


【发明内容】

[0018]有鉴于此,本发明的目的在于提供一种应用于跨设备聚合的故障处理方法和装置,能够避免跨聚合设备的上下行链路连通异常。
[0019]为了达到上述目的,本发明提供了了如下技术方案:
[0020]一种故障处理方法,应用于跨设备聚合中的主设备或备设备,主设备与跨设备聚合中的备设备之间的ISC链路故障且保活链路连通,该方法包括:
[0021]将当前设备的所有跨设备聚合口状态信息通过保活链路通告到跨设备聚合中的对端设备,并根据当前设备的所有跨设备聚合口状态信息判断当前设备是否存在连通的上下行链路;
[0022]接收对端设备通告的所有跨设备聚合口状态信息,并根据对端设备的所有跨设备聚合口状态信息判断对端设备是否存在连通的上下行链路;
[0023]如果当前设备为主设备,若当前设备上不存在连通的上下行链路且对端设备上存在连通的上下行链路,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为备设备后关闭shutdown自身的所有跨设备聚合口 ;
[0024]如果当前设备为备设备,若当前设备上存在连通的上下行链路且对端设备上不存在连通的上下行链路,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
[0025]一种故障处理装置,应用于跨设备聚合中的主设备,主设备与跨设备聚合中的备设备之间的ISC链路故障且保活链路连通,该装置包括:发送单元、接收单元、判断单元、切换单元;
[0026]所述发送单元,用于将将主设备的所有跨设备聚合口状态信息通过保活链路通告到备设备,并通知判断单元判断主设备是否存在连通的上下行链路;
[0027]所述接收单元,用于接收备设备通告的所有跨设备聚合口状态信息;
[0028]所述判断单元,用于接收发送单元的通知,根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路;用于接收单元接收到备设备通告的所有跨设备聚合口状态信息时,根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路;
[0029]所述切换单元,用于如果判断单元判定主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路,则与备设备进行角色选举协商以切换主设备和备设备的主备角色,并在主设备切换为备设备后关闭shutdown主设备的所有跨设备聚合口。
[0030]另一种故障处理装置,应用于跨设备聚合中的备设备,备设备与跨设备聚合中的主设备之间的ISC链路故障且保活链路连通,该装置包括:发送单元、接收单元、判断单元、切换单元;
[0031]所述发送单元,用于将备设备的所有跨设备聚合口状态信息通过保活链路通告到主设备,并通知判断单元判断备设备是否存在连通的上下行链路;,并
[0032]所述接收单元,用于接收主设备通告的所有跨设备聚合口状态信息;
[0033]所述判断单元,用于接收发送单元的通知,根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路;用于接收单元接收到主设备通告的所有跨设备聚合口状态信息时,根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路;
[0034]所述切换单元,用于如果判断单元判定备设备上存在连通的上下行链路且主设备上不存在连通的上下行链路,则与主设备进行角色选举协商以切换主设备和备设备的主备角色,并在备设备切换为主设备后恢复被关闭shutdown的所有跨设备聚合口。
[0035]由上面的技术方案可知,本发明中,跨设备聚合中的主设备和备设备之间的ISC链路故障且保活链路连通时,如果主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路,则通过切换主设备与备设备的主备角色,并,在主设备切换为备设备后关闭其所有跨设备聚合口,在备设备切换为主设备后恢复其被关闭的所有跨设备聚合口,使得备设备可以继续负责跨设备聚合的流量转发,从而避免跨聚合设备的上下行链路连通异堂巾O

【专利附图】

【附图说明】
[0036]图1是现有技术跨设备聚合组网示意图;
[0037]图2是本发明实施例一故障处理方法流程图;
[0038]图3是本发明实施例二故障处理方法流程图;
[0039]图4是本发明实施例一种跨设备聚合组网示意图;
[0040]图5是本发明实施例另一种跨设备聚合组网示意图;
[0041]图6是本发明实施例故障处理方法流程图;
[0042]图7是本发明实施例一故障处理装置的结构示意图;
[0043]图8是本发明实施例二故障处理装置的结构示意图。

【具体实施方式】
[0044]为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图并据实施例,对本发明的技术方案进行详细说明。
[0045]本发明中,当跨设备聚合的两台设备之间的ISC链路故障且保活链路连通的情况下,如果主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路,则切换主设备和备设备的主备角色,使主设备切换为备设备并关闭(shutdown)自身的所有跨设备聚合口,备设备切换为主设备并恢复被关闭的所有跨设备聚合口。由于备设备上存在连通的上下行链路,在切换为主设备且恢复被关闭的所有跨设备聚合口后,就可以作为主设备继续转发上下行流量,因而可以有效避免跨聚合设备的上下行链路连通异常。
[0046]下面分别以两个具体的实施例对本发明提供的故障处理方法进行说明。
[0047]参见图2,图2是本发明实施例一故障处理方法流程图,该方法应用于跨设备聚合中的主设备,主设备与备设备之间的ISC链路故障且保活链路连通,如图2所示,该方法主要包括以下步骤:
[0048]步骤201、主设备将自身的所有跨设备聚合口状态信息通过保活链路发送到备设备,并根据自身的所有跨设备聚合口状态信息判断自身是否存在连通的上下行链路。
[0049]本实施例中,主设备将自身的跨设备聚合口状态信息携带在keepalive报文进行发送,以实现自身的跨设备聚合口状态信息通告。跨设备聚合口状态信息包括聚合口状态和上下行标识,其中,聚合口状态包括工作(UP)、故障(DOWN)两种取值,上下行标识包括上行标志(表示聚合口为上行口)和下行标志(表示聚合口为下行口)两种取值。
[0050]当主设备中同时存在处于UP状态的上行跨设备聚合口以及下行跨设备聚合口时,主设备可以通过该上行跨设备聚合口转发和下行跨设备聚合口进行流量转发,因此存在连通的上下行链路。
[0051]因此,主设备根据自身的所有跨设备聚合口状态信息判断自身是否存在连通的上下行链路的方法具体可以为:如果主设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定主设备存在连通的上下行链路,否则,确定主设备不存在连通的上下行链路。
[0052]步骤202、主设备接收备设备通告的所有跨设备聚合口状态信息,并根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路。
[0053]当备设备中同时存在处于UP状态的上行跨设备聚合口以及下行跨设备聚合口时,备设备可以通过该上行跨设备聚合口转发和下行跨设备聚合口进行流量转发,因此存在连通的上下行链路。
[0054]因此,主设备根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路的方法具体可以为:如果备设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定备设备存在连通的上下行链路,否则,确定备设备不存在连通的上下行链路。
[0055]步骤203、主设备判定主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路时,与备设备进行角色选举协商以切换主设备和备设备的主备角色,并在主设备切换为备设备后shutdown自身的所有跨设备聚合口。
[0056]参见图3,图3是本发明实施例二故障处理方法流程图,该方法应用于跨设备聚合中的备设备,备设备与主设备之间的ISC链路故障且保活链路连通,如图3所示,该方法主要包括以下步骤:
[0057]步骤301、备设备将自身的所有跨设备聚合口状态信息通过保活链路发送到主设备,并根据自身的所有跨设备聚合口状态信息判断自身是否存在连通的上下行链路。
[0058]本实施例中,备设备将自身的跨设备聚合口状态信息携带在keepalive报文进行发送,以实现自身的跨设备聚合口状态信息通告。跨设备聚合口状态信息包括聚合口状态和上下行标识,其中,聚合口状态包括工作(UP)、故障(DOWN)两种取值,上下行标识包括上行标志(表示聚合口为上行口)和下行标志(表示聚合口为下行口)两种取值。
[0059]当备设备中同时存在处于UP状态的上行跨设备聚合口以及下行跨设备聚合口时,备设备可以通过该上行跨设备聚合口转发和下行跨设备聚合口进行流量转发,因此存在连通的上下行链路。
[0060]因此,备设备根据自身的所有跨设备聚合口状态信息判断自身是否存在连通的上下行链路的方法具体可以为:如果备设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定备设备存在连通的上下行链路,否则,确定备设备不存在连通的上下行链路。
[0061 ] 步骤302、备设备接收主设备通告的所有跨设备聚合口状态信息,并根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路。
[0062]当主设备中同时存在处于UP状态的上行跨设备聚合口以及下行跨设备聚合口时,主设备可以通过该上行跨设备聚合口转发和下行跨设备聚合口进行流量转发,因此存在连通的上下行链路。
[0063]因此,备设备根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路的方法具体可以为:如果主设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定主设备存在连通的上下行链路,否则,确定主设备不存在连通的上下行链路。
[0064]步骤303、备设备判定备设备上存在连通的上下行链路且主设备上不存在连通的上下行链路时,与主设备进行角色选举协商以切换主设备和备设备的主备角色,并在备设备切换为备设备后恢复自身的被shutdown所有跨设备聚合口。
[0065]在图2和图3所示本发明实施例中,当主设备与备设备之间的ISC链路故障且保活链路连通时,主设备和备设备可能均存在连通的上下行链路,此时,可采用与现有技术相同的操作,主设备仍保持为主设备,备设备仍保持为备设备并shutdown自身的所有跨设备聚合口。然而,如果备设备上存在数量较多的连通的上下行链路时,其流量转发能力可能会比较强,因此,此时也可以考虑切换主设备和备设备的主备角色,使主设备切换为备设备并shutdown自身的所有跨设备聚合口,备设备切换为主设备并恢复自身的被shutdown的所有跨设备聚合口,从而保证跨设备聚合的流量转发能力最优。
[0066]将主设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为主设备上连通的上下行链路数量,将备设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为备设备上连通的上下行链路数量。通过比较主设备和备设备上连通的上下行链路数量的多少来确定转发能力较强的设备,如果确定备设备的转发能力较强,则可以在主设备和备设备之间进行主备角色切换。
[0067]跨设备聚合的两台设备之间是通过聚合优先级来确定主备角色的,聚合优先级较高的作为主设备,聚合优先级较低的作为备设备。因此,要在主设备和备设备之间进行主备角色切换,可以通过降低主设备的聚合优先级或提高备设备的聚合优先级,然后重新在主设备和备设备之间进行角色选举协商,从而实现主设备和备设备的主备角色切换。
[0068]可以由主设备发起角色选举协商过程,也可以由备设备发起角色选举协商过程,以便切换主设备和备设备之间的主备角色。
[0069]其中,
[0070]由主设备发起角色选举协商过程时,主设备可以将自身的聚合优先级降低至小于备设备的聚合优先级,然后向备设备发送角色选举协商通知以发起角色选举协商过程,备设备据此通知开始与主设备进行角色选举协商。
[0071]由备设备发起角色选举协商过程时,备设备可以将自身的聚合优先级提高至大于主设备的聚合优先级,然后向主设备发送角色选举协商通知以发起角色选举协商过程,主设备据此通知开始与备设备进行角色选举协商。
[0072]这里,主设备和备设备之间的角色选举协商过程与现有技术相同,不再赘述。
[0073]下面以图4和图5为例,对图2和图3所示本发明实施例进行举例说明。
[0074]参见图4,图4是本发明实施例一种跨设备聚合组网示意图,如图4所示,设备Al和设备Dl通过由设备BI和设备Cl组成的跨设备聚合相连,在由设备BI和设备Cl组成的跨设备聚合中,设备BI为主设备,设备Cl为备设备。
[0075]假设设备BI和设备Cl之间的ISC链路故障且包括链路连通,则,
[0076]按照图2和图3所示方法,设备BI会将自身的所有跨设备聚合口信息(包括上行口 Eth2/01、下行口 Eth2/02)携带在ke印alive报文中发送到设备Cl,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路。同时,设备Cl也会将自身的所有跨设备聚合口信息(包括上行口 Eth3/01、下行口 Eth3/02)携带在ke印al i ve报文中发送到设备BI,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路。
[0077]按照图2所示方法,设备BI接收到设备Cl的所有跨设备聚合口信息后,根据设备Cl的所有跨设备聚合口信息确定设备Cl上存在连通的上下行链路。由于设备BI和设备Cl均存在连通的上下行链路且数量相同,因此设备B仍保持为主设备。
[0078]按照图3所示方法,设备Cl接收到设备BI的所有跨设备聚合口信息后,根据设备BI的所有跨设备聚合口信息确定设备BI上存在连通的上下行链路。由于设备BI和设备Cl均存在连通的上下行链路且数量相同,因此设备Cl仍保持为备设备,并shutdown自身的所有跨设备聚合口。
[0079]至此,设备BI作为主设备,设备Cl作为备设备,且设备BI负责跨设备聚合的所有流量转发。
[0080]假设某一时刻,设备BI与设备Al之间的链路DOWN,跨设备聚合口 Eth2/0/l的状态变为DOWN,则,
[0081]按照图2和图3所示方法,设备BI会将自身的所有跨设备聚合口信息(包括上行口 Eth2/0/l、下行口 Eth2/0/2)携带在ke印alive报文中发送到设备Cl,并根据自身的所有跨设备聚合口信息确定不存在连通的上下行链路。同时,设备Cl也会将自身的所有跨设备聚合口信息(包括上行口 Eth3/0/l、下行口 Eth3/0/2)携带在ke印alive报文中发送到设备BI,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路。
[0082]按照图2所示方法,设备BI接收到设备Cl的所有跨设备聚合口信息后,根据设备Cl的所有跨设备聚合口信息确定设备Cl上存在连通的上下行链路。由于设备BI不存在连通的上下行链路,且设备Cl均存在连通的上下行链路,因此设备BI与设备Cl进行角色选举协商以切换主设备和备设备的主备角色,并在设备BI切换为备设备后shutdown自身的所有跨设备聚合口。
[0083]按照图3所示方法,设备Cl接收到设备BI的所有跨设备聚合口信息后,根据设备BI的所有跨设备聚合口信息确定设备BI上不存在连通的上下行链路。由于设备BI上不存在连通的上下行链路,且设备Cl上存在连通的上下行链路且数量相同,因此设备Cl与设备BI进行角色选举协商以切换主设备和备设备的主备角色,并在设备Cl切换为主设备后恢复自身被shutdown的所有跨设备聚合口。
[0084]至此,设备BI作为备设备,设备Cl作为主设备,且设备Cl负责跨设备聚合的所有流量转发。
[0085]参见图5,图5是本发明实施例另一跨设备聚合组网示意图,如图5所示,设备Al和设备Dl及设备El通过由设备BI和设备Cl组成的跨设备聚合相连,在由设备BI和设备Cl组成的跨设备聚合中,设备BI为主设备,设备Cl为备设备。
[0086]假设设备BI和设备Cl之间的ISC链路故障且包括链路连通,则,
[0087]按照图2和图3所示方法,设备BI会将自身的所有跨设备聚合口信息(包括上行口 Eth2/0/l、下行口 Eth2/0/2、下行口 Eth2/0/3)携带在ke印alive报文中发送到设备Cl,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路。同时,设备Cl也会将自身的所有跨设备聚合口信息(包括上行口 Eth3/0/l、下行口 Eth3/0/2、下行口 Eth3/0/3)携带在keepalive报文中发送到设备BI,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路。
[0088]按照图2所示方法,设备BI接收到设备Cl的所有跨设备聚合口信息后,根据设备Cl的所有跨设备聚合口信息确定设备Cl上存在连通的上下行链路。由于设备BI和设备Cl均存在连通的上下行链路且数量相同,因此设备B仍保持为主设备。
[0089]按照图3所示方法,设备Cl接收到设备BI的所有跨设备聚合口信息后,根据设备BI的所有跨设备聚合口信息确定设备BI上存在连通的上下行链路。由于设备BI和设备Cl均存在连通的上下行链路且数量相同,因此设备Cl仍保持为备设备,并shutdown自身的所有跨设备聚合口。
[0090]至此,设备BI作为主设备,设备Cl作为备设备,且设备BI负责跨设备聚合的所有流量转发。
[0091]假设某一时刻,设备BI与设备Dl之间的链路DOWN,跨设备聚合口 Eth2/0/2的状态变为D0WN,则,
[0092]按照图2和图3所示方法,设备BI会将自身的所有跨设备聚合口信息(包括上行口 Eth2/0/l、下行口 Eth2/0/2、下行口 Eth2/0/3)携带在keepalive报文中发送到设备Cl,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路(I条连通的上下行链路)。同时,设备Cl也会将自身的所有跨设备聚合口信息(包括上行口 Eth3/0/l、下行口 Eth3/0/2、下行口 Eth3/0/3)携带在ke印alive报文中发送到设备BI,并根据自身的所有跨设备聚合口信息确定存在连通的上下行链路(2条连通的上下行链路)。
[0093]按照图2所示方法,设备BI接收到设备Cl的所有跨设备聚合口信息后,根据设备Cl的所有跨设备聚合口信息确定设备Cl上存在连通的上下行链路。由于设备BI和设备Cl均存在连通的上下行链路,且设备BI上连通的上下行链路数量小于设备Cl上连通的上下行链路数量,因此设备BI可以根据预先确定的策略选择继续保持为主设备,或者选择与设备Cl进行角色选举协商以切换主设备和备设备的主备角色,并在设备BI切换为备设备后shutdown自身的所有跨设备聚合口。
[0094]按照图3所示方法,设备Cl接收到设备BI的所有跨设备聚合口信息后,根据设备BI的所有跨设备聚合口信息确定设备BI上存在连通的上下行链路。由于设备BI和设备Cl均存在连通的上下行链路,且设备BI上连通的上下行链路数量小于设备Cl上连通的上下行链路数量,因此设备Cl可以根据预先确定的策略选择继续保持为备设备并关闭自身的所有跨设备聚合口,或者选择与设备BI进行角色选举协商以切换主设备和备设备的主备角色,并在设备Cl切换为主设备后恢复自身的被shutdown的所有跨设备聚合口。
[0095]这里,预先约定的策略是指:当主设备和备设备上均存在连通的上下行链路且主设备上连通的上下行链路数量小于备设备上连通的上下行链路数量时,可以预先预定实施以下两种方法中的任意一种:a、继续保持主设备和备设备的主备角色不变且备设备shutdown自身的所有跨设备聚合口 ;b、切换主设备和备设备的主备角色,并且,主设备切换为备设备后shutdown自身的所有跨设备聚合口,备设备切换为主设备后恢复自身被shutdown的所有跨设备聚合口。
[0096]至此,设备BI作为备设备,设备Cl作为主设备,且设备Cl负责跨设备聚合的所有流量转发。
[0097]以上对本发明实施例应用于跨设备聚合中的主设备的故障处理方法、以及应用于跨设备聚合中的被设备的故障处理方法进行了详细说明,基于以上说明,本发明提供了一种应用于跨设备聚合中的主设备或备设备的故障处理方法,下面结合图6进行说明。
[0098]参见图6,图6是本发明实施例故障处理方法流程图,该方法应用于跨设备聚合中的主设备或备设备,主设备与跨设备聚合中的备设备之间的ISC链路故障且保活链路连通;如图6所示,该方法包括以下步骤:
[0099]步骤601、将当前设备的所有跨设备聚合口状态信息通过保活链路通告到跨设备聚合中的对端设备,并根据当前设备的所有跨设备聚合口状态信息判断当前设备是否存在连通的上下行链路。
[0100]步骤602、接收对端设备通告的所有跨设备聚合口状态信息,并根据对端设备的所有跨设备聚合口状态信息判断对端设备是否存在连通的上下行链路。
[0101]步骤601和步骤602不分先后顺序。
[0102]步骤603、当前设备作为主设备,若当前设备上不存在连通的上下行链路且对端设备上存在连通的上下行链路,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为备设备后关闭shutdown自身的所有跨设备聚合口。
[0103]步骤604、当前设备作为备设备,若当前设备上存在连通的上下行链路且对端设备上不存在连通的上下行链路,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
[0104]图6所示方法进一步包括:
[0105]如果当前设备为主设备,则若当前设备和对端设备上均存在连通的上下行链路且当前设备上连通的上下行链路数量少于对端设备上连通的上下行链路数量,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备设备切换为备设备后shutdown自身的所有跨设备聚合口 ;
[0106]如果当前设备为备设备,则若当前设备和对端设备上均存在连通的上下行链路且当前设备上连通的上下行链路数量多于对端设备上连通的上下行链路数量,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
[0107]图6所示方法中,
[0108]所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志;
[0109]计算设备上连通的上下行链路数量的方法为:将该设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为该设备上连通的上下行链路数量。
[0110]图6所示方法中,
[0111]所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志;
[0112]根据设备的所有跨设备聚合口状态信息判断该设备是否存在连通的上下行链路的方法为:如果该设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定该设备存在连通的上下行链路,否则,确定该设备不存在连通的上下行链路。
[0113]图6所示方法中,
[0114]当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色的方法为:
[0115]如果当前设备为主设备,则当前设备将自身的聚合优先级降低至小于对端设备的聚合优先级,并向对端设备发送角色选举协商通知,以发起与对端设备之间的角色选举协商过程;或者,接收对端设备增加对端设备的聚合优先级至大于当前设备的聚合优先级后发送的角色选举协商通知,开始与对端设备进行角色选举协商;
[0116]如果当前设备为主设备,则当前设备将自身的聚合优先级增加至大于对端设备的聚合优先级,并向对端设备发送角色选举协商通知,以发起与对端设备之间的角色选举协商过程;或者,接收对端设备降低对端设备的聚合优先级至小于当前设备的聚合优先级后发送的角色选举协商通知,开始与对端设备进行角色选举协商。
[0117]本发明还提供了一种应用于跨设备聚合中的主设备的故障处理装置和一种应用于跨设备聚合中的备设备的故障处理装置,下面结合图7、图8进行详细说明。
[0118]参见图7,图7是本发明实施例一故障处理装置的结构示意图,该装置应用于跨设备聚合中的主设备,主设备与跨设备聚合中的备设备之间的ISC链路故障且保活链路连通,如图7所示,该装置包括:发送单元701、接收单元702、判断单元703、切换单元704 ;其中,
[0119]发送单元701,用于将主设备的所有跨设备聚合口状态信息通过保活链路通告到备设备,并通知判断单元703判断主设备是否存在连通的上下行链路;
[0120]接收单元702,用于接收备设备通告的所有跨设备聚合口状态信息;
[0121]判断单元703,用于接收发送单元701的通知,根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路;用于接收单元702接收到备设备通告的所有跨设备聚合口状态信息时,根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路;
[0122]切换单元704,用于如果判断单元703判定主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路,则与备设备进行角色选举协商以切换主设备和备设备的主备角色,并在主设备切换为备设备后shutdown主设备的所有跨设备聚合口。
[0123]图7所示装置中,
[0124]所述切换单元704,进一步用于如果判断单元703判定主设备和备设备上均存在连通的上下行链路且主设备上连通的上下行链路数量少于备设备上连通的上下行链路数量,则与备设备进行角色选举协商以切换主设备和备设备的主备角色,并在主设备切换为备设备后shutdown主设备的所有跨设备聚合口。
[0125]图7所示装置中,
[0126]所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志;
[0127]所述判断单元703计算设备上连通的上下行链路数量时,用于:将该设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为该设备上连通的上下行链路数量。
[0128]图7所示装置中,
[0129]所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志;
[0130]所述判断单元703根据设备的所有跨设备聚合口状态信息判断该设备是否存在连通的上下行链路时,用于:如果该设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定该设备存在连通的上下行链路,否则,确定该设备不存在连通的上下行链路。
[0131]图7所示装置中,
[0132]所述切换单元704与备设备进行角色选举协商以切换主设备和备设备的主备角色时,用于:将主设备的聚合优先级降低至小于备设备的聚合优先级,并向备设备发送角色选举协商通知,以发起与备设备之间的角色选举协商过程;或者,接收备设备增加备设备的聚合优先级至大于主设备的聚合优先级后发送的角色选举协商通知时,开始与备设备进行角色选举协商。
[0133]参见图8,图8是本发明实施例二故障处理装置的结构示意图,应用于跨设备聚合中的备设备,备设备与跨设备聚合中的主设备之间的ISC链路故障且保活链路连通,如图8所示,该装置包括:发送单元801、接收单元802、判断单元803、切换单元804 ;其中,
[0134]发送单元801,用于将备设备的所有跨设备聚合口状态信息通过保活链路通告到主设备,并通知判断单元803判断备设备是否存在连通的上下行链路;,并
[0135]接收单元802,用于接收主设备通告的所有跨设备聚合口状态信息;
[0136]判断单元803,用于接收发送单元801的通知,根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路;用于接收单元802接收到主设备通告的所有跨设备聚合口状态信息时,根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路;
[0137]切换单元804,用于如果判断单元803判定备设备上存在连通的上下行链路且主设备上不存在连通的上下行链路,则与主设备进行角色选举协商以切换主设备和备设备的主备角色,并在备设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
[0138]图8所示装置中,
[0139]所述切换单元804,进一步用于如果判断单元803判定备设备和主设备上均存在连通的上下行链路且备设备上连通的上下行链路数量多于主设备上连通的上下行链路数量,则与主设备进行角色选举协商以切换主设备和备设备的主备角色,并在备设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
[0140]图8所示装置中,
[0141]所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志;
[0142]所述判断单元803根据设备的所有跨设备聚合口状态信息判断该设备是否存在连通的上下行链路时,用于:如果该设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定该设备存在连通的上下行链路,否则,确定该设备不存在连通的上下行链路。
[0143]图8所示装置中,
[0144]所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志;
[0145]所述判断单元803计算设备上连通的上下行链路数量时,用于:将该设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为该设备上连通的上下行链路数量。
[0146]图8所示装置中,
[0147]所述切换单元804与主设备进行协商以更换主设备和备设备的主备角色时,用于:
[0148]将备设备的聚合优先级增加至大于主设备的聚合优先级,并向主设备发送角色选举协商通知,以发起与主设备之间的角色选举协商过程;或者,接收主设备降低主设备的聚合优先级至小于备设备的聚合优先级后发送的角色选举协商通知,开始与主设备进行角色选举协商。
[0149]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【权利要求】
1.一种故障处理方法,应用于跨设备聚合中的主设备或备设备,其特征在于,主设备与跨设备聚合中的备设备之间的ISC链路故障且保活链路连通,该方法包括: 将当前设备的所有跨设备聚合口状态信息通过保活链路通告到跨设备聚合中的对端设备,并根据当前设备的所有跨设备聚合口状态信息判断当前设备是否存在连通的上下行链路; 接收对端设备通告的所有跨设备聚合口状态信息,并根据对端设备的所有跨设备聚合口状态信息判断对端设备是否存在连通的上下行链路; 如果当前设备为主设备,若当前设备上不存在连通的上下行链路且对端设备上存在连通的上下行链路,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为备设备后关闭shutdown自身的所有跨设备聚合口 ; 如果当前设备为备设备,若当前设备上存在连通的上下行链路且对端设备上不存在连通的上下行链路,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
2.根据权利要求1所述的方法,其特征在于,该方法进一步包括: 如果当前设备为主设备,则若当前设备和对端设备上均存在连通的上下行链路且当前设备上连通的上下行链路数量少于对端设备上连通的上下行链路数量,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备设备切换为备设备后shutdown自身的所有跨设备聚合口 ; 如果当前设备为备设备,则若当前设备和对端设备上均存在连通的上下行链路且当前设备上连通的上下行链路数量多于对端设备上连通的上下行链路数量,则当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色,并在当前设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
3.根据权利要求2所述的方法,其特征在于, 所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志; 计算设备上连通的上下行链路数量的方法为:将该设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为该设备上连通的上下行链路数量。
4.根据权利要求1或2所述的方法,其特征在于, 所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志; 根据设备的所有跨设备聚合口状态信息判断该设备是否存在连通的上下行链路的方法为:如果该设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定该设备存在连通的上下行链路,否则,确定该设备不存在连通的上下行链路。
5.根据权利要求1或2所述的方法,其特征在于, 当前设备与对端设备进行角色选举协商以切换主设备和备设备的主备角色的方法为: 如果当前设备为主设备,则当前设备将自身的聚合优先级降低至小于对端设备的聚合优先级,并向对端设备发送角色选举协商通知,以发起与对端设备之间的角色选举协商过程;或者,接收对端设备增加对端设备的聚合优先级至大于当前设备的聚合优先级后发送的角色选举协商通知,开始与对端设备进行角色选举协商; 如果当前设备为主设备,则当前设备将自身的聚合优先级增加至大于对端设备的聚合优先级,并向对端设备发送角色选举协商通知,以发起与对端设备之间的角色选举协商过程;或者,接收对端设备降低对端设备的聚合优先级至小于当前设备的聚合优先级后发送的角色选举协商通知,开始与对端设备进行角色选举协商。
6.一种故障处理装置,应用于跨设备聚合中的主设备,其特征在于,主设备与跨设备聚合中的备设备之间的ISC链路故障且保活链路连通,该装置包括:发送单元、接收单元、判断单元、切换单元; 所述发送单元,用于将将主设备的所有跨设备聚合口状态信息通过保活链路通告到备设备,并通知判断单元判断主设备是否存在连通的上下行链路; 所述接收单元,用于接收备设备通告的所有跨设备聚合口状态信息; 所述判断单元,用于接收发送单元的通知,根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路;用于接收单元接收到备设备通告的所有跨设备聚合口状态信息时,根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路; 所述切换单元,用于如果判断单元判定主设备上不存在连通的上下行链路且备设备上存在连通的上下行链路,则与备设备进行角色选举协商以切换主设备和备设备的主备角色,并在主设备切换为备设备后关闭shutdown主设备的所有跨设备聚合口。
7.根据权利要求6所述的装置,其特征在于, 所述切换单元,进一步用于如果判断单元判定主设备和备设备上均存在连通的上下行链路且主设备上连通的上下行链路数量少于备设备上连通的上下行链路数量,则与备设备进行角色选举协商以切换主设备和备设备的主备角色,并在主设备切换为备设备后shutdown主设备的所有跨设备聚合口。
8.根据权利要求7所述的装置,其特征在于, 所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志; 所述判断单元计算设备上连通的上下行链路数量时,用于:将该设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为该设备上连通的上下行链路数量。
9.根据权利要求6或7所述的装置,其特征在于, 所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志; 所述判断单元根据设备的所有跨设备聚合口状态信息判断该设备是否存在连通的上下行链路时,用于:如果该设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定该设备存在连通的上下行链路,否则,确定该设备不存在连通的上下行链路。
10.根据权利要求6或7所述的装置,其特征在于, 所述切换单元与备设备进行角色选举协商以切换主设备和备设备的主备角色时,用于:将主设备的聚合优先级降低至小于备设备的聚合优先级,并向备设备发送角色选举协商通知,以发起与备设备之间的角色选举协商过程;或者,接收备设备增加备设备的聚合优先级至大于主设备的聚合优先级后发送的角色选举协商通知时,开始与备设备进行角色选举协商。
11.一种故障处理装置,应用于跨设备聚合中的备设备,其特征在于,备设备与跨设备聚合中的主设备之间的ISC链路故障且保活链路连通,该装置包括:发送单元、接收单元、判断单元、切换单元; 所述发送单元,用于将备设备的所有跨设备聚合口状态信息通过保活链路通告到主设备,并通知判断单元判断备设备是否存在连通的上下行链路;,并 所述接收单元,用于接收主设备通告的所有跨设备聚合口状态信息; 所述判断单元,用于接收发送单元的通知,根据备设备的所有跨设备聚合口状态信息判断备设备是否存在连通的上下行链路;用于接收单元接收到主设备通告的所有跨设备聚合口状态信息时,根据主设备的所有跨设备聚合口状态信息判断主设备是否存在连通的上下行链路; 所述切换单元,用于如果判断单元判定备设备上存在连通的上下行链路且主设备上不存在连通的上下行链路,则与主设备进行角色选举协商以切换主设备和备设备的主备角色,并在备设备切换为主设备后恢复被关闭shutdown的所有跨设备聚合口。
12.根据权利要求11所述的装置,其特征在于, 所述切换单元,进一步用于如果判断单元判定备设备和主设备上均存在连通的上下行链路且备设备上连通的上下行链路数量多于主设备上连通的上下行链路数量,则与主设备进行角色选举协商以切换主设备和备设备的主备角色,并在备设备切换为主设备后恢复被shutdown的所有跨设备聚合口。
13.根据权利要求11或12所述的装置,其特征在于, 所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志; 所述判断单元根据设备的所有跨设备聚合口状态信息判断该设备是否存在连通的上下行链路时,用于:如果该设备中同时存在处于工作UP状态的上行跨设备聚合口和下行跨设备聚合口,则确定该设备存在连通的上下行链路,否则,确定该设备不存在连通的上下行链路。
14.根据权利要求12所述的装置,其特征在于, 所述跨设备聚合口状态信息包括:聚合口状态、上下行标识;所述聚合口状态包括工作UP、故障Down ;所述上下行标识包括上行口标志、下行口标志; 所述判断单元计算设备上连通的上下行链路数量时,用于:将该设备上处于UP状态的上行跨设备聚合口数量和下行跨设备聚合口数量的乘积作为该设备上连通的上下行链路数量。
15.根据权利要求11或12所述的装置,其特征在于, 所述切换单元与主设备进行协商以更换主设备和备设备的主备角色时,用于: 将备设备的聚合优先级增加至大于主设备的聚合优先级,并向主设备发送角色选举协商通知,以发起与主设备之间的角色选举协商过程;或者,接收主设备降低主设备的聚合优先级至小于备设备的聚合优先级后发送的角色选举协商通知,开始与主设备进行角色选举协商。
【文档编号】H04L12/24GK104333470SQ201410647899
【公开日】2015年2月4日 申请日期:2014年11月14日 优先权日:2014年11月14日
【发明者】汪萌, 王波 申请人:杭州华三通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1