一种组播业务的故障处理方法和装置制造方法

文档序号:7815691阅读:272来源:国知局
一种组播业务的故障处理方法和装置制造方法
【专利摘要】本发明实施例提供了一种组播业务的故障处理方法和装置,涉及通信【技术领域】,解决了E-BSR上运行的PIM-SM协议发生故障后,PIM-SM协议未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。所述方法包括:主管理板确定是否进行优雅重启;若确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PIM Hello报文的数据信息;发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。本发明实施例提供的方法可用于组播网络的数据传输。
【专利说明】—种组播业务的故障处理方法和装置

【技术领域】
[0001]本发明涉及通信【技术领域】,尤其涉及一种组播业务的故障处理方法和装置。

【背景技术】
[0002]组播是一种点到多点的IP传输技术,其基本思想是:当组播源发送组播报文给某一组播组时,只需要发送一份组播报文,就可以使该组播组内的所有网络节点收到相同的组播报文。组播的这种特点可以有效的节省网络带宽、降低网络负载。目前,稀疏模式协议无关组播协议(Protocol Independent Multicast-Sparse Mode,简称PIM-SM)因其良好的扩展性成为组播网络中应用最广泛的路由协议之一。如图1所示为PIM-SM组播网络的基本架构图。其中,路由器A为源端指定路由器(Designated Router,简称DR),路由器B为会聚点(Rendezvous Point,简称RP),路由器C和路由器D为接收端DR,接收者A和接收者B为某一组播组内的主机。
[0003]如图1所示PIM-SM组播网络中报文的传输过程为:路由器C和路由器D首先通过 Internet 组管理协议(Internet Group Management Protocol,简称 IGMP)管理接收端的用户并向路由器B发起加入某个组播组的请求,以建立共享树;然后,组播源发送组播报文,当组播报文到达路由器A时,路由器A根据组播组的地址找到对应的路由器B,并将组播报文封装成注册报文单播到路由器B ;路由器B接收到该注册报文后,解封装这个注册报文,取出其中的组播报文并沿着生成好的共享树将该组播报文转发至接收者A和接收者B ;最后,收到该注册报文的路由器B向路由器A发送加入请求,建立最短路径树;当最短路径树建立完成后,组播报文就可以沿着最短路径树不加封装的发送到路由器B,直到路由器B收到未封装的组播报文时,停止封装组播报文。此后,组播报文就可以沿着建立好的最短路径树发送给路由器B,再由路由器B沿着共享树将组播报文发送给接收者。
[0004]从上述PM-SM组播网络中报文的传输过程可以看出,RP是组播报文转发的核心设备,它承载着组播报文的汇聚。为此,现有PIM-SM协议对RP的选举提供了一套选举机制,该选举机制具体为:在PM-SM组播网络中配置多个候选自举路由器(Candidate-BSR,简称C-BSR),各个C-BSR通过逐跳扩散的方式将自身的信息,如IP地址、优先级等信息告知PIM-SM组播网络中的其他路由器,收到该信息的C-BSR路由器根据自身运行的PIM-SM协议中的选举算法,选举出最优的自举路由器(Elected-BSR,简称E-BSR)。同时,还需要在PM-SM组播网络中配置多个候选汇聚点(Candidate-RP,简称C-RP),这些C-RP自举向E-BSR单播广告报文,该广告报文中包含C-RP的地址以及C-RP可以服务的组播地址。E-BSR将这些发送过来的报文汇集为一个RP集(RP-Set)并封装在E-BSR的自举报文(BootstrapMessage,简称BSM)中并逐跳扩散到各个路由器。此时,每个路由器都保存有同样的RP集。当源端路由器收到组播报文后,根据自身运行的PIM-SM协议中的RP的选举算法获得为该组播报文服务的RP,然后按照图1中所示的报文传输过程转发该组播报文。
[0005]从上述选举机制中可以得出,为了选举出合适的RP,就需要网络中的E-BSR能够可靠工作;一旦网络中的E-BSR上运行的PM-SM协议发生故障,就无法选举出合适的RP,进而无法进行报文的传输,导致组播报文转发断流。目前,为了解决E-BSR上运行的PIM-SM协议在故障期间带来的组播报文转发断流的问题,可以采用优雅重启技术以对运行在E-BSR上运行的PM-SM协议进行重启,以恢复PM-SM协议发生的故障。但PM-SM协议的优雅重启过程,需要在指定的时间(即邻居设备协议状态的保活时间)内维持邻居设备的协议状态,如果优雅重启不能在这个指定的时间内完成,邻居设备的协议状态就会失效,最终导致组播报文转发断流。


【发明内容】

[0006]本发明实施例提供一种组播业务的故障处理方法和装置,用以解决E-BSR上议运的PIM-SM协行发生故障后,PIM-SM协议未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。
[0007]为达到上述目的,本发明的实施例采用如下技术方案:
[0008]第一方面,本发明实施例提供了一种组播业务的故障处理方法,包括:
[0009]主管理板确定是否进行优雅重启;
[0010]若确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PM Hello报文的数据信息;
[0011]发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0012]可选的,所述方法还包括:确定所述优雅重启是否结束;
[0013]若所述优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息。
[0014]可选的,所述方法还包括:接收从管理板发送的故障探测报文;
[0015]若所述主管理板未发生故障时,发送应答报文给所述从管理板。
[0016]可选的,所述方法还包括:发送存储的所述第一数据信息或所述第二数据信息给所述从管理板,以使得所述从管理板存储所述第一数据信息或第二数据信息。
[0017]第二方面,本发明实施例提供了一种组播业务的故障处理方法,包括:
[0018]根据预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息,所述预先存储的数据信息为主管理板发送的;
[0019]发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0020]可选的,所述根据预先存储的数据信息构造报文之前,所述方法还包括:
[0021]接收设备管理器发送的切换消息;或者,
[0022]发送故障探测报文给所述主管理板;若在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
[0023]可选的,所述确定所述主管理板发生故障之后,所述方法还包括:
[0024]停止故障保活定时器,并继续发送所述故障探测报文给所述主管理板,直至接收到所述主管理板发送的应答报文,则停止构造报文,并启动故障保活定时器。
[0025]第三方面,本发明实施例提供了一种主管理板,包括:
[0026]确定模块,用于确定是否进行优雅重启;
[0027]构造模块,用于若所述确定模块确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PIM Hello报文的数据信息;
[0028]发送模块,用于发送所述构造模块构造的报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0029]可选的,所述主管理板还包括:存储模块;
[0030]所述确定模块,还用于确定所述优雅重启是否结束;
[0031]所述存储模块,用于若所述确定模块确定优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息。
[0032]可选的,所述主管理板还包括:接收模块;
[0033]所述接收模块,用于接收从管理板发送的故障探测报文;
[0034]所述发送模块,还用于若所述主管理板未发生故障时,发送应答报文给所述从管理板。
[0035]可选的,所述发送模块,还用于发送存储的所述第一数据信息或所述第二数据信息给所述从管理板,以使得所述从管理板存储所述第一数据信息或所述第二数据信息。
[0036]第四方面,本发明实施例提供了一种从管理板,包括:
[0037]构造模块,用于根据预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息,所述预先存储的数据信息为主管理板发送的;
[0038]发送模块,用于发送所述构造模块构造的报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0039]可选的,所述从管理板还包括:接收模块;
[0040]所述接收模块,用于在所述构造模块根据预先存储的数据信息构造报文之前,接收设备管理器发送的切换消息;或者,
[0041]所述发送模块,还用于发送故障探测报文给主管理板;
[0042]所述确定模块,还用于若所述接收模块在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
[0043]可选的,所述从管理板还包括:处理模块;
[0044]所述处理模块,用于在所述确定模块确定所述主管理板发生故障之后,停止故障保活定时器;
[0045]所述发送模块,还用于在所述处理模块停止故障保活定时器时,发送所述故障探测报文给所述主管理板,直至所述接收模块接收到所述主管理板发送的应答报文;
[0046]所述构造模块,还用于在所述接收模块接收到所述应答报文时停止构造报文,所述处理模块,还用于启动故障保活定时器。
[0047]本发明实施例提供的一种组播业务故障的处理方法和装置,当主管理板上运行的PIM-SM协议发生故障,需要对PM-SM协议进行优雅重启时,主管理板可以根据自身预先存储的第一数据信息构造报文;其中,第一数据信息包括C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息;构造的报文为BSM报文和PIM Hello报文。通过将根据预先存储的第一数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,及时更新邻居设备的协议状态和邻居状态。这样,即使PIM-SM协议在运行中发生故障,未能在指定的时间内完成优雅重启,主管理板依然能够根据预先存储的数据信息构造并发送BSM报文和PIM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期。所以,由于E-BSR保活时间和PIM Hello邻居保活时间未超期,故障的E-BSR的仍然能够完成RP的选举,保证组播报文可以正确转发。解决了 E-BSR上运行的PM-SM协议发生故障后,PIM-SM协议未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。

【专利附图】

【附图说明】
[0048]为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049]图1为现有技术中PM-SM组播网络的基本架构图;
[0050]图2为本发明实施例提供的一种组播业务的故障处理方法的流程图;
[0051]图3为本发明实施例提供的另一种组播业务的故障处理方法的流程图;
[0052]图4为本发明实施例提供的另一种组播业务的故障处理方法流程图;
[0053]图5为本发明实施例提供的另一种组播业务的故障处理方法流程图;
[0054]图6为本发明实施例提供的一种主管理板的结构示意图;
[0055]图7为本发明实施例提供的另一种主管理板的结构示意图;
[0056]图8为本发明实施例提供的一种从管理板的结构示意图;
[0057]图9为本发明实施例提供的另一种从管理板的结构示意图;
[0058]图10为本发明实施例提供的一种主管理板的实体装置示意图;
[0059]图11为本发明实施例提供的一种从管理板的实体装置示意图。

【具体实施方式】
[0060]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0061]实施例一
[0062]本发明实施例提供了一种组播业务的故障处理方法,该方法可用于采用主管理板设计方式的路由器,也可用于采用主从管理板设计方式的路由器。如图2所示,该方法包括:
[0063]步骤201、主管理板确定是否进行优雅重启。
[0064]其中,所述主管理板为E-BSR的主管理板,PIM-SM协议运行在E-BSR的主管理板上,那么,E-BSR的主管理板确定是否进行优雅重启,为E-BSR的主管理板确定其运行的PM-SM协议是否需要优雅重启。具体的,可以根据E-BSR主管理板上运行的PM-SM协议的实际运行情况来判断。若E-BSR主管理板上运行的PM-SM协议运行未发生故障,则PM-SM协议无需进行优雅重启;SE-BSR主管理板上运行的PM-SM协议发生故障,则说明PM-SM协议需要进行优雅重启。示例的,当PIM-SM协议在运行过程中,出现内存不足的故障时,主管理板可以根据该故障信息进行优雅重启。
[0065]步骤202、若确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PIM Hello报文的数据信息。
[0066]具体的,C-BSR的数据信息包括:BSR地址、BSR优先级、BSR角色和BSR状态。具体的,在知道网络中各个BSR地址和BSR优先级后,就可以根据PM-SM协议中的选举算法选举出E-BSR ;BSR角色是指将该路由器配置为C-BSR还是没有配置C-BSR ;BSR状态是指配置为C-BSR的路由器是否是E-BSR或C-BSR等。C-RP的数据信息包括:RP地址、其所属的RP-Set、RP优先级和RP保活时间。PM Hello报文的数据信息包括:接口身份标识(Generat1n Identity,简称Gen ID)、第二地址列表。其中,Gen ID表示邻居设备的身份信息,若Gen ID发生变化,说明邻居设备发生变化;第二地址列表用于查找下一跳的邻居设备。
[0067]步骤203、发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0068]结合步骤201-203所述的组播业务的故障处理方法,具体的,当E-BSR主管理板上运行的PM-SM协议发生故障,需要对PM-SM协议进行优雅重启时,主管理板可以根据预先存储的第一数据信息构造BSM报文和PIM Hello报文,通过将根据预先存储的第一数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,可以及时更新邻居设备的协议状态和邻居状态。这样,当组播报文到达因故障而正在重启的E-BSR时,主管理板可以根据更新的邻居设备的协议状态和邻居状态,继续转发组播报文,从而保证组播报文在转发的过程中不会出现断流。
[0069]可选的,如图3所示,在执行完步骤201-步骤203后,所述组播业务的故障处理方法还可以包括:
[0070]步骤204、确定所述优雅重启是否结束。
[0071]具体的,E-BSR的主管理板是否优雅重启结束,由E-BSR主管理板上运行的PM-SM协议是否完成收敛,也即PIM-SM协议故障是否恢复来确定。若PIM-SM协议故障恢复,说明优雅重启结束,则执行步骤205 ;若PIM-SM协议故障没有恢复,说明优雅重启没有结束,则继续执行步骤202-步骤204。
[0072]步骤205、若所述优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PMHello报文的数据信息。
[0073]其中,第一数据信息为主管理板优雅重启前,主管理板存储的C-BSR的数据信息、候选汇聚点C-RP的数据信息和PM Hello报文的数据信息。第二数据信息为主管理板优雅重启结束后,主管理板重新存储的C-BSR的数据信息、候选汇聚点C-RP的数据信息和PMHello报文的数据信息。
[0074]在主管理板上运行的PM-SM协议优雅重启结束后,可能会有部分数据丢失。例如,RP信息数据删除了,邻居设备信息删除了,或其他可能情况。此时,如果不更新预先存储的第一数据信息,就可能造成预先存储的第一数据信息与实际的数据信息,即第二数据信息不一致的情况。所以,主管理板需要将预先存储的第一数据信息删除,重新存储第二数据信息。这样,就可以保证主管理板存储的数据信息是正确无误的,进而能够保证主管理板利用这些数据信息构造的BSM报文和PIM Hello报文的正确性。
[0075]本发明实施例提供的一种组播业务故障的处理方法,当E-BSR主管理板上运行的PIM-SM协议发生故障,需要对PM-SM协议进行优雅重启时,此时,主管理板可以根据自身预先存储的第一数据信息构造报文;其中,第一数据信息包括C-BSR的数据信息、C-RP的数据信息和P頂Hello报文的数据信息;构造的报文为BSM报文和PIM Hello报文。通过将根据预先存储的第一数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,就可以及时更新邻居设备的协议状态和邻居状态。这样,即使E-BSR主管理板上运行的PM-SM协议发生故障后,PIM-SM协议未能在指定的时间内完成优雅重启,主管理板依然能够根据预先存储的数据信息构造并发送BSM报文和PIM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期。所以,由于E-BSR保活时间和PIM Hello邻居保活时间未超期,故障的E-BSR的仍然能够完成RP的选举,保证组播报文可以正确转发。解决了 E-BSR上运行的PM-SM协议发生故障后,PM-SM协议未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。
[0076]实施例二
[0077]本发明实施例提供的一种组播业务的故障处理方法,该方法应用于采用双管理板冗余设计方式的路由器,该双管理板包括主管理板和从管理板。如图4所示,当E-BSR主管理板上运行的PM-SM协议确定需要进行优雅重启时,可执行步骤401-步骤405,其中,步骤401-步骤405与实施例一中的步骤201-步骤205相同,具体可参考实施例一中的描述,在此不再赘述;进一步的,主管理板在进行优雅重启的同时,还执行步骤406-407。具体的,
[0078]步骤401、主管理板确定是否进行优雅重启。
[0079]步骤402、若确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PIM Hello报文的数据信息。
[0080]步骤403、发送所述报文给邻居设备,所述报文包括BSM报文和PM Hello报文。
[0081]步骤404、确定所述优雅重启是否结束。
[0082]若优雅重启结束,即PM-SM协议故障恢复,则执行步骤405 ;若优雅重启没有结束,即PIM-SM协议故障没有恢复,则继续执行步骤402-步骤404。
[0083]步骤405、若所述优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PMHello报文的数据信息。
[0084]步骤406、接收从管理板发送的故障探测报文。
[0085]其中,所述故障探测报文为从管理板根据预先存储的数据信息构造的,针对不同类型的协议功能,从管理板可以构造不同类型的故障探测报文。
[0086]步骤407、若所述主管理板未发生故障时,发送应答报文给所述从管理板。
[0087]具体的,主管理板接收从管理板发送的故障探测报文,并根据该故障探测报文判断自身的协议运行是否发生故障。若未发生故障,则主管理板发送应答报文给从管理板,这样,从管理板根据接收到的应答报文确定主管理板未发生故障;若发生故障,则主管理板不发送应答报文,这样,从管理板接收不到应答报文,从而确定主管理板发生故障。通过这种方法,从管理板就可以根据是否收到主管理板的发送的应答报文,来确定主管理板是否发生故障。
[0088]可选的,对于采用双管理板冗余设计方式的路由器,在步骤401之前,本发明实施例提供的方法还可以包括:
[0089]步骤400、发送存储的所述第一数据信息给从管理板,以使得所述从管理板存储所述第一数据信息。
[0090]具体的,主管理板可以将存储的第一数据信息发送给从管理板。其中,第一数据信息为主管理板优雅重启前,主管理板存储的C-BSR的数据信息、候选汇聚点C-RP的数据信息和PIM Hello报文的数据信息。
[0091]可选的,在步骤405之后,本发明实施例提供的方法还包括:
[0092]步骤408、发送存储的所述第二数据信息给从管理板,以使得所述从管理板存储所述第二数据信息。
[0093]其中,第二数据信息为主管理板优雅重启结束后,主管理板重新存储的C-BSR的数据信息、候选汇聚点C-RP的数据信息和PIM Hello报文的数据信息。
[0094]本发明实施例提供的一种组播业务故障的处理方法,当主管理板上运行的PM-SM协议故障,需要对PM-SM协议进行优雅重启时,主管理板可以根据自身预先存储的第一数据信息构造报文;其中,第一数据信息包括C-BSR的数据信息、C-RP的数据信息和PMHello报文的数据信息;构造的报文为BSM报文和PIM Hello报文。通过将根据预先存储的第一数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,就可以及时更新邻居设备的协议状态和邻居状态。这样,即使E-BSR上运行的PM-SM协议故障后,PM-SM协议未能在指定的时间内完成优雅重启,主管理板依然能够根据预先存储的数据信息构造并发送BSM报文和PIM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期。所以,由于E-BSR保活时间和PIM Hello邻居保活时间未超期,PIM-SM协议发生故障的E-BSR仍然能够完成RP的选举,保证组播报文可以正确转发。解决了 E-BSR上运行的PIM-SM协议在发生故障后,PIM-SM协议未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。进一步的,当主管理板上运行的PM-SM协议优雅重启后,其存储的数据信息可能会发生变化,此时需要重新存储变化后的数据信息,并发送给从管理板,从管理板在接收主管理板发送的数据信息之前,先将自身存储的数据信息清空,然后再接收主管理板发送的数据信息。这样,就可以保证主管理板和从管理板存储的数据信息的一致性。
[0095]实施例三
[0096]本发明实施例提供了一种组播业务的故障处理方法,该方法应用于采用双管理板冗余设计方式的E-BSR路由器,该双管理板包括主管理板和从管理板。当主管理板发生故障无法进行优雅重启时,从管理板代替主管理板进行故障处理,因此,该方法的执行主体为E-BSR的从管理板。具体的,如图5所示,该方法包括:
[0097]步骤501、根据预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息。
[0098]其中,预先存储的数据信息为主管理板发送给从管理板的,从管理板接收并存储的主管理板发送的数据信息。
[0099]步骤502、发送所述报文给邻居设备,所述报文包括BSM报文和PM Hello报文。
[0100]具体的,参考图5,当E-BSR的主管理板出现故障无法通过优雅重启恢复时,从管理板可以根据预先存储的数据信息构造BSM报文和PIM Hello报文。其中,预先存储的数据信息是主管理板在故障之前发送给从管理板的。从管理板根据预先存储的数据信息构造BSM报文和PM Hello报文,直至从管理板上运行的PM-SM协议完成收敛,停止构造BSM报文和PM Hello报文。这样,可以避免从管理板PM-SM协议收敛时间过长,导致E-BSR保活时间超期和PIM Hello邻居保活时间超期的问题,避免了邻居设备的协议状态和邻居状态失效,从而保证了组播报文转发不会断流。
[0101]可选的,在步骤501之前,所述方法还包括:
[0102]步骤500、接收设备管理器发送的切换消息;或者,发送故障探测报文给所述主管理板;若在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
[0103]具体的,对于是否收到设备管理器发送的切换消息这种情况,当PM-SM组播网络中的某个路由器出现故障时,设备管理器会发送切换消息给该路由器的从管理板,从管理板接收到设备管理器发送的切换消息后,立即根据从主管理板接收并存储的数据信息构造和发送BSM报文和PM Hello报文,直至从管理板PM-SM协议启动完成。
[0104]对于从管理板是否收到主管理板发送的应答报文这种情况,从管理板会周期性的发送故障探测报文给主管理板,其中,故障探测报文是从管理板根据预先存储的数据信息构造的,不同类型的协议功能构造不同类型的故障探测报文。若从管理板在预设的时间内没有接收到主管理板发送的应答报文,说明与此故障探测报文相对应的协议功能出现故障。此时,从管理板就可以确定主管理板的该项协议功能发生故障,从管理板根据预先存储的相关数据信息构造并发送该协议报文,代替主管理板发生故障的协议。
[0105]由于主管理板上运行的PM-SM协议中包含了众多不同功能的协议,所以对于PIM-SM协议中的不同协议功能,可以使用不同类型的故障探测报文。示例的,对于PIMHello协议是否故障,可以根据预先存储的PIM Hello报文的数据信息,构造PIM Hello故障探测报文。示例的,对于E-BSR故障,可以根据预先存储的C-BSR的数据信息和C-RP的数据信息构造BSM故障探测报文。
[0106]示例的,在PM-SM协议中,PM Hello邻居的保活时间一般设置为3.5倍的查询间隔,默认的查询间隔为30秒。下面以PIM Hello邻居的保活时间为3.5倍的查询间隔,默认的查询间隔为30秒,探测报文的探测周期为一个查询间隔(即30秒)为例,对从管理板是如何探测主管理板协议功能是否故障的进行详细说明。
[0107]对于PM Hello协议故障,如果在第一个探测周期内,从管理板接收到了主管理板发送的应答报文,则说明PM Hello协议未发生故障。此时,从管理板继续发送PM Hello故障探测报文给主管理板。如果从管理板在第一个探测周期内没有收到应答报文,则PMHello邻居已经存在了一个探测周期,此时PM Hello邻居的最快老化时间变为2.5倍的查询间隔,如果在此后的两个探测周期内,从管理板接收到了主管理板发送的应答报文,也即在PM Hello邻居的最快老化时间内收到了主管理板发送的应答报文,则说明PM Hello协议正常,未发生故障;如果从管理板在接下来的两个探测周期内均未收到主管理板发送的应答报文,则说明PM Hello协议发生故障,从管理板需要代替主管理板执行PM Hello协议的功能,此时,从管理板根据从主管理板接收到的PM Hello报文的数据信息构造PMHello报文并将其发送给邻居设备,避免PIM Hello邻居保活时间超期,进而保证组播报文转发不会发生断流。
[0108]若探测到主管理板发生故障后,从管理板会停止故障保活定时器,并继续发送故障探测报文给主管理板,直至接收到主管理板发送的应答报文,则停止构造报文,并启动故障保活定时器。若在预设时间内接收到所述主管理板发送的应答报文,则确定所述主管理板未发生故障,并启动故障保活定时器。
[0109]具体的,在主管理板上运行的PM-SM协议发生故障,从管理板会停止故障保活定时器,继续向主管理板发送故障探测报文,直至从管理板接收到主管理板发送的应答报文,说明主管理板上运行的PM-SM协议故障已经恢复,主管理板自身已经可以正常发送报文;此时,从管理板无需代替主管理板继续发送报文,从管理板根据收到的应答报文,停止构报文并更新故障保活定时器。然后,从管理板继续向主管理板发送故障探测报文,继续探测主管理板的工作情况;而若是从管理板在预设时间内接收到了主管理板发送的应答报文,则说明主管理板上运行的PM-SM协议功能恢复,故障解决,此时从管理板启动故障保活定时器,然后,继续向主管理板发送故障探测报文,继续探测主管理板的工作情况。
[0110]本发明实施例提供了一种组播业务的故障处理方法,可应用于双管理板场景下,从管理板根据预先存储的C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息构造BSM报文和PIM Hello报文,然后将根据预先存储的数据信息构造的BSM报文和PIMHello报文发送给邻居设备,邻居设备就可以及时更新自身的协议状态和邻居状态。这样,即使E-BSR主管理板上运行的PM-SM协议发生故障后,PIM-SM协议未能在指定的时间内完成优雅重启,或者是主从切换后,由于从管理板上运行的PM-SM协议启动时间过长,不能在E-BSR保活时间和PM Hello邻居保活时间内启动完成时,从管理板依然可以根据主管理板发送的数据信息构造并发送BSM报文和PM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期,由于E-BSR保活时间和PIM Hello邻居保活时间未超期,从管理板能够代替主管理板完成RP的选举,保证组播报文可以正确转发。解决了 E-BSR上运行的PM-SM协议故障后,PM-SM协议未能在指定时间内完成优雅重启时,导致的组播报文转发断流的问题。
[0111]实施例四
[0112]本发明实施例以采用双管理板冗余设计方式的路由器为例,对PM-SM组播网络中,E-BSR主管理板上运行的PM-SM协议发生故障后的处理方法做进一步的详细说明。具体的,该故障处理方法包括:
[0113]步骤601、主管理板存储第一数据信息并将该数据信息发送给从管理板,相应的,从管理板接收并存储主管理板发送的第一数据信息。
[0114]步骤602、主管理板确定进行优雅重启。
[0115]步骤603、主管理板根据预先存储的第一数据信息构造报文并发送给邻居设备。
[0116]其中,所述第一数据信息包括=C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息。所述报文包括:BSM报文和PM Hello报文。具体的,根据C-BSR的数据信息和C-RP的数据信息构造BSM报文,根据PIM Hello报文的数据信息构造PIM Hello报文。
[0117]步骤604、主管理板确定优雅重启是否结束。
[0118]若E-BSR主管理板优雅重启结束,说明E-BSR主管理板上运行的PM-SM协议故障已恢复,则执行步骤605 ;若E-BSR主管理板优雅重启未结束,说明E-BSR主管理板上运行的PIM-SM协议故障未恢复,则执行步骤603-步骤604。
[0119]步骤605、主管理板删除存储的第一数据信息,并存储第二数据信息。
[0120]此时,E-BSR主管理板上运行的PM-SM协议故障已经恢复,为了保证PM-SM协议优雅重启后主管理板存储的数据信息的准确性,主管理板会删除预先存储的第一数据信息,重新存储第二数据信息。
[0121]步骤606、从管理板删除存储的第一数据信息,同时接收并存储主管理板发送的第二数据信息。
[0122]可选的,当主管理板整个设备故障时,会进行主从设备切换,此时,设备管理器会发送切换消息给从管理板,从管理板根据接收到的切换消息替代主管理板进行故障处理。该故障处理方法包括:
[0123]步骤606、从管理板根据预先存储的数据信息构造并发送BSM报文和PM Hello报文给邻居设备。
[0124]其中,预先存储的数据信息可以为第一数据信息,也可以为第二数据信息。当预先存储的数据信息为第一数据信息时,意味着主管理板在开始时整个设备就出现故障,此时,从管理板根据预先存储的第一数据信息构造并发送BSM报文和PIM Hello报文给邻居设备;当预先存储的数据信息为第二数据信息时,意味着主管理板在进行优雅重启之后出现整个设备故障的问题,此时,从管理板根据预先存储的第二数据信息构造并发送BSM报文和PIM Hello报文给邻居设备。
[0125]对于步骤606而言,从管理板会替代主管理板构造并发送BSM报文和PM Hello报文给邻居设备,直到从管理板上运行的PM-SM协议收敛完成,才停止主动构造BSM报文和PIM Hello报文。
[0126]可选的,若E-BSR主管理板上运行的PM-SM协议的某项协议功能故障了,但是E-BSR主管理板未发生故障,PIM-SM协议运行也未发生故障,则主管理板上运行的PM-SM协议不会进行优雅重启,设备也不会进行主从切换。如果该项协议功能一直故障下去,最终必然会导致组播报文转发断流。此时,从管理板可以通过向主管理板发送故障探测报文,确定主管理板上运行的PM-SM协议的某项协议功能是否发生故障。
[0127]具体的,从管理板周期性的发送针对某项协议功能构造的故障探测报文给主管理板。其中,该故障探测报文为从管理板根据预先存储的数据信息构造的,针对不同类型的协议功能,从管理板可以构造不同类型的故障探测报文。若从管理板在预设时间内接收到主管理板发送的应答报文,则确定主管理板上该项协议功能已恢复,此后,从管理板继续周期性的发送该故障探测报文;若从管理板在预设时间内没有接收到主管理板发送的应答报文,则确定主管理板上该项协议功能发生故障。此时,从管理板根据预先存储的数据信息构造并发送发生故障的协议功能对应的报文,代替主管理板完成其发生故障的协议功能。同时,从管理板继续周期性的发送该故障探测报文,直至接收到主管理板发送的应答报文,此时,从管理板停止构造发生故障的协议功能所对应的报文,而由故障恢复的主管理板构造并发送相对应的报文。
[0128]本发明实施例提供的一种组播业务故障的处理方法,若主管理板上运行的PM-SM协议发生故障,需要对PM-SM协议进行优雅重启,则在PIM-SM协议优雅重启期间,主管理板可以利用预先存储的数据信息构造并发送BSM报文和PIM Hello报文,以避免E-BSR保活时间和PM Hello邻居保活时间发生超期,进而保证组播报文转发时不会发生断流;进一步的,从管理板还可以根据自身是否接收到设备管理器发送的切换消息,或者是否接收到主管理板发送的应答报文,来确定主管理板上运行的PM-SM协议功能是否发生故障,需不需要由从管理板是否要代替主管理板上发生故障的协议功能。若从管理板接收到设备管理器发送的切换消息或者未在预设时间内接收到主管理板发送的应答报文,则说明主管理板上运行的PM-SM协议发生故障。此时,从管理板可以根据预先存储的主管理板发送的C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息,构造并发送BSM报文和PIM Hello报文给邻居设备,及时更新邻居设备的协议状态和邻居状态。解决了 E-BSR上运行的PIM-SM协议发生故障后,PIM-SM协议未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。
[0129]实施例五
[0130]本发明实施例提供了一种主管理板70,如图6所示,包括:
[0131]确定模块701,用于确定是否进行优雅重启;
[0132]构造模块702,用于若所述确定模块701确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PMHello报文的数据信息;
[0133]发送模块703,用于发送所述构造模块702构造的报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0134]可选的,如图7所示,所述主管理板70还包括:存储模块704 ;
[0135]所述确定模块701,还用于确定所述优雅重启是否结束;
[0136]所述存储模块704,用于若所述确定模块701确定优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PMHello报文的数据信息。
[0137]可选的,如图7所示,所述主管理板70还包括:接收模块705 ;
[0138]所述接收模块705,用于接收从管理板发送的故障探测报文;
[0139]所述发送模块703,还用于若所述主管理板70未发生故障时,发送应答报文给所述从管理板。
[0140]可选的,如图7所示,所述发送模块703,还用于发送存储的所述第一数据信息或所述第二数据信息给所述从管理板,以使得所述从管理板存储所述第一数据信息或所述第二数据信息。
[0141]本发明实施例提供了一种主管理板,该主管理板通过确定模块确定主管理板上运行的PIM-SM协议在运行过程中是否发生故障,以确定主管理板是否进行优雅重启;然后由构造模块根据预先存储的第一数据信息构造BSM报文和PIM Hello报文;最后经由发送模块将构造模块构造的报文给邻居设备,以及时更新邻居设备的协议状态和邻居状态。这样,即使主管理板上运行的PM-SM协议在运行过程中发生故障,需要进行优雅重启,主管理板依然能够根据预先存储的数据信息构造并发送BSM报文和PIM Hello报文,因而不会导致E-BSR保活时间超期和PM Hello邻居保活时间超期。解决了主管理板上运行的PM-SM协议在运行过程发生故障后,未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。
[0142]实施例六
[0143]本发明实施例提供了一种从管理板80,如图8所示,包括:
[0144]构造模块801,用于根据预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息;
[0145]发送模块802,用于发送所述构造模块801构造的报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0146]可选的,如图9所示,所述从管理板80还包括:接收模块803和确定模块804 ;
[0147]所述接收模块803,用于在所述构造模块801根据预先存储的数据信息构造报文之前,接收设备管理器发送的切换消息;或者,
[0148]所述发送模块802,还用于发送故障探测报文给主管理板;所述确定模块804,还用于若所述接收模块803在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
[0149]可选的,如图9所示,所述从管理板80还包括:处理模块805 ;
[0150]所述处理模块805,用于在所述确定模块804确定所述主管理板发生故障之后,停止故障保活定时器;
[0151]所述发送模块802,还用于在所述处理模块805停止故障保活定时器时,发送所述故障探测报文给所述主管理板,直至所述接收模块803接收到所述主管理板发送的应答报文;
[0152]所述构造模块801,还用于在所述接收模块803接收到所述应答报文时停止构造报文;
[0153]所述处理模块805,还用于启动故障保活定时器。
[0154]本发明实施例提供了一种从管理板,从管理板根据存储模块预先存储的C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息构造BSM报文和PIM Hello报文,然后由发送模块将根据预先存储的数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,邻居设备就可以及时更新自身的协议状态和邻居状态。这样,即使从管理板上运行的PIM-SM协议在运行的过程中发生故障后,主管理板未能在指定的时间内完成优雅重启,或者是主从切换后,由于从管理板启动时间过长,不能在E-BSR保活时间和PM Hello邻居保活时间内启动完成时,从管理板依然可以根据接收模块接收到的数据信息构造并发送BSM报文和PIM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期,由于E-BSR保活时间和PM Hello邻居保活时间未超期,从管理板上运行的PM-SM协议仍然能后完成RP的选举,保证组播报文可以正确转发。解决了从管理板上运行的PM-SM协议在运行过程发生故障后,未能在指定时间内完成优雅重启时,导致的组播报文转发断流的问题。
[0155]实施例七
[0156]本发明实施例提供了一种主管理板90,如图10所示,包括:发送器901、接收器902、存储器903、处理器904、总线系统905。
[0157]其中,发送器901、存储器903和处理器904之间是通过总线系统905耦合在一起的,其中总线系统905除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图10中将各种总线都标为总线系统905。
[0158]存储器903可以包括只读存储器和随机存取存储器,并向处理器904提供指令和数据。存储器903的一部分还可以包括非易失性随机存取存储器(NVRAM)。
[0159]存储器903存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
[0160]操作指令:包括各种操作指令,用于实现各种操作。
[0161]操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
[0162]所述处理器904还可以称为CPU (Central Processing Unit,中央处理单兀)。所述处理器904通过调用存储器903存储的操作指令(该操作指令可存储在操作系统中),执行如下操作:确定主管理板是否进行优雅重启;若确定进行优雅重启时,则根据所述存储器903预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PM Hello报文的数据信息;所述发送器901发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
[0163]可选的,所述处理器904还用于确定所述优雅重启是否结束;所述存储器903还用于在所述处理器904确定优雅重启结束后,删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PMHello报文的数据信息。
[0164]可选的,所述接收器902用于接收从管理板发送的故障探测报文;所述发送器901用于若所述主管理板未发生故障时,发送应答报文给所述从管理板。
[0165]可选的,所述发送器901还用于发送存储器903存储的所述第一数据信息或所述第二数据信息给所述从管理板,以使得所述从管理板存储所述第一数据信息或所述第二数据信息。
[0166]上述本发明实施例揭示的方法可以应用于处理器904中,或者由处理器904实现。处理器904可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器904中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器904可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器903,处理器904读取存储器903中的信息,结合其硬件完成上述方法的步骤。
[0167]本发明实施例提供了一种主管理板,当主管理板上运行的PM-SM协议在运行过程中发生故障,需要进行优雅重启时,主管理板可以根据自身预先存储的第一数据信息构造报文;其中,第一数据信息包括C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息;构造的报文为BSM报文和PIM Hello报文。通过将根据预先存储的第一数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,就可以及时更新邻居设备的协议状态和邻居状态。这样,即使E-BSR故障后,未能在指定的时间内完成优雅重启,主管理板依然能够根据预先存储的数据信息构造并发送BSM报文和PIM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期。所以,由于E-BSR保活时间和PIM Hello邻居保活时间未超期,故障的E-BSR的仍然能够完成RP的选举,保证组播报文可以正确转发。解决了 E-BSR上运行的PM-SM协议发生故障后,未能在指定时间内完成优雅重启,导致组播报文转发断流的问题。
[0168]实施例八
[0169]本发明实施例提供了一种组播业务的故障处理方法的从管理板100,如图11所示,包括:发送器1001、存储器1003、处理器1004、总线系统1005。
[0170]其中,发送器1001、存储器1003和处理器1004之间是通过总线系统1005耦合在一起的,其中总线系统1005除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图11中将各种总线都标为总线系统1005。
[0171]存储器1003可以包括只读存储器和随机存取存储器,并向处理器1004提供指令和数据。存储器1003的一部分还可以包括非易失性随机存取存储器(NVRAM)。
[0172]存储器1003存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
[0173]操作指令:包括各种操作指令,用于实现各种操作。
[0174]操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
[0175]所述处理器1004还可以称为CPU (Central Processing Unit,中央处理单兀)。所述处理器1004通过调用存储器1003存储的操作指令(该操作指令可存储在操作系统中),以根据存储器1003预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息;所述发送器1001发送处理器1004构造的报文给邻居设备,所述报文包括BSM报文和PM Hello报文。
[0176]可选的,所述接收器1002用于在所述处理器1004根据预先存储的数据信息构造报文之前,接收设备管理器发送的切换消息;或者,所述发送器1001用于在所述处理器1004根据预先存储的数据信息构造报文之前,发送故障探测报文给主管理板;所述处理器1004还用于若所述接收器1002在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
[0177]可选的,所述处理器1004还用于在确定所述主管理板发生故障后,停止故障保活定时器;所述发送器1001还用于在所述处理器1004停止故障保活定时器后,继续发送所述故障探测报文给所述主管理板,直至所述接收器1002接收到所述主管理板发送的应答报文;所述处理器1004还用于在所述接收器1002接收到所述应答报文后,停止构造报文,并启动故障保活定时器。
[0178]可选的,所述处理器1004还用于若所述接收器1002在预设时间内接收到所述主管理板发送的应答报文,则确定所述主管理板未发生故障,并启动故障保活定时器。
[0179]可选的,所述接收器1002还用于在接收设备管理器发送的切换消息之前,或者发送器1001发送故障探测报文给主管理板之前,接收主管理板发送的数据信息;所述存储器1003存储所述接收器1001接收的数据信息。
[0180]本发明实施例提供了一从管理板,可应用于双管理板场景下,从管理板根据预先存储的C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息构造BSM报文和PIM Hello报文,然后将根据预先存储的数据信息构造的BSM报文和PIM Hello报文发送给邻居设备,邻居设备就可以及时更新自身的协议状态和邻居状态。这样,即使E-BSR故障后,主管理板未能在指定的时间内完成优雅重启,或者是主从切换后,由于从管理板启动时间过长,不能在E-BSR保活时间和PM Hello邻居保活时间内启动完成时,从管理板依然可以根据主管理板发送的数据信息构造并发送BSM报文和PM Hello报文,因而不会导致E-BSR保活时间超期和PIM Hello邻居保活时间超期,由于E-BSR保活时间和PIM Hello邻居保活时间未超期,从管理板能够代替主管理板完成RP的选举,保证组播报文可以正确转发。解决了 E-BSR故障后,未能在指定时间内完成优雅重启时,导致的组播报文转发断流的问题。
[0181]在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0182]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0183]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0184]上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0185]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【权利要求】
1.一种组播业务的故障处理方法,其特征在于,包括: 主管理板确定是否进行优雅重启; 若确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PM Hello报文的数据信息; 发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 确定所述优雅重启是否结束; 若所述优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括: 接收从管理板发送的故障探测报文; 若所述主管理板未发生故障时,发送应答报文给所述从管理板。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:发送存储的所述第一数据信息或所述第二数据信息给所述从管理板,以使得所述从管理板存储所述第一数据信息或第二数据信息。
5.一种组播业务的故障处理方法,其特征在于,包括: 根据预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PM Hello报文的数据信息,所述预先存储的数据信息为主管理板发送的; 发送所述报文给邻居设备,所述报文包括BSM报文和PIM Hello报文。
6.根据权利要求5所述的方法,其特征在于,所述根据预先存储的数据信息构造报文之前,所述方法还包括: 接收设备管理器发送的切换消息;或者, 发送故障探测报文给所述主管理板;若在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
7.根据权利要求6所述的方法,其特征在于,所述确定所述主管理板发生故障之后,所述方法还包括: 停止故障保活定时器,并继续发送所述故障探测报文给所述主管理板,直至接收到所述主管理板发送的应答报文,则停止构造报文,并启动故障保活定时器。
8.一种主管理板,其特征在于,包括: 确定模块,用于确定是否进行优雅重启; 构造模块,用于若所述确定模块确定进行优雅重启时,则根据预先存储的第一数据信息构造报文,所述第一数据信息包括候选自举路由器C-BSR的数据信息、候选汇聚点C-RP的数据信息和PM Hello报文的数据信息; 发送模块,用于发送所述构造模块构造的报文给邻居设备,所述报文包括BSM报文和PIM Hello 报文。
9.根据权利要求8所述的主管理板,其特征在于,所述主管理板还包括:存储模块; 所述确定模块,还用于确定所述优雅重启是否结束; 所述存储模块,用于若所述确定模块确定优雅重启结束,则删除所述第一数据信息,并存储第二数据信息,所述第二数据信息包括所述优雅重启结束后的C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息。
10.根据权利要求8所述的主管理板,其特征在于,所述主管理板还包括:接收模块; 所述接收模块,用于接收从管理板发送的故障探测报文; 所述发送模块,还用于若所述主管理板未发生故障时,发送应答报文给所述从管理板。
11.根据权利要求8或9所述的主管理板,其特征在于, 所述发送模块,还用于发送存储的所述第一数据信息或所述第二数据信息给所述从管理板,以使得所述从管理板存储所述第一数据信息或所述第二数据信息。
12.—种从管理板,其特征在于,包括: 构造模块,用于根据预先存储的数据信息构造报文,所述预先存储的数据信息包括C-BSR的数据信息、C-RP的数据信息和PIM Hello报文的数据信息,所述预先存储的数据信息为主管理板发送的; 发送模块,用于发送所述构造模块构造的报文给邻居设备,所述报文包括BSM报文和PIM Hello 报文。
13.根据权利要求12所述的从管理板,其特征在于,所述从管理板还包括:接收模块; 所述接收模块,用于在所述构造模块根据预先存储的数据信息构造报文之前,接收设备管理器发送的切换消息;或者, 所述发送模块,还用于发送故障探测报文给所述主管理板;所述确定模块,还用于若所述接收模块在预设时间内没有接收到所述主管理板发送的应答报文,则确定所述主管理板发生故障。
14.根据权利要求13所述的从管理板,其特征在于,所述从管理板还包括:处理模块; 所述处理模块,用于在所述确定模块确定所述主管理板发生故障之后,停止故障保活定时器; 所述发送模块,还用于在所述处理模块停止故障保活定时器时,发送所述故障探测报文给所述主管理板,直至所述接收模块接收到所述主管理板发送的应答报文; 所述构造模块,还用于在所述接收模块接收到所述应答报文时停止构造报文,所述处理模块,还用于启动故障保活定时器。
【文档编号】H04L12/703GK104243305SQ201410508516
【公开日】2014年12月24日 申请日期:2014年9月28日 优先权日:2014年9月28日
【发明者】曹中红, 翁尔新 申请人:福建星网锐捷网络有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1