基于聚合等价类的网络故障分布式处理方法

文档序号:7565813阅读:206来源:国知局
专利名称:基于聚合等价类的网络故障分布式处理方法
技术领域
本发明涉及一种网络故障处理方法,特别是涉及一种基于聚合等价类 的网络故障分布式处理方法。背景技术
可生存性是网络设计之初的基本要求之一。IP网络规模呈现爆炸 式增长,网络业务实时性要求逐渐增强,使得网络使用群体对网络的生存性要求越来越高, 也对网络的故障恢复能力提出了更大的挑战。与此同时,因特网是一个拓扑结构不断变化 的动态网络,这是因为(1)因特网是一个即联即用的网络,不断有新的设备加入或损坏的 设备离开,使其拓扑结构不断变化;(2)人为原因造成配置错误或软件漏洞,使网络设备运 行异常;(3)自然灾害、设备断电等导致节点或链路出现硬件故障;(4)网络攻击频繁发生, 恶劣的网络攻击能够短时间内造成网络设备瘫痪。这些原因使因特网结构频繁变化,迫切 需要通过故障恢复技术来保证其可靠性。如何提高IP网络的故障恢复速度,成为近几年学术界研究的热点问题。或者通过 协议功能扩展实现路由收敛,或者通过备份路由等手段隔离故障。这些方案可以划分为被 动式故障恢复和主动式故障恢复。被动式故障恢复
被动式故障恢复是在故障发生后,根据当时的网络状态,通过路由协议重新计算替代 路径,实现故障恢复。链路状态路由协议(如最短路径优先0SPF)是当前因特网中主流的域内路由 协议,若网络中产生故障导致拓扑结构发生变化,通过洪泛链路状态通告(Link State Advertisement^LSAs)至整个或部分网络,路由器更新链路状态数据库,重新计算路由,达 到路由收敛。IP路由的收敛时间主要由故障检测时间、LSAs的传播时间和最短路由重新 计算时间三部分构成。加快路由收敛,应当分别从缩短各个部分时间入手。这里主要涉及 He 11 ο包、LSA、SPF算法的间隔时间,各类计时器(t imer )的延迟时间,SPF算法的运行时间 以及路由表更新时间等。为缩短上述时间阶段,需要加快Hello包的传输,减少收敛过程中 为保证网络稳定而人为设置的计时器延迟,但同时需要维护网络的稳定性。路由收敛行为使IP网络有一定的健壮性,网络正是依赖自身的这种健壮性来实 现故障恢复,然而如果收敛耗时长,就无法适应网络的发展需求。而且在IP路由收敛完成 之前,数据包会因为目的节点不可达或路由产生环路等原因被丢弃,为了满足网络稳定性 要求,短暂性的、频繁发作的故障会被过滤掉而不被处理,但是此类故障正是网络中最常见 的故障。主动式故障恢复
主动式故障恢复是在故障产生前就计算好替代路径,当故障发生时对故障进行本地处 理,加快故障恢复的速度。故障非敏感路由(Failure Insensitive Routing,FIR)使用基于端口转发的方 法进行故障恢复,特别适合解决短暂性的、频繁发作的单链路故障。多配置路由(Multiple Routing Configurations, MRC),对于相同的拓扑结构,通过对链路赋予不同的权值,得到两个不同的配置,发生故障时,将流量转移至不含故障链路或节点的配置中。标准组织IETF 也提出了大量主动式故障恢复方案,多拓扑路由(Multi-Topology Routing, MTR)就和MRC 方法类似。有研究者将节点、链路和共风险链路组(Shared Risk Link Group, SRLG)作为 故障单元,描述了对每个目的节点都给出其备份路径的方案。还有使用隧道技术建立备份 路径的做法。主动式故障恢复能够在毫秒数量级的时间内完成故障恢复,适合解决网络中频繁 发生的、持续时间短的故障,可以作为IP路由收敛完成之前进行故障恢复的一道防线。但 是这种在故障前计算好备份路径的方法,会带来许多资源开销,使得网络资源不能充分被 利用。综上所述,尽管动态路由协议采用被动式方法可以自适应网络环境的变化,但大 部分都是全局收敛,耗时较长;主动式故障恢复采取的是局部收敛,但是也存在开销大和稳 定性差等问题。因此,缩短协议收敛时间,采用开销更小的局部收敛是非常必要的,局部收 敛使收敛进程对网络的影响最小,同时尽量避免不可靠的全局收敛。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于聚合等价类的网络 故障分布式处理方法,该方法能快速有效地应对网络故障、缩短故障处理的收敛时间、提高 网络稳定性、增强网络性能。本发明的技术方案
一种基于聚合等价类的网络故障分布式处理方法,当网络中的一个节点感知到它的某 个后继节点不可达,即该节点的邻接链路或邻居节点发生故障时,可将发生故障的下一跳 路由直接在路由表中删除,选择相同聚合等价类中的其它可用下一跳作为传输路径,避免 路由重计算,缩短故障处理的收敛时间;若该节点没有其它可用下一跳,则将故障信息回溯 到上层等价类节点即可;当所有路径节点都没有可选路由时,触发重路由计算,达到全局重 新收敛。等价类是指将网络节点按照到达目的节点的距离因素划分不同的权值,
权值相同的节点为一个等价类;所述聚合等价类是指针对不同目的节点的等价类权 值在每个网络节点进行汇聚,成为聚合等价类;在选择下一跳时采用多下一跳路由方法 比较邻居节点和自身节点的聚合等价类权值来区分邻居节点与当前节点的上下游关系,按 照权值从高到低的方向规划数据流向,建立从源节点到目的节点的多下一跳无环路由。多下一跳路由方法中,相同等价类之间存在可行链路时,按照节点加入最短路径 树的顺序编号,按照从高到低的流向规划分组传输方向。当网络拓扑发生变更时,一方面制定临时的、局部的处理措施,尽量维持
数据的正常转发,另一方面对于影响数据正常转发的故障则进行故障通告,对变化后 的拓扑重新构建等价类分布图。由于充分挖掘了网络的冗余资源,多下一跳路由本身具有更强的可生存性,在抗 拥塞和抗故障方面性能更好。因此,只要等价类权值相对稳定,个别的链路故障并不能改变 报文向目的节点的转发趋势。本发明的有益效果
1、本发明由于是基于聚合等价类进行网络故障的处理,因此本发明的网络故障处理方法由具有多条路径并行传输的优势,节点可根据自身是否具有其它替代 下一跳资源,选择屏蔽故障、局部处理还是触发更新全局收敛,该网络故障处理方法能快速 有效地应对网络故障、缩短故障处理的收敛时间、提高网络稳定性、增强网络性能。

图1为本发明的网络故障分布式处理方法流程图; 图2为网络拓扑图3为图2所示拓扑的基于聚合等价类的多下一跳路由生成示意图; 图4为图2所示拓扑的路由示意图之一; 图5为图2所示拓扑的路由示意图之二; 图6为图2所示拓扑的路由示意图之三; 图7为图2所示拓扑的路由示意图之四; 图8为图2所示拓扑的路由示意图之五; 图9为图2所示拓扑的路由示意图之六; 图10为图2所示拓扑的路由示意图之七; 图11为图2所示拓扑的路由示意图之八。具体实施例方式
参见图1,图中,基于聚合等价类的网络故障分布式处理方法为当网络中的一个节 点感知到它的某个后继节点不可达,即该节点的邻接链路或邻居节点发生故障时,可将发 生故障的下一跳路由直接在路由表中删除,选择相同聚合等价类中的其它可用下一跳作为 传输路径,避免路由重计算,缩短故障处理的收敛时间;若该节点没有其它可用下一跳,则 将故障信息回溯到上层等价类节点即可;当所有路径节点都没有可选路由时,触发重路由 计算,达到全局重新收敛。等价类是指将网络节点按照到达目的节点的距离因素划分不同的权值,
权值相同的节点为一个等价类;所述聚合等价类是指针对不同目的节点的等价类权 值在每个网络节点进行汇聚,成为聚合等价类;在选择下一跳时采用多下一跳路由方法 比较邻居节点和自身节点的聚合等价类权值来区分邻居节点与当前节点的上下游关系,按 照权值从高到低的方向规划数据流向,建立从源节点到目的节点的多下一跳无环路由。多下一跳路由方法中,相同等价类之间存在可行链路时,按照节点加入最短路径 树的顺序编号,按照从高到低的流向规划分组传输方向。当网络拓扑发生变更时,一方面制定临时的、局部的处理措施,尽量维持
数据的正常转发,另一方面对于影响数据正常转发的故障则进行故障通告,对变化后 的拓扑重新构建等价类分布图。由于充分挖掘了网络的冗余资源,多下一跳路由本身具有更强的可生存性,在抗 拥塞和抗故障方面性能更好。因此,只要等价类权值相对稳定,个别的链路故障并不能改变 报文向目的节点的转发趋势。下面结合实际应用进一步说明本发明的技术方案
我们将一个IP网络模拟为一个加权的对称有向图G = (N,E),N代表网络中的节点(路 由器)集合,数量为n,E代表网络中的边(链路)集合。M表示节点i的邻接节点集合。对 于目的节点j,Uji表示任一节点i的上游节点集合,Sji表示i向目的节点j转发报文的可用下一跳集合,Isjil为下一跳数目。当节点i收到目的节点为j的报文PjidfWSji中 选出一个或多个可用下一跳用于转发Pji。通过重复上述操作,报文最终将到达目的节点。确定多下一跳集合Sji时采用基于聚合等价类的多下一跳路由算法,其方法是 将网络节点N按照距离因素聚合为不同的等价类,通过约束分组在不同聚合等价类之间以 权值减小方向作为流向,从而确定不同等价类之间的多条下一跳路由。相同等价类之间存 在可行链路时,按照节点加入最短路径树的顺序编号,按照从高到低的流向规划分组传输 方向。基于某一目的节点j执行上述算法,按照由高等价类节点向低等价类节点转发报 文,可以得到节点向目的节点转发报文的可行下一跳集合Sji,链路集合{(m,n)|n e Sjm, me N}将组成一个有向图SGj。如果对所有的i,有Sji=l,SGj就是一棵树,也就是传统的单 下一跳路由;如果存在i,使Sji > 1,SGj就是一个有向无环图(Directed Acyclic Graph, DAG),连接度要优于树。根据上述算法,得到的有向图SGj中可用下一跳集合Sji ^ l,SGj 具有以下特点(1)无环;(2)部分节点具有多个可用下一跳。根据本发明的网络故障分布式处理方法,针对网络中普遍存在的单链路故障,我 们采取下述分布式处理机制
假设当前节点i的等价类权值为^,下游节点的等价类权值为Wi_l,上游节点的权值为 +1,到目的节点j的下一跳集合为Ii, I Sji I为下一跳数目,则
(1)针对个别下行链路故障,若ISjiI> 1,则权值为&_1的下游节点中还存在其他可 用下一跳,直接删除该故障路由表项,将流量切换至可用下一跳,不需要进行故障通告,因 此也不会触发全局收敛过程(故障屏蔽);
(2)若当前节点无可用下一跳,S卩|Sji|=1,但权值为&+1的上游节点存在,则将故障 通告给上游节点,通过上游节点其它可用下一跳正常转发,同样不用触发全局收敛过程(局 部收敛);
(3)若该节点上游节点集合为空,即自身为源节点,收到故障通告时,说明目的地已不 可达,需要将故障通告全网,重新进行多下一跳路由计算(全局收敛)。分级收敛机制正确性分析相对于某一目的节点j形成的有向图SGj,对于任意节 点[i\i’j 6N’i^j]有可用下一跳集合{ S;彡l\i,j当某一链路( ,/7) 出现故障,链路M为节点m到目的节点j的下一跳所在链路,此时节点可用下一跳集合 变为{ SjmX^m, j m辛j\。当57彡1,即节点 仍存在其他可用下一跳,报文仍可 以通过这些下一跳正常转发;当,即节点 没有其他可用下一跳转发报文,但是如果节点 的上游节点“e //存在,且除去下一跳节点 外,满足{ S^\\u,j 1 j·},则报 文仍能通过节点《的其他下一跳正常转发。否则,将触发全局收敛来重新计算各节点的等 价类权值。上述分析已经包含了在多下一跳路由机制链路故障下,网络可能出现的所有情 况,因此,该机制能够有效地应对网络故障。分级收敛机制将故障处理分为了局部收敛和全局收敛两种情况。大部分情况下, 可以在不触发全局收敛的情况下,保证报文的正常转发。此外,如果增加上游回溯跳数,基 本上可以避免触发全局收敛。下面以图2中的拓扑为例,详细说明网络故障分布式处理方式(参考图2 图11): 在图3 图11中,虚线圆环是按照跳数因素(假设带宽相等)划分的不同等价类权值,数字编号是节点加入最短路径树的顺序,箭头是相同等价类之间的传输方向。在图3的基础上,节点f到目的地a的路由参见图4,当链路{b,c}发生故障时, 因为链路{b,a}仍为可行链路,所以按照算法中故障屏蔽处理的规则,将下一跳c在路由表 项中删除,选择链路{b,a}作为可行下一跳,结果参见图5。节点d到a的路由参见图6,若链路{c,a}发生故障,节点c没有其它可行下一跳, 将故障信息通告给上游节点b、h、d,因为节点b、d还有其它可行下一跳,所以将故障屏蔽, 节点h没有其它可行下一跳,将该故障信息通告给上游节点d,参见图7,最后节点d通过下 一跳b、a路由,参见图8,实现了故障的局部收敛。节点h到a的路由中,若链路{c,a}发生故障,参见图9,节点c没有其它可行下 一跳,将故障信息通告给上游节点h,h是源节点,已无上游节点,所以目的地a不可达,如图 10,触发全局的故障通告与路由更新,重新运行基于聚合等价类的多下一跳路由计算,得到 新的路由如图11所示。本发明提出的基于聚合等价类的故障分布式处理方法分为三个情况1)当前节点 仍有可用下一跳;2)当前节点无可用下一跳但有邻接上游节点;3)当前节点无可用下一跳 也无邻接上游节点(当前节点为源节点)。相应地将故障处理划分为三个等级本节点屏蔽 故障、故障通告给上游邻接节点和全局收敛。前两种收敛属于局部收敛,不需要将故障进行 全局通告,可以在保证报文正常转发的情况下不触发全局收敛。相比依靠路由协议重新计 算路由的全局收敛机制,分级收敛机制更能快速有效地应对网络单链路故障,缩短全局收 敛时间,提高网络稳定性,增强网络性能。
权利要求
1.一种基于聚合等价类的网络故障分布式处理方法,其特征是当网络中的一个节点 感知到它的某个后继节点不可达,即该节点的邻接链路或邻居节点发生故障时,可将发生 故障的下一跳路由直接在路由表中删除,选择相同聚合等价类中的其它可用下一跳作为传 输路径;若该节点没有其它可用下一跳,则将故障信息回溯到上层等价类节点;当所有路 径节点都没有可选路由时,触发重路由计算,达到全局重新收敛。
2.根据权利要求1所述的基于聚合等价类的网络故障分布式处理方法,其特征是所 述等价类是指将网络节点按照到达目的节点的距离因素划分不同的权值,权值相同的节 点为一个等价类;所述聚合等价类是指针对不同目的节点的等价类权值在每个网络节点 进行汇聚,成为聚合等价类;在选择下一跳时采用多下一跳路由方法比较邻居节点和自 身节点的聚合等价类权值来区分邻居节点与当前节点的上下游关系,按照权值从高到低的 方向规划数据流向,建立从源节点到目的节点的多下一跳无环路由。
3.根据权利要求2所述的基于聚合等价类的网络故障分布式处理方法,其特征是所 述多下一跳路由方法中,相同等价类之间存在可行链路时,按照节点加入最短路径树的顺 序编号,按照从高到低的流向规划分组传输方向。
4.根据权利要求1所述的基于聚合等价类的网络故障分布式处理方法,其特征是当 网络拓扑发生变更时,一方面制定临时的、局部的处理措施,尽量维持数据的正常转发,另 一方面对于影响数据正常转发的故障则进行故障通告,对变化后的拓扑重新构建等价类分 布图。
全文摘要
本发明涉及一种基于聚合等价类的网络故障分布式处理方法;基于聚合等价类的网络故障分布式处理方法为当网络中的一个节点感知到它的某个后继节点不可达,即该节点的邻接链路或邻居节点发生故障时,可将发生故障的下一跳路由直接在路由表中删除,选择相同聚合等价类中的其它可用下一跳作为传输路径,避免路由重计算,缩短故障处理的收敛时间;若该节点没有其它可用下一跳,则将故障信息回溯到上层等价类节点即可;当所有路径节点都没有可选路由时,触发重路由计算,达到全局重新收敛;本发明能快速有效地应对网络故障、缩短故障处理的收敛时间、提高网络稳定性、增强网络性能。
文档编号H04L12/24GK102075360SQ201110020768
公开日2011年5月25日 申请日期2011年1月19日 优先权日2011年1月19日
发明者伊鹏, 傅敏, 刘宗海, 孙江, 扈红超, 田铭 申请人:中国人民解放军信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1