一种sdn网络节点故障定位方法

文档序号:7814908阅读:680来源:国知局
一种sdn网络节点故障定位方法
【专利摘要】为了解决SDN网络中发生失联故障时进行自动恢复的问题,本发明提出一种通过节点平面对SDN网络失联故障定位的方法,根据定位的结果进行恢复。包括以下步骤:当保活消息消失时,节点判断失联故障发生;若邻居节点状态正常,则由控制器启动节点替代算法,向替代节点下发替代指令。若邻居节点也失联,则继续向其他节点发送问询消息,直到确定失联范围,对所述失联范围内每个失联节点,由控制器向替代节点下发替代指令。如果失联节点的业务状态失联,则对现有业务进行迁移。若全网节点全部失联,判断为控制器损坏,启动控制器恢复方法。本方案通过节点层实现失联故障定位方法并采取对应的恢复策略,具有快速的特点。
【专利说明】一种SDN网络节点故障定位方法

【技术领域】
[0001]本发明涉及SDN网络【技术领域】,尤其涉及控制器与节点之间的失联故障发生时,由节点平面进行的故障定位方法及选择其对应的恢复方法。

【背景技术】
[0002]近年来SDN网络已成为研究热点,其本身所具有的控制与转发相分离的特性为网络发展及研究带来了新的发展方向和研究热点。
[0003]SDN网络主要由控制层和节点层构成,其中控制层负责整个网络中的资源及业务管理,而节点层面则构成了网络拓扑,承载了网络中的业务传送。二者之间通过Openflow协议进行通信。
[0004]本发明所涉及的失联故障是指控制器和节点之间无法进行正常的保活消息收发以及Openflow协议通信。在SDN网络中,当失联故障发生时,如何对失联故障位置进行定位,进而采取适当的恢复策略,会影响网络故障恢复的效果。
[0005]在上述SDN网络架构中,失联故障既可能发生在节点平面,可能发生在控制层面,也可能是二者之间的通信网络发生故障。而如何利用SDN网络的特点及架构,通过网络节点平面自身来尽快进行故障定位,并由此采取不同的恢复策略,则成为SDN网络能否具有足够的健壮性的重要影响因素。


【发明内容】

[0006]为了解决SDN网络中发生失联故障时进行自动恢复的问题,本发明提出一种通过节点平面对SDN网络进行失联故障定位的方法,SDN网络能够根据定位的结果进行恢复。
[0007]本发明所述的SDN网络节点故障定位方法,包括以下步骤:
[0008]SDN网络节点通过本节点与控制器之间的保活消息判定本节点是否失联,当保活消息消失时,判断为失联故障发生;
[0009]失联节点向邻居节点发送问询消息;
[0010]若所述邻居节点状态正常,则判定为所述失联节点与控制器之间存在网络故障、或所述失联节点自身失效;所述失联节点通过正常的邻居节点向控制器发出替代请求;由控制器启动节点替代算法,向替代节点下发替代指令。
[0011]若所述邻居节点失联,贝Ij所述邻居节点继续向其他节点发送问询消息,直到确定失联范围;所述失联节点通过正常的邻居节点向控制器发出替代请求;对每个所述失联节点,由控制器启动节点替代算法,向替代节点下发替代指令。
[0012]进一步地,失联节点查询自身现有业务状态;如果所述失联节点的业务状态失常,由控制器进一步启动业务迁移算法,对所述失联节点的现有业务进行迁移。
[0013]进一步地,当确定失联范围时,若全网节点全部与控制器失联,判断为控制器损坏,启动传统的控制器恢复方法。
[0014]本方案充分利用SDN本身的架构特性和网络通信特性,从节点平面出发,在不引入其他设施的情况下,通过SDN网络自身实现了针对失联故障的定位方法,借此能够在SDN网络发生失联故障时,尽快地对故障进行定位并采取对应的恢复策略,具有消耗低、时延小的特点。

【专利附图】

【附图说明】
[0015]图1是基于节点平面的故障定位方法架构图。
[0016]图2是基于节点平面的故障定位方法实施例。

【具体实施方式】
[0017]图1是基于节点平面的故障定位方法架构图,图中是一个单域模型的SDN网络例子,由一个控制器和6个节点组成。6个节点相互连接组成所述“节点平面”,各个节点之间的细黑实线表示节点之间互联,并由此构成了域内拓扑。控制器与节点之间的虚线表示二者之间传递保活消息。带叉号的虚线则表示控制器与该节点之间的保活消息失效,此时节点6成为失联节点。由节点6发出的,指向其邻居节点的箭头表示该节点在察觉自身处于失联状态后,向邻居发出询问消息。由控制器指向节点3的箭头表示控制器通过节点替代算法计算后确定节点3为节点6的替代节点,向所述替代节点下发替代指令。通过节点2、节点6、及节点4的虚线代表节点6失联之前的一条业务路径,该业务路径在节点6仅失联而业务状态正常时保持。如果节点6既发生失联又发生业务故障,则需要恢复业务路径。例如通过节点2、节点3、节点4的粗实线则表示通过控制器的节点替代算法及业务迁移算法联合计算之后的恢复业务路径。
[0018]图2是本发明故障定位方法的实施例,整个流程包括以下步骤:
[0019]101:故障判定,通过节点与控制平面之间的连接情况判定节点自身是处于正常状态还是失联状态。正常情况下,节点与控制平面之间存在保活消息,同时节点可对控制平面的指令作出对应的动作,当节点无法正常接收保活消息,或无法收取控制平面指令时,认定自身所处的网络中发生本发明所定义的失联故障。
[0020]201:失联节点向邻居节点发送问询消息。
[0021]202:判断邻居节点状态是否正常。
[0022]203:若邻居节点状态正常(未失联),则判断为失联节点与控制器之间存在网络故障,或节点自身失效(但控制器运转正常),此时失联节点通过所述邻居节点发起重连,向控制器发出替代请求。进入第301步;
[0023]204:若邻居节点也失联,则继续向外问询,直到确定失联范围,并进入第401步。
[0024]301:失联节点查询自身现有业务状态,并将结果通过邻居节点回复给控制器,
[0025]302:判断业务状态是否正常,分为以下两种情况:
[0026]情况一:自身现有业务状态正常,即失联节点无法再承载新业务,但对现有途经失联节点的业务没有影响。此时进入第303步。情况二:自身现有业务状态失常,即失联节点既无法承载现有的途经自身的业务,同时也无法继续承载新业务。此时进入第304步
[0027]303:控制器在自身内部将此节点标记为失联节点,此时若没有新业务到来,控制器可暂时不需其他动作;当途经该节点的新业务到来时,控制器触发节点替代算法,计算后向替代节点下发替代指令,并由替代节点承载新进业务。
[0028]304:由控制器启动节点替代算法及业务迁移算法,并下发替代指令及进行失联节点的现有业务迁移。
[0029]401:根据失联节点在网络中所占数量,判断是否全部节点失联。失联范围分为部分失联和全部失联两种情况:
[0030]情况一:部分失联。若判断部分失联,则转第301步骤。当网络中存在可与控制平面正常通信的节点,即为部分失联情况。此时认定控制平面运行正常,是由节点平面的部分节点失效导致的故障,此时每个失联节点执行第301-304步,以期最大限度地恢复网络业务。
[0031]情况二:全部失联。转第402步。
[0032]402:当控制器损坏导致全域失联,启动传统的控制器恢复方法。所述传统的控制器恢复方法,是由控制平面或网管来触发和执行,启动作为备用控制器的计算机。
[0033]经过以上303、304或402步骤后,网络得到恢复。
[0034]第402步中的例外情况是控制器并未损坏,全部节点失联表明全部节点均损坏或网络的基础硬件损坏使全网失去控制,无法通过算法恢复。
【权利要求】
1.一种SDN网络节点故障定位方法,其特征在于,包括以下步骤: SDN网络节点通过本节点与控制器之间的保活消息判定本节点是否失联,当保活消息消失时,判断为失联故障发生; 失联节点向邻居节点发送问询消息; 若所述邻居节点状态正常,则判定为所述失联节点与控制器之间存在网络故障、或所述失联节点自身失效; 若所述邻居节点也失联,则所述邻居节点继续向其他节点发送问询消息,直到确定失联范围; 所述失联节点通过正常的邻居节点向控制器发出替代请求; 对每个所述失联节点,由控制器启动节点替代算法,向替代节点下发替代指令。
2.如权利要求1所述SDN网络节点故障定位方法,其特征在于,还包括以下步骤: 失联节点查询自身现有业务状态; 如果所述失联节点的业务状态失常,由控制器进一步启动业务迁移算法,对所述失联节点的现有业务进行迁移。
3.如权利要求1?2所述SDN网络节点故障定位方法,其特征在于,还包括以下步骤: 当确定失联范围时,发现全网节点全部与控制器失联,判断为控制器损坏,启动传统的控制器恢复方法。
【文档编号】H04L12/24GK104270286SQ201410483842
【公开日】2015年1月7日 申请日期:2014年9月19日 优先权日:2014年9月19日
【发明者】赵永利, 杨辉, 崔雅迪, 张 杰, 高冠军 申请人:北京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1