虚拟网故障探测和定位方法

文档序号:7807925阅读:560来源:国知局
虚拟网故障探测和定位方法
【专利摘要】本发明涉及一种虚拟网故障探测和定位方法,含有下列步骤:1:建立一个虚拟网故障管理系统,该系统中的故障管理中心周期性向其管理的物理节点发送状态查询请求;2:物理节点通过自身的检测机制对节点和相关链路资源进行健康检查,并向故障管理中心发送资源状态信息;3:故障管理中心根据收到的信息判定虚拟网中是否发生异常,如发生异常,则执行4,否则,结束;4:故障管理中心向交换机中异常链路两端的关联节点发送异常查询请求;5:关联节点根据查询内容向故障管理中心发送异常查询应答消息,故障管理中心根据该消息确认故障的准确位置和类型。本发明能够自动、迅速、准确地对虚拟网进行故障探测和定位。
【专利说明】虚拟网故障探测和定位方法
[0001](一)、【技术领域】:本发明涉及一种网络故障探测和定位方法,特别是涉及一种虚拟网故障探测和定位方法。
[0002](二)、【背景技术】:网络故障影响网络系统的正常运行,而造成网络故障的原因错综复杂且不可避免,如配置错误、光纤断裂、交换设备不稳定、恶意攻击、误操作、意外断电等。虚拟网技术是一种新的网络技术,同样无法避免各种网络故障的发生,而且由于虚拟网技术的复杂性还可能引入更为复杂的网络故障。因此为了使虚拟网系统稳定运行,必须对虚拟网故障进行快速探测和准确定位,从而为故障修复提供支持。
[0003]目前网络故障的探测主要通过上层路由协议来完成,路由器之间如果探测到不可达,则通过重路由机制来避开故障点。而故障定位则主要还是依靠人工手段,很大程度上依赖于网络管理员的经验,因此如何迅速定位网络故障点,也就成为评估网络管理员能力的一个重要指标。而对于网管来说,要定位故障点也不是一件容易的事情,主要包括Ping目标地址、实地查看路由器指示灯、进行路由设备外观识别等手段。上述方法对技术人员的要求较高,极端情况下容易引起网络大面积瘫痪,造成严重的后果。而且对于虚拟网来说,除了传统网络中的可能发生的故障类型,还有可能是虚拟网构建相关过程中产生的虚拟故障,如果仍采用原有传统网络的故障排查机制,对网络管理员就提出了更高的要求,也可能会对网络造成更为严重的影响。这就迫切需要针对虚拟网的特点、技术条件等提出一种全新的故障排查方法。
[0004](三)、
【发明内容】
:
本发明要解决的技术问题是:提供一种虚拟网故障探测和定位方法,该方法能够自动、迅速、准确地对虚拟网进行故障探测和定位,从而为故障修复提供支持。
[0005]本发明的技术方案:
一种虚拟网故障探测和定位方法,含有下列步骤:
步骤1:建立一个虚拟网故障管理系统,该虚拟网故障管理系统含有故障管理中心(Fault Management Center, FMC)和基础支撑环境中的物理节点,故障管理中心用于进行网络资源监控和故障发现与定位;基础支撑环境中的物理节点用于为虚拟网构建提供基础资源;故障是指用于构建虚拟网的资源发生异常,无法为虚拟网构建及其上运行的各类业务提供网络服务;
步骤2:故障管理中心周期性向其管理的物理节点发送状态查询请求;
步骤3:收到查询请求的物理节点通过自身的检测机制对节点和相关链路资源进行健康检查;
步骤4:各物理节点通过故障管理接口向故障管理中心发送资源状态信息,根据查询内容及健康检查的结果进行通告;
步骤5:故障管理中心根据收到的资源状态信息判定虚拟网中是否发生异常,如发生异常,则执行步骤6,否则,执行步骤9 ;
由于上述多种故障可能性的存在,对于故障管理中心来说,如果收到某物理节点的异常通告消息,并不能推断出故障点的准确位置和类型,因此为了定位故障点及故障类型,故障管理中心必须启动故障定位过程;
步骤6:当虚拟网中发生异常时,物理节点会探测到某交换机RSCN中的异常链路,故障管理中心通过向该异常链路两端的关联节点发送异常查询请求消息来确认故障的准确位置和类型;由于异常链路连接两个关联节点,因此至少需要向这两个关联节点都发送异常查询请求消息;请求查询的内容含有:分享该异常链路资源的所有虚拟网中该异常链路的状态;
步骤7:收到异常查询请求消息的关联节点根据查询内容向故障管理中心发送异常查询应答消息;
步骤8:故障管理中心根据异常查询应答消息确认故障的准确位置和类型;
步骤9:结束。
[0006]故障含有物理节点故障、物理链路故障、虚拟节点故障和虚拟链路故障。
[0007]故障管理中心进行下列工作:监控各虚拟网中的资源运行状态;及时更新基础支撑环境中可用资源分布情况;对虚拟网中发生的故障进行迅速精确定位;利用可用资源对故障进行修复处理。
[0008]由于链路不可能单独存在,它总是和所连接的节点相关联,因此,连接物理节点的物理链路也作为节点资源进行描述。
[0009]步骤2中,故障管理中心向物理节点发送的状态查询内容含有:物理节点的资源总量、物理节点资源被分配和映射到的虚拟网、各个虚拟网中分配的资源数量、剩余未分配的物理节点资源数量、分配和映射给各个虚拟网的资源运行状态是否正常。
[0010]步骤5中,判定虚拟网中发生异常的方法如下:
方法1:如果故障管理中心在限定时间内未收到针对某物理节点的状态查询请求的回复信息,或物理节点的回复信息与故障管理中心预测的资源状态信息不符,则判定虚拟网中发生异常;
方法2:如果故障管理中心收到物理节点发出的未请求的异常状态通告消息,则判定虚拟网中发生异常。
[0011]方法2中,物理节点在发现异常情况时主动向故障管理中心通告异常状态通告消息,异常情况含有以下类型:
类型1:与物理节点连接的物理链路故障:发生该物理链路故障时,分享该物理链路资源的各虚拟网都会探测到同样的异常情况,但是由于探测到异常情况的时间有先后,因此,异常状态通告消息中只通告其中一个虚拟网的链路异常;
类型2:虚拟链路故障:由于上层软件漏洞bug造成某虚拟网中的虚拟链路故障,则只有该虚拟网会探测到链路异常;
类型3:物理节点故障:如果某物理节点通告了链路异常,也可能是由于该链路所连接的另一个物理节点故障无法响应而造成的链路故障表象;如果是物理节点故障,则分享该物理节点资源的虚拟网都会探测到异常,但是由于探测时间的关系,所以故障管理中心收到的异常通告只是其中的一个虚拟网异常;
类型4:虚拟节点故障:如果是上层软件漏洞bug的问题引起某虚拟网中的虚拟节点故障,则只有该虚拟网会通告异常。
[0012]步骤8中,确认故障的准确位置时,有以下情况: 情况1:对于两个关联节点中的任一个关联节点,如果指定时间内故障管理中心未收到该关联节点的任何应答消息,则判断该关联节点发生物理故障,该关联节点的所有资源都变为不可用状态,与该关联节点物理相邻的节点都会探测到与该关联节点相连的链路故障,因此,扩大关联范围,向该关联节点的所有物理邻接节点都发送异常查询请求消息,从而更准确地定位故障;
情况2:如果两个关联节点都有应答消息,且其中第一个关联节点的应答消息中通告了处于该虚拟网中的所述异常链路,而第二个关联节点由于配置故障已经释放了分配给该虚拟网中相应的资源,因此,第二个关联节点的应答消息中没有所述异常链路在虚拟网中的资源状态,该资源状态在第一个关联节点的异常通告消息中通告过,这说明第二个关联节点映射到该虚拟网的虚拟节点发生故障;
情况3:如果在两个关联节点的应答消息中,分享所述异常链路资源的所有虚拟网都通告该异常链路异常,则说明:为该异常链路提供基础资源的物理链路故障,该物理链路资源都变为不可用状态;
情况4:如果在两个关联节点的应答消息中,都只是通告某虚拟网中的所述异常链路异常,则说明:只是该异常链路映射到该虚拟网中的虚拟链路故障。
[0013]本发明的有益效果:
1、本发明对于网络中发生的故障,不但能够及时探测而且可以进行主动通告,而不是被动等待网管来发现,从而可以提高故障处理的效率。
[0014]2、本发明探测到可能的网络故障以后,可以进行下一步自动故障定位,而不是单纯依赖网络管理员的经验来定位故障点,可以有效提高故障定位的准确性和速度,为下一步故障处理提供有力支持。
[0015](四)、【专利附图】

【附图说明】:
图1为虚拟网故障管理系统的结构示意图;
图2为故障管理中心与物理节点之间的信息交互过程示意图;
图3为故障管理中心与物理节点之间的交互消息内容示意图;
图4为故障定位过程的流程示意图。
[0016](五)、【具体实施方式】:
虚拟网故障探测和定位方法含有下列步骤:
步骤1:建立一个虚拟网故障管理系统(如图1所示),该虚拟网故障管理系统含有故障管理中心(Fault Management Center, FMC)和基础支撑环境中的物理节点,故障管理中心用于进行网络资源监控和故障发现与定位;基础支撑环境中的物理节点用于为虚拟网构建提供基础资源;故障是指用于构建虚拟网的资源发生异常,无法为虚拟网构建及其上运行的各类业务提供网络服务;
步骤2:故障管理中心周期性向其管理的物理节点发送状态查询请求(如图2、图3所示);
步骤3:收到查询请求的物理节点通过自身的检测机制对节点和相关链路资源进行健康检查;物理节点首先检查自身的资源状态,然后根据当前的状态向故障管理中心发送定期查询响应消息;当前的状态包括:节点总的资源数量、参与了哪些虚拟网的构建、分别给参与构建的虚拟分配网了多少资源,分配给各个虚拟网的资源运行是否正常等信息; 步骤4:各物理节点通过故障管理接口向故障管理中心发送资源状态信息,根据查询内容及健康检查的结果进行通告;
步骤5:故障管理中心根据收到的资源状态信息判定虚拟网中是否发生异常,如发生异常,则执行步骤6,否则,执行步骤9 ;
由于上述多种故障可能性的存在,对于故障管理中心来说,如果收到某物理节点的异常通告消息,并不能推断出故障点的准确位置和类型,因此为了定位故障点及故障类型,故障管理中心必须启动故障定位过程(如图4所示);
步骤6:当虚拟网中发生异常时,物理节点会探测到某交换机RSCN中的异常链路,故障管理中心通过向该异常链路两端的关联节点发送异常查询请求消息来确认故障的准确位置和类型;由于异常链路连接两个关联节点,因此至少需要向这两个关联节点都发送异常查询请求消息;请求查询的内容含有:分享该异常链路资源的所有虚拟网中该异常链路的状态;
步骤7:收到异常查询请求消息的关联节点根据查询内容向故障管理中心发送异常查询应答消息;
步骤8:故障管理中心根据异常查询应答消息确认故障的准确位置和类型;
步骤9:结束。
[0017]故障含有物理节点故障、物理链路故障、虚拟节点故障和虚拟链路故障。
[0018]故障管理中心进行下列工作:监控各虚拟网中的资源运行状态;及时更新基础支撑环境中可用资源分布情况;对虚拟网中发生的故障进行迅速精确定位;利用可用资源对故障进行修复处理。
[0019]由于链路不可能单独存在,它总是和所连接的节点相关联,因此,连接物理节点的物理链路也作为节点资源进行描述。
[0020]步骤2中,故障管理中心向物理节点发送的状态查询内容含有:物理节点的资源总量、物理节点资源被分配和映射到的虚拟网、各个虚拟网中分配的资源数量、剩余未分配的物理节点资源数量、分配和映射给各个虚拟网的资源运行状态是否正常。如果在查询周期内发生了虚拟网构建或撤销,并且所查询的节点参与了该虚拟网的构建或撤销,即该节点在这个周期内发生了资源的分配或释放,则故障管理中心可以通过该查询消息获得该信息。
[0021]步骤5中,判定虚拟网中发生异常的方法如下:
方法1:如果故障管理中心在限定时间内未收到针对某物理节点的状态查询请求的回复信息,或物理节点的回复信息与故障管理中心预测的资源状态信息不符,则判定虚拟网中发生异常;
方法2:如果故障管理中心收到物理节点发出的未请求的异常状态通告消息,则判定虚拟网中发生异常。
[0022]方法2中,物理节点在发现异常情况时主动向故障管理中心通告异常状态通告消息,异常情况含有以下类型:
类型1:与物理节点连接的物理链路故障:发生该物理链路故障时,分享该物理链路资源的各虚拟网都会探测到同样的异常情况,但是由于探测到异常情况的时间有先后,因此,异常状态通告消息中只通告其中一个虚拟网的链路异常; 类型2:虚拟链路故障:由于上层软件漏洞bug造成某虚拟网中的虚拟链路故障,则只有该虚拟网会探测到链路异常;
类型3:物理节点故障:如果某物理节点通告了链路异常,也可能是由于该链路所连接的另一个物理节点故障无法响应而造成的链路故障表象;如果是物理节点故障,则分享该物理节点资源的虚拟网都会探测到异常,但是由于探测时间的关系,所以故障管理中心收到的异常通告只是其中的一个虚拟网异常;
类型4:虚拟节点故障:如果是上层软件漏洞bug的问题引起某虚拟网中的虚拟节点故障,则只有该虚拟网会通告异常。
[0023]步骤8中,确认故障的准确位置时,有以下情况:
情况1:对于两个关联节点中的任一个关联节点,如果指定时间内故障管理中心未收到该关联节点的任何应答消息,则判断该关联节点发生物理故障,该关联节点的所有资源都变为不可用状态,与该关联节点物理相邻的节点都会探测到与该关联节点相连的链路故障,因此,扩大关联范围,向该关联节点的所有物理邻接节点都发送异常查询请求消息,从而更准确地定位故障;
情况2:如果两个关联节点都有应答消息,且其中第一个关联节点的应答消息中通告了处于该虚拟网中的所述异常链路,而第二个关联节点由于配置故障已经释放了分配给该虚拟网中相应的资源,因此,第二个关联节点的应答消息中没有所述异常链路在虚拟网中的资源状态,该资源状态在第一个关联节点的异常通告消息中通告过,这说明第二个关联节点映射到该虚拟网的虚拟节点发生故障;
情况3:如果在两个关联节点的应答消息中,分享所述异常链路资源的所有虚拟网都通告该异常链路异常,则说明:为该异常链路提供基础资源的物理链路故障,该物理链路资源都变为不可用状态;
情况4:如果在两个关联节点的应答消息中,都只是通告某虚拟网中的所述异常链路异常,则说明:只是该异常链路映射到该虚拟网中的虚拟链路故障。
【权利要求】
1.一种虚拟网故障探测和定位方法,其特征是:含有下列步骤: 步骤1:建立一个虚拟网故障管理系统,该虚拟网故障管理系统含有故障管理中心和基础支撑环境中的物理节点,故障管理中心用于进行网络资源监控和故障发现与定位;基础支撑环境中的物理节点用于为虚拟网构建提供基础资源;故障是指用于构建虚拟网的资源发生异常,无法为虚拟网构建及其上运行的各类业务提供网络服务; 步骤2:故障管理中心周期性向其管理的物理节点发送状态查询请求; 步骤3:收到查询请求的物理节点通过自身的检测机制对节点和相关链路资源进行健康检查; 步骤4:各物理节点通过故障管理接口向故障管理中心发送资源状态信息,根据查询内容及健康检查的结果进行通告; 步骤5:故障管理中心根据收到的资源状态信息判定虚拟网中是否发生异常,如发生异常,则执行步骤6,否则,执行步骤9 ; 步骤6:当虚拟网中发生异常时,物理节点会探测到某交换中的异常链路,故障管理中心通过向该异常链路两端的关联节点发送异常查询请求消息来确认故障的准确位置和类型;由于异常链路连接两个关联节点,因此至少需要向这两个关联节点都发送异常查询请求消息;请求查询的内容含有:分享该异常链路资源的所有虚拟网中该异常链路的状态; 步骤7:收到异常查询请求消息的关联节点根据查询内容向故障管理中心发送异常查询应答消息; 步骤8:故障管理中心根据异常查询应答消息确认故障的准确位置和类型; 步骤9:结束。
2.根据权利要求1所述的虚拟网故障探测和定位方法,其特征是:所述故障含有物理节点故障、物理链路故障、虚拟节点故障和虚拟链路故障。
3.根据权利要求1所述的虚拟网故障探测和定位方法,其特征是:所述故障管理中心进行下列工作:监控各虚拟网中的资源运行状态;及时更新基础支撑环境中可用资源分布情况;对虚拟网中发生的故障进行迅速精确定位;利用可用资源对故障进行修复处理。
4.根据权利要求1所述的虚拟网故障探测和定位方法,其特征是:所述步骤2中,故障管理中心向物理节点发送的状态查询内容含有:物理节点的资源总量、物理节点资源被分配和映射到的虚拟网、各个虚拟网中分配的资源数量、剩余未分配的物理节点资源数量、分配和映射给各个虚拟网的资源运行状态是否正常。
5.根据权利要求1所述的虚拟网故障探测和定位方法,其特征是:所述步骤5中,判定虚拟网中发生异常的方法如下: 方法1:如果故障管理中心在限定时间内未收到针对某物理节点的状态查询请求的回复信息,或物理节点的回复信息与故障管理中心预测的资源状态信息不符,则判定虚拟网中发生异常; 方法2:如果故障管理中心收到物理节点发出的未请求的异常状态通告消息,则判定虚拟网中发生异常。
6.根据权利要求5所述的虚拟网故障探测和定位方法,其特征是:所述方法2中,物理节点在发现异常情况时主动向故障管理中心通告异常状态通告消息,异常情况含有以下类型: 类型1:与物理节点连接的物理链路故障:发生该物理链路故障时,分享该物理链路资源的各虚拟网都会探测到同样的异常情况,但是由于探测到异常情况的时间有先后,因此,异常状态通告消息中只通告其中一个虚拟网的链路异常; 类型2:虚拟链路故障:由于上层软件漏洞造成某虚拟网中的虚拟链路故障,则只有该虚拟网会探测到链路异常; 类型3:物理节点故障:如果是物理节点故障,则分享该物理节点资源的虚拟网都会探测到异常,但是由于探测时间的关系,所以故障管理中心收到的异常通告只是其中的一个虚拟网异常; 类型4:虚拟节点故障:如果是上层软件漏洞的问题引起某虚拟网中的虚拟节点故障,则只有该虚拟网会通告异常。
7.根据权利要求1所述的虚拟网故障探测和定位方法,其特征是:所述步骤8中,确认故障的准确位置时,有以下情况: 情况1:对于两个关联节点中的任一个关联节点,如果指定时间内故障管理中心未收到该关联节点的任何应答消息,则判断该关联节点发生物理故障,与该关联节点物理相邻的节点都会探测到与该关联节点相连的链路故障,向该关联节点的所有物理邻接节点都发送异常查询请求消息,从而更准确地定位故障; 情况2:如果两个关联节点都有应答消息,且其中第一个关联节点的应答消息中通告了处于该虚拟网中的所述异常链路,而第二个关联节点由于配置故障已经释放了分配给该虚拟网中相应的资源,因此,第二个关联节点的应答消息中没有所述异常链路在虚拟网中的资源状态,该资源状态在第一个关联节点的异常通告消息中通告过,这说明第二个关联节点映射到该虚拟网的虚拟节点发生故障; 情况3:如果在两个关联节点的应答消息中,分享所述异常链路资源的所有虚拟网都通告该异常链路异常,则说明:为该异常链路提供基础资源的物理链路故障,该物理链路资源都变为不可用状态; 情况4:如果在两个关联节点的应答消息中,都只是通告某虚拟网中的所述异常链路异常,则说明:只是该异常链路映射到该虚拟网中的虚拟链路故障。
【文档编号】H04L12/26GK104243232SQ201410311441
【公开日】2014年12月24日 申请日期:2014年7月2日 优先权日:2014年7月2日
【发明者】赵靓, 申涓, 王晶, 于婧, 兰巨龙, 胡宇翔, 张震, 马海龙 申请人:中国人民解放军信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1