动态隧道故障诊断方法及设备和系统的制作方法

文档序号:7846971
专利名称:动态隧道故障诊断方法及设备和系统的制作方法
技术领域
本发明涉及通信技术领域,具体涉及一种动态隧道故障诊断方法及设备和系统。
背景技术
目前,在承载网络中通常采用静态隧道(Tunnel)或动态Tunnel来完成业务传输, 承载网络中存在着数以千计的承载节点。Tunnel的功能就是在两个网络节点之间提供一条通路,使数据包能够在这个通路上透明传输。虚拟专用网(VPN Virtual Private Network)Tunnel—般是指在分组交换网络 PSN(Packet Switched Network)骨干网的 VPN 节点(一般指边缘设备(PE,Provider Edge))之间,或在VPN节点与用户节点之间建立的用来传输VPN数据包的虚拟连接。Tunne 1 是构建VPN不可或缺的部分,用于把VPN数据包从一个VPN节点透明传送到另一个节点。动态Turmel采用路由协议协商方式建立数据转发路由。例如源宿网元间存在一条动态Tunnel,Tunnel发生故障前,该动态Turmel经过路由的路由信息是确定的;Turmel 发生故障后信令协商可能失败,此时需排除故障。例如在中间节点或中间链路发生故障时, 需要对可能的路径(往往为很多条)进行一一排查来找出故障点,若网络拓扑复杂,则故障排查通常耗时都非常长,排除故障的也难度非常大,而且现有技术中一般又都是技术人员手动排查,很难及时有效的排除故障。

发明内容
本发明实施例提供动态隧道故障诊断方法和设备及系统,以期降低排查动态 Tunnel故障的复杂度,提升动态Turmel故障排查效率。为解决上述技术问题,本发明实施例中提供的技术方案如下一种动态隧道故障诊断方法,包括网管保存动态隧道Turmel的路由信息;在发现所述动态Turmel故障时,查询在所述动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;根据查询得到的所述动态Turmel的最新路由信息,解析出所述动态Turmel所经过的接口和网元;检查所述动态Turmel所经过的接口和网元,以获知所述动态Turmel中的疑似故障点。一种网管设备,包括存储器,用于保存动态隧道Turmel的路由信息;查询模块,用于在发现所述动态Turmel故障时,查询所述存储器在所述动态 Tunnel故障前所保存的对应该动态Tunnel的最新路由信息;路由解析模块,用于根据所述查询模块查询得到的所述动态Turmel的最新路由信息,解析出所述动态Turmel所经过的接口和网元;
诊断模块,用于检查所述动态Turmel所经过的接口和网元,以获知所述动态 Tunnel中的疑似故障点。一种故障诊断系统,包括如上述实施例所述的网管设备。由上可见,本发明实施例中网管保存动态隧道Turmel的路由信息;这样在该动态 Tunnel故障时,网管便可查询在该动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;根据查询得到的该动态Turmel的最新路由信息解析出该动态Turmel所经过的接口和网元;进而可通过检查该动态Turmel所经过的接口和网元,以获知该动态Turmel 中的疑似故障点,这样便可自动实现动态Turmel的故障排查,进而有利于期降低排查动态 Tunnel故障的复杂度,提升动态Tunnel故障排查效率。


为了更清楚地说明本发明实施例和现有技术中的技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图Ι-a是本发明实施例提供了一种动态Turmel故障示意图;图Ι-b是本发明实施例提供了一种动态Turmel故障后的云网络示意图;图2是本发明实施例提供了一种动态隧道故障诊断方法的流程示意图;图3是本发明实施例提供了一种网管的模块架构示意图;图4是本发明实施例提供了一种网管设备的示意图;图5_a是本发明实施例提供了一种网管设备的诊断模块的示意图;图5_b是本发明实施例提供了另一种网管设备的诊断模块的示意图;图5-c是本发明实施例提供了另一种网管设备的诊断模块的示意图。
具体实施例方式本发明实施例提供了一种动态隧道故障诊断方法及设备和系统,以期降低排查动态Turmel故障的复杂度,提升动态Turmel故障排查效率。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 下面通过具体实施例,分别进行详细的说明。首先参见图Ι-a和图Ι-b,图l_a所示拓扑结构中的源宿网元间存在一条动态 Tunnel,当该动态Turmel故障后,例如图l_b所示,源宿网元间的网络变为不可预见的云, 此场景下,现有技术则需检查该拓扑图中的所有网元及链路来排查故障,而往往实际网络中的拓扑结构往往复杂得多,基于现有技术来排查故障的复杂度将很高。本发明动态隧道故障诊断方法的一个实施例,可包括网管保存动态隧道Turmel 的路由信息;在发现该动态Turmel故障时,查询在该动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;根据查询得到的该动态Turmel的最新路由信息,解析出该动态Turmel所经过的接口和网元;检查该动态Turmel所经过的接口和网元,以获知该动态 Tunnel中的疑似故障点。参见图2,具体步骤可包括201、网管保存动态隧道Turmel的路由信息;在实际应用中,网管例如可将其获得的部分或全部对应该动态Turmel的路由信息保存到数据库中。在保存该动态Turmel最新的路由信息时,网管例如可保留或删除数据库此前已保存的该动态Turmel的历史路由信息。举例来说,网管在接收到动态Turmel首次变为UP状态的通知(其中,在动态 Tunnel的路由协商成功且能够正常传递数据后,该动态Tunnel的首节点可向网管发送指示该动态Turmel变为UP状态的通知)后,可保存该动态Turmel当时的路由信息。又例如, 当用户查询该动态Turmel当前的路由信息时,若该动态Turmel当前的路由信息与已保存的对应该动态Turmel的路由信息存在差异,且又接收到用户的路由信息保存指令,则网管可保存该动态Turmel当前的路由信息(当然,当用户查询该动态Turmel当前的路由信息时,若该动态Turmel当前的路由信息与已保存的对应该动态Turmel的路由信息存在差异, 网管亦可以自动保存该动态Turmel当前的路由信息)。又例如,网管在接收到对应该动态 Tunnel的路由变更通知后,若接收到用户的路由信息保存指令,则网管可保存该路由变更通知中携带的该动态Turmel变更后的路由信息(当然,在接收到对应该动态Turmel的路由变更通知后,网管亦可自动保存该路由变更通知中携带的该动态Turmel变更后的路由信息)。又例如,网管可在发现该动态Turmel的路由信息变更时,在用户指令的指示下或者自动保存该动态Turmel变更后的路由信息。又例如,网管可建立第一线程和第二线程;第一线程在接收到对应该动态Turmel 的路由变更通知后,在缓存中查询是否已有对应该动态Turmel的路由变更通知,若没有, 则将该接收到对应该动态Turmel的路由变更通知存储到缓存中;若有,则在删除缓存中该已有的对应该动态Turmel的路由变更通知后,将该接收到对应该动态Turmel的路由变更通知存储到缓存中,其中,该路由变更通知携带有该动态Turmel变更后的路由信息;第二线程从缓存中读取对应该动态Turmel的路由变更通知,将读取的该路由变更通知中携带的该动态Turmel变更后的路由信息存入数据库。如此,第一线程和第二线程对动态Turmel 的路由变更通知的处理形成了一种生存者消费者工作模式,并且缓存中只缓存了最后一次变更事件,有利于减少存库次数。202、网管在发现上述动态Turmel故障时,查询在该动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;在实际应用中,网管可主动检测到该动态Turmel发生故障,或可根据被管网元上报的相关故障报告确定该动态Turmel发生故障。 203、网管根据查询得到的该动态Turmel的最新路由信息,解析出该动态Turmel 所经过的接口和网元;204、网管检查该动态Turmel所经过的接口和网元,以获知该动态Turmel中的疑似故障点。在实际应用中,网管可通过多种方式来检查该动态Turmel所经过的接口和网元,以获知该动态Turmel中的疑似故障点。举例来说,网管可生成测试命令集合(例如可生成对应从动态Turmel的源节点到目的节点之间的每跳的Ping和/或Trace Route等测试命令);利用生成的测试命令集合测试该动态Turmel所经过的接口和网元,以获知该动态Turmel的疑似故障点。又例如,网管可根据该动态Turmel所经过的接口和网元,查询出该动态Turmel所经过路由上的所有告警和该动态Turmel上的所有告警;并基于预设的推演规则对该查询出的所有告警进行相关性分析,以得出根因告警,其中,该推演规则例如可至少包括如下规则中的一种上游告警是下游告警的根因告警、接口告警是动态Turmel告警的根因告警、物理接口告警是其绑定的逻辑接口告警的根因告警。又例如,网管可检查该动态Turmel所经过的接口和网元的配置数据的正确性(例如可能包括检查如下信息的一种或多种检查激光器状态、接口使能状态、上下游IP地址是否在同一网段,路由约束信息是否匹配实际路由信息,每个路由节点上的Turmel是否成功建立等);根据检测结果确定该动态Turmel中的疑似故障点。 可以理解,网管可结合上述举例方式的一种或多种,来检查该动态Turmel所经过的接口和网元以获知该动态Turmel中的疑似故障点,当然也不限于上述举例方式。此外,网管确定出动态Turmel中的疑似故障点后,用户可进一步对该疑似故障点的故障问题进行确认和故障排除。需要说明的是,本发明实施例中所指的网管,可能是一个物理设备或者亦可能包括由多个物理设备组成的网管系统。由上可见,在本实施例中网管保存动态隧道Turmel的路由信息;这样在该动态 Tunnel故障时,网管便可查询在该动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;根据查询得到的该动态Turmel的最新路由信息解析出该动态Turmel所经过的接口和网元;进而可通过检查该动态Turmel所经过的接口和网元,以获知该动态Turmel 中的疑似故障点,这样便可自动实现动态Turmel的故障排查,进而有利于期降低排查动态 Tunnel故障的复杂度,提升动态Tunnel故障排查效率。为更好的理解本发明实施例的技术方案,下面以一种举例的网管模块架构为例做进一步详细的介绍。参见图3,在本发明实施例的一个应用例中,网管上例如可增加动态Turmel路由处理模块,以支持查询动态Turmel的当前路由信息,支持保存与查询动态Turmel的历史路
由fn息等。告警处理模块与动态Turmel路由处理模块交互,可通过解析动态Turmel的历史路由信息,得到动态Turmel的历史路由所经过的网元和接口、路由上各个网元和接口的告警信息以及该动态Turmel上的所有告警;并基于预设的推演规则对该查询出的所有告警进行相关性分析,以得出根因告警,其中,该推演规则例如可至少包括如下规则中的一种 上游告警是下游告警的根因告警、接口告警是动态Turmel告警的根因告警、物理接口告警是其绑定的逻辑接口告警的根因告警。又例如,网管可检查该动态Turmel所经过的接口和网元的配置数据的正确性;根据检测结果确定该动态Turmel中的疑似故障点。故障诊断模块可与动态Turmel路由处理模块交互,故障诊断模块可自动生成测试命令集合,并可利用生成的测试命令集合进行Ping/Trace Route等链路通断测试,以自动分析出疑似故障点。
在一种应用场景下,动态Turmel路由处理模块例如可提供以下功能的一种或多种查询动态Turmel的当前路由信息;保存动态Turmel的历史路由信息并提供查询接口 ;对比动态Turmel的当前路由信息与历史路由信息差异;将动态Turmel的路由信息解析为接口信息;路由变更事件处理。在一种应用场景下,告警处理模块例如可新增以下功能的一种或多种根据动态Turmel路由处理模块获得的路由信息,从数据库查询到Turmel路由上的所有告警以及该动态Turmel上的所有告警;根据推演规则(例如可包括根据路由上下游关系等等)进行告警相关性规则分析,分析出根因告警。在一种应用场景下,故障诊断模块例如可新增以下功能的一种或多种根据动态Turmel路由处理模块获得的动态Turmel路由信息,自动生成测试命令集合,并可利用生成的测试命令集合进行Ping/Trace Route等链路通断测试;根据路由上下游关系等分析测试结果,以自动分析出疑似故障点。在实际应用中,例如可在动态Turmel状态数据中增加标记,标记动态Turmel是否首次变为UP状态,当动态Turmel路由处理模块接收到被管网元上报的动态Turmel变UP 状态的通知时,动态Turmel路由处理模块若判断出若是首次变UP状态,将当时的路由信息保存到数据库(或存库文件)中。当用户查询该动态Turmel当前路由时,若该动态Turmel的当前路由信息与已保存的历史路由信息存在差异,动态Turmel路由处理模块可生成提示信息以提醒用户保存新路由信息,若接收到用户选择保存路由的指令,动态Turmel路由处理模块将该动态 Tunnel的新路由信息保存到数据库。当然,当用户查询该动态Turmel当前路由时,若该动态Turmel的当前路由信息与已保存的历史路由信息存在差异,动态Turmel路由处理模块亦可自动将该动态Turmel的新路由信息保存到数据库。在接收到被管网元上报的路由变更通知(其中携带该动态Turmel的新路由信息) 后,动态Turmel路由处理模块可生成提示信息以提醒用户保存新路由信息,若接收到用户选择保存路由的指令,动态Turmel路由处理模块将新路由保存到数据库。如此,对于同一条动态Tunnel,只记录一条路由变更通知,并在内存中缓存该路由变更通知,直到该路由变更通知被用户确认变更,才记录该Turmel新的路由变更通知,这样在被管网元上报大量路由变更事件时,网管实现了对同一条Turmel的多个变更事件的归并处理,进而有利于有效的减少网管需处理的数据量;基于上述机制,可以只在Turmel第一次UP时,或在用户选择时更新路由时,才进行Turmel路由信息存库操作,进而可以有效的减少磁盘读取次数,提高数据处理效率。在实际应用中,例如告警处理模块可从动态Turmel路由处理模块获取故障 Tunnel的历史路由信息,其中,动态Tunnel路由处理模块例如可从数据库查询到该动态 Tunnel的历史路由信息,并可根据全网接口信息将历史路由信息中的IP地址转换为接口信息;告警处理模块可根据接口信息查询到该Turmel所经过路由上的所有告警及该Tunnel上的所有告警;告警处理模块可根据推演规则对告警进行相关性分析,得出根因告警,推演规则至少包括如下规则中的一种上游告警是下游告警的根因告警,接口告警是 Turmel告警的根因告警,物理接口告警是其绑定的逻辑接口告警的根因告警等。通过以上推演分析,告警处理模块能够有效找到引起该Turmel故障的根因告警, 例如以太网信号丢失(ETH_L0S)告警、激光器告警是Tunnel告警的根因告警,激光器告警是ETH_L0S告警的上游告警,最终告警处理模块能够自动推断出该Turmel故障是由激光器告警引起。在实际应用中,故障诊断模块提供智能诊断功能,以找到Turmel故障发生的疑似点。例如故障诊断模块从动态Turmel路由处理模块获取故障Turmel的历史路由信息,其中,动态Turmel路由处理模块例如可从数据库查询到该动态Turmel的历史路由信息,并可根据全网接口信息将历史路由信息中的IP地址转换为接口信息;故障诊断模块根据该动态Turmel的历史路由信息自动生成测试命令集合(可包括生成从源到目的的每跳的ping/ Trace Route命令)并执行,以分析出执行失败的点(即疑似故障点)。故障诊断模块根据动态Turmel的路由信息检查配置数据,例如可包括检查激光器状态、接口使能状态、上下游 IP地址是否在同一网段,路由约束信息是否匹配实际路由信息,每个路由节点上的Turmel 是否成功建立等等,并可将错误的配置数据提示给用户。在实际应用中,故障诊断模块结合动态Turmel路由处理模块的路由信息进行综合分析,通常能够一键式定位出导致动态Turmel故障的根本原因。需要说明的是,网管还可采用其它模块架构来实现动态隧道故障诊断,此处不在
一一列举。此外,网管确定出动态Turmel中的疑似故障点后,用户可进一步对该疑似故障点的故障问题进行确认和故障排除。由上可见,在本应用例中网管保存动态隧道Turmel的路由信息;这样在该动态 Tunnel故障时,网管便可查询在该动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;根据查询得到的该动态Turmel的最新路由信息解析出该动态Turmel所经过的接口和网元;进而可通过检查该动态Turmel所经过的接口和网元,以获知该动态Turmel 中的疑似故障点,这样便可自动实现动态Turmel的故障排查,进而有利于期降低排查动态 Tunnel故障的复杂度,提升动态Turmel故障排查效率。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。为便于更好的实施本发明实施例的上述技术方案,本发明实施例中还提供实施上述技术方案的相应装置。参见图4,本发明实施例提供的网管设备400,可包括存储器410、查询模块420、 路由解析模块430和诊断模块440。
其中,存储器410,用于保存动态隧道Turmel的路由信息;在一种应用场景下,存储器410可具体用于,在接收到上述动态Turmel首次变为 UP状态的通知后,保存上述动态Turmel当时的路由信息;当用户查询上述动态Turmel当前的路由信息时,若上述动态Turmel当前的路由信息与已保存的对应上述动态Turmel的路由信息存在差异,且接收到用户的路由信息保存指令,则保存上述动态Turmel当前的路由信息;在接收到对应上述动态Turmel的路由变更通知后,若接收到用户的路由信息保存指令,则保存上述路由变更通知中携带的上述动态Turmel变更后的路由信息。举例来说,网管设备400在接收到动态Turmel首次变为UP状态的通知(其中在动态Turmel的路由协商成功且能够正常传递数据后,该动态Turmel的首节点可向网管发送指示该动态Turmel变为UP状态的通知)后,存储器410可保存该动态Turmel当时的路由信息。又例如,当用户查询该动态Turmel当前的路由信息时,若该动态Turmel当前的路由信息与已保存的对应该动态Turmel的路由信息存在差异,且又接收到用户的路由信息保存指令,则存储器410可保存该动态Turmel当前的路由信息(当然,当用户查询该动态 Tunnel当前路由信息时,若该动态Turmel当前的路由信息与已保存的对应该动态Turmel 的路由信息存在差异,存储器410亦可以自动保存该动态Turmel当前的路由信息)。又例如,网管设备400在接收到对应该动态Turmel的路由变更通知后,若接收到用户的路由信息保存指令,则存储器410可保存该路由变更通知中携带的该动态Turmel变更后的路由信息(当然,在接收到对应该动态Turmel的路由变更通知后,存储器410亦可自动保存该路由变更通知中携带的该动态Turmel变更后的路由信息)。又例如,网管设备400可在发现该动态Turmel的路由信息变更时,存储器410在用户指令的指示下或者自动保存该动态 Tunnel变更后的路由信息。又例如,网管设备400可建立第一线程和第二线程;第一线程在接收到对应该动态Turmel的路由变更通知后,在缓存中查询是否已有对应该动态Turmel的路由变更通知, 若没有,则将该接收到对应该动态Turmel的路由变更通知存储到缓存中;若有,则在删除缓存中该已有的对应该动态Turmel的路由变更通知后,将该接收到对应该动态Turmel的路由变更通知存储到缓存中,其中,该路由变更通知携带有该动态Turmel变更后的路由信息;第二线程从缓存中读取对应该动态Turmel的路由变更通知,将读取的该路由变更通知中携带的该动态Turmel变更后的路由信息存入数据库。如此,第一线程和第二线程对动态 Tunnel的路由变更通知的处理形成了一种生存者消费者工作模式,并且缓存中只缓存了最后一次变更事件,有利于减少存库次数。查询模块420,用于在发现上述动态Turmel故障时,查询存储器410在上述动态 Tunnel故障前所保存的对应该动态Turmel的最新路由信息;路由解析模块430,用于根据查询模块420查询得到的上述动态Turmel的最新路由信息,解析出上述动态Turmel所经过的接口和网元;诊断模块440,用于检查上述动态Turmel所经过的接口和网元,以获知上述动态 Tunnel中的疑似故障点。参见图5-a,在一种应用场景下,诊断模块440可包括生成子模块441和测试子模块442 ;其中,生成子模块441,用于生成测试命令集合;
测试子模块442,用于利用生成子模块441生成的测试命令集合测试上述动态 Tunnel所经过的接口和网元,以获知上述动态Turmel的疑似故障点;参见图5-b,在一种应用场景下,诊断模块440可包括查询子模块443和推演子模块444。查询子模块443,用于根据上述动态Turmel所经过的接口和网元,查询出上述动态Turmel所经过路由上的所有告警和该动态Turmel上的所有告警;推演子模块444,用于基于预设的推演规则对上述查询出的所有告警进行相关性分析,以得出根因告警,其中,该推演规则例如可包括如下规则的至少一种上游告警是下游告警的根因告警、接口告警是动态Turmel告警的根因告警、物理接口告警是其绑定的逻辑接口告警的根因告警。参见图5-c,在一种应用场景下,诊断模块440可包括配置检查子模块445和确定子模块446。其中,配置检查子模块445,检查上述动态Turmel所经过的接口和网元的配置数据的正确性;确定子模块446,用于根据检测结果确定上述动态Turmel中的疑似故障点。由上可见,本实施例中网管设备400保存动态隧道Turmel的路由信息;这样在该动态Turmel故障时,网管设备400便可查询在该动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;根据查询得到的该动态Turmel的最新路由信息解析出该动态 Tunnel所经过的接口和网元;进而可通过检查该动态Turmel所经过的接口和网元,以获知该动态Turmel中的疑似故障点,这样便可自动实现动态Turmel的故障排查,进而有利于期降低排查动态Turmel故障的复杂度,提升动态Turmel故障排查效率。本发明实施例还提供一种故障诊断系统,可包括网管设备400。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括只读存储器、随机存储器、磁盘或光盘等。以上对本发明实施例所提供的动态隧道故障诊断方法及设备和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种动态隧道故障诊断方法,其特征在于,包括 网管保存动态隧道Turmel的路由信息;在发现所述动态Turmel故障时,查询在所述动态Turmel故障前所保存的对应该动态 Tunnel的最新路由信息;根据查询得到的所述动态Turmel的最新路由信息,解析出所述动态Turmel所经过的接口和网元;检查所述动态Turmel所经过的接口和网元,以获知所述动态Turmel中的疑似故障点。
2.根据权利要求1所述的方法,其特征在于,所述检查所述动态Turmel所经过的接口和网元,以获知所述动态Turmel中的疑似故障点,包括生成测试命令集合;利用所述测试命令集合测试所述动态Turmel所经过的接口和网元,以获知所述动态 Tunnel的疑似故障点。
3.根据权利要求2所述的方法,其特征在于, 所述生成测试命令集合包括生成对应从所述动态Turmel的源节点到目的节点之间的每跳的ping和/或Trace Route测试命令。
4.根据权利要求1所述的方法,其特征在于,所述检查所述动态Turmel所经过的接口和网元,以获知所述动态Turmel中的疑似故障点,包括根据所述动态Turmel所经过的接口和网元,查询出所述动态Turmel所经过路由上的所有告警和该动态Turmel上的所有告警;基于预设的推演规则对所述查询出的所有告警进行相关性分析,以得出根因告警,其中,所述推演规则至少包括如下规则中的一种上游告警是下游告警的根因告警、接口告警是动态Turmel告警的根因告警、物理接口告警是其绑定的逻辑接口告警的根因告警。
5.根据权利要求1所述的方法,其特征在于,所述检查所述动态Turmel所经过的接口和网元,以获知所述动态Turmel中的疑似故障点,包括检查所述动态Turmel所经过的接口和网元的配置数据的正确性; 根据检测结果确定所述动态Turmel中的疑似故障点。
6.根据权利要求1至5任一项所述的方法,其特征在于, 所述保存动态隧道Turmel的路由信息,包括在接收到所述动态Turmel首次变为UP状态的通知后,保存所述动态Turmel当时的路由fn息;当用户查询所述动态Turmel当前的路由信息时,若所述动态Turmel当前的路由信息与已保存的对应所述动态Turmel的路由信息存在差异,且接收到用户的路由信息保存指令,则保存所述动态Turmel当前的路由信息;在接收到对应所述动态Turmel的路由变更通知后,若接收到用户的路由信息保存指令,则保存所述路由变更通知中携带的所述动态Turmel变更后的路由信息。
7.根据权利要求1至5任一项所述的方法,其特征在于, 所述保存动态隧道Turmel的路由信息,包括建立第一线程和第二线程;第一线程在接收到对应所述动态Turmel的路由变更通知后,在缓存中查询是否已有对应该动态Turmel的路由变更通知,若没有,则将所述接收到对应所述动态Turmel的路由变更通知存储到缓存中;若有,则在删除缓存中该已有的对应该动态Turmel的路由变更通知后,将所述接收到对应所述动态Turmel的路由变更通知存储到缓存中,其中,所述路由变更通知携带有所述动态Turmel变更后的路由信息;第二线程从缓存中读取对应所述动态Turmel的路由变更通知,将读取的所述路由变更通知中携带的所述动态Turmel变更后的路由信息存入数据库。
8.—种网管设备,其特征在于,包括存储器,用于保存动态隧道Turmel的路由信息;查询模块,用于在发现所述动态Turmel故障时,查询所述存储器在所述动态Turmel故障前所保存的对应该动态Turmel的最新路由信息;路由解析模块,用于根据所述查询模块查询得到的所述动态Turmel的最新路由信息, 解析出所述动态Turmel所经过的接口和网元;诊断模块,用于检查所述动态Turmel所经过的接口和网元,以获知所述动态Turmel中的疑似故障点。
9.根据权利要求8所述的网管设备,其特征在于, 所述诊断模块包括生成子模块,用于生成测试命令集合;测试子模块,用于利用所述生成子模块生成的测试命令集合测试所述动态Turmel所经过的接口和网元,以获知所述动态Turmel的疑似故障点; 或者,所述诊断模块包括查询子模块,用于根据所述动态Turmel所经过的接口和网元,查询出所述动态Turmel 所经过路由上的所有告警和该动态Turmel上的所有告警;推演子模块,用于基于预设的推演规则对所述查询出的所有告警进行相关性分析,以得出根因告警,其中,所述推演规则至少包括如下规则中的一种上游告警是下游告警的根因告警、接口告警是动态Turmel告警的根因告警、物理接口告警是其绑定的逻辑接口告警的根因告警; 或者,所述诊断模块包括配置检查子模块,检查所述动态Turmel所经过的接口和网元的配置数据的正确性; 确定子模块,用于根据检测结果确定所述动态Turmel中的疑似故障点。
10.根据权利要求8或9所述的网管设备,其特征在于,所述存储器具体用于,在接收到所述动态Turmel首次变为UP状态的通知后,保存所述动态Turmel当时的路由信息;当用户查询所述动态Tunnel当前的路由信息时,若所述动态 Tunnel当前的路由信息与已保存的对应所述动态Tunnel的路由信息存在差异,且接收到用户的路由信息保存指令,则保存所述动态Tunnel当前的路由信息;在接收到对应所述动态Turmel的路由变更通知后,若接收到用户的路由信息保存指令,则保存所述路由变更通知中携带的所述动态Turmel变更后的路由信息。
11. 一种故障诊断系统,其特征在于,包括 如权利要求8 10任一项所述的网管设备。
全文摘要
一种动态隧道故障诊断方法和设备及系统。其中,一种动态隧道故障诊断方法,可包括网管保存动态隧道Tunne1的路由信息;在发现动态Tunnel故障时,查询在动态Tunnel故障前所保存的对应该动态Tunnel的最新路由信息;根据查询得到的该动态Tunnel的最新路由信息,解析出该动态Tunnel所经过的接口和网元;检查该动态Tunnel所经过的接口和网元,以获知该动态Tunnel中的疑似故障点。本发明实施例提供的技术方案有利于降低排查动态Tunnel故障的复杂度,提升动态Tunnel故障排查效率。
文档编号H04L12/24GK102308524SQ201180001572
公开日2012年1月4日 申请日期2011年7月22日 优先权日2011年7月22日
发明者刘德安 申请人:华为技术有限公司
再多了解一些
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1