一种故障定位分析的方法及系统的制作方法

文档序号:9633684阅读:299来源:国知局
一种故障定位分析的方法及系统的制作方法
【技术领域】
[0001]本发明涉及通信技术领域,尤其涉及一种故障定位分析的方法及系统。
【背景技术】
[0002]在当前的通信系统中,网络管理系统(以下简称网管系统)起到越来越重要的作用,可以说已经是通信系统不可或缺的一部分。现在的厂商网管系统基本都遵循TMN的管理框架,提供对通信设备的故障、配置、计费、性能、安全(FCAPS)的管理能力,也是通信设备在运行过程中必须给予关注的五个方面。由于通信系统的复杂性,网管系统本身软件的复杂性,在工程运行中,不可避免会出现故障。
[0003]当然每个厂商的网管系统以及其通信系统,在出厂时都会进行严格的内部测试、完善的试验局测试等等验证,但现实的20% -80%原则决定了有20%的问题只能在用户场景暴露。这一方面是测试本身不到位导致,另一方面也是工程的复杂环境、通信系统本身的复杂度的客观因素决定。既然问题无可避免,那么出现问题后如何复现,以便定位解决,是我们需要思考的问题。
[0004]目前对于网管系统的工程故障复现的方法,主要是尽力营造工程环境进行复现,其中工程环境包括网管版本、发生问题的板卡、板卡软件、主控板卡、主控板卡软件、实际的业务配置等等。该方法在复现过程中,需要进行设备投入和复现效果二者的取舍,主要存在问题如下。
[0005]1)如完全营造工程场景,设备投入过高。现网的工程场景动辄成百上千的网元、板卡,造价不菲,后方研发的设备资源非常分散而且有限。如果完全营造工程场景,即便是耗费大量人力、物力,也几乎是不可能完成的任务。
[0006]2)尽力而为的复现方法可能会漏掉重要信息,导致无法复现。更为实际的做法是通过工程师的经验,提取工程的重要配置,搭建简单而有效的环境,称为尽力而为的方法。这对工程师的经验、技术要求很高。但即使是经验丰富的工程师、专家,也有可能在复杂的工程环境下漏掉重要信息,导致复现失败。
[0007]3)搭建实际复现环境,工作量投入太大。复现实际工程环境,除却准备设备之外,对工程环境的各板卡版本均需要升级,对有实际业务配置的还需要进行业务配置,前前后后人力投入太大。
[0008]综上所述,现有技术中针对网管系统中故障的复现方式以及分析方法,不仅设备投入量大,而且增大了操作人员的工作量,且将故障进行复现并定位的成功率较低。

【发明内容】

[0009]本发明提供了一种故障定位分析的方法及系统,用以通过搭建的场景复现系统和快照网元系统对网管系统中的故障进行定位分析,从而减少了投入的设备和工作量,提高了故障定位分析的成功率。
[0010]本发明实施例提供了一种故障定位分析的方法,包括:
[0011]根据网管系统运行中产生故障时备份的网元快照信息搭建场景复现系统和快照网元系统,其中所述快照网元系统中包括与所述网管系统进行交互的网元一一对应的代理网元;
[0012]根据所述网元快照信息,所述场景复现系统与所述快照网元系统中的代理网元之间进行信息交互,根据所述快照网元系统反馈的报文信息确定所述故障。
[0013]通过本发明实施例提供的故障定位分析方法,首先根据网管系统在产生故障时备份的网元快照信息搭建场景复现系统和快照网元系统,且快照网元系统中包括与所述网管系统进行交互的网元一一对应的代理网元;然后根据网管系统中备份的网元快照信息,使场景复现系统与快照网元系统产生相同的信息交互,最后根据快照网元系统反馈的报文信息确定网管系统的故障。因此,本发明中是在搭建的场景复现系统和快照网元系统中进行故障复现,并根据报文信息确定故障发生的位置,以及解决故障的方法,本发明实施例提供的故障定位分析的方法,不用投入大量的设备,操作人员仅在场景复现系统中对故障进行分析,减少了工作量的投入,且故障复现完全通过网管系统中备份的网元快照信息实现,提高了故障定位分析的成功率。
[0014]较佳地,所述根据网管系统运行中产生故障时备份的网元快照信息搭建场景复现系统和快照网元系统,包括:
[0015]根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据搭建场景复现系统;
[0016]根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据搭建快照网元系统;
[0017]其中,所述网管配置数据包括多个网元的设备类型、IP地址、板卡、端口、交叉配置以及业务配置的数据;所述通信报文数据包括网管系统发送给每个网元的查询或设置报文、每个网元返回给网管系统的应答报文的数据。
[0018]较佳地,根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据搭建快照网元系统,包括:
[0019]根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据,形成快照网元系统中的代理网元。
[0020]较佳地,根据所述网元快照信息,所述场景复现系统与所述快照网元系统中的代理网元之间进行信息交互,包括:
[0021]根据所述网元快照信息中的操作日志数据,所述场景复现系统对所述快照网元系统中的代理网元进行操作,其中所述操作日志数据包括操作人员的操作时间、操作对象、操作类型和操作结果的数据。
[0022]较佳地,在所述场景复现系统与所述快照网元系统中的代理网元之间进行信息交互时,该方法还包括:
[0023]监控所述场景复现系统与所述快照网元系统之间的信息交互。
[0024]较佳地,根据所述快照网元系统反馈的报文信息确定所述故障,包括:
[0025]当所述快照网元系统中的代理网元接收到场景复现系统的查询或者设置请求时,获取该代理网元的报文命令码;
[0026]所述快照网元系统根据所述报文命令码,以及从所述场景复现系统中获取的通信报文数据,确定响应报文;
[0027]所述快照网元系统将所述响应报文反馈给所述场景复现系统;
[0028]所述场景复现系统根据所述响应报文定位所述故障。
[0029]本发明实施例提供的一种故障定位分析的系统,包括:
[0030]根据网管系统运行中产生故障时备份的网元快照信息搭建的场景复现系统;
[0031]和根据网管系统运行中产生故障时备份的网元快照信息搭建快照网元系统,其中,所述快照网元系统中包括与所述网管系统进行交互的网元一一对应的代理网元;
[0032]所述场景复现系统,用于根据所述网元快照信息,所述场景复现系统与所述快照网元系统中的代理网元之间进行信息交互,以及根据所述快照网元系统反馈的报文信息确定所述故障。
[0033]通过本发明实施例提供的故障定位分析系统,包括根据网管系统在产生故障时备份的网元快照信息搭建场景复现系统和快照网元系统,且快照网元系统中包括与所述网管系统进行交互的网元一一对应的代理网元;其中,场景复现系统用于根据网管系统中备份的网元快照信息,使场景复现系统与快照网元系统产生相同的信息交互,最后根据快照网元系统反馈的报文信息确定网管系统的故障。因此,本发明中是在搭建的场景复现系统和快照网元系统中进行故障复现,并根据报文信息确定故障发生的位置,以及解决故障的方法,本发明实施例提供的故障定位分析的方法,不用投入大量的设备,操作人员仅在场景复现系统中对故障进行分析,减少了工作量的投入,且故障复现完全通过网管系统中备份的网元快照信息实现,提高了故障定位分析的成功率。
[0034]较佳地,所述场景复现系统,包括:
[0035]配置恢复模块,用于根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据搭建场景复现系统;
[0036]所述快照网元系统具体用于根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据搭建快照网元系统;
[0037]其中,所述网管配置数据包括多个网元的设备类型、IP地址、板卡、端口、交叉配置以及业务配置的数据;所述通信报文数据包括网管系统发送给每个网元的查询或设置报文、每个网元返回给网管系统的应答报文的数据。
[0038]较佳地,所述快照网元系统,包括:
[0039]快照配置模块,用于根据网管系统运行中产生故障时备份的网元快照信息中的网管配置数据和通信报文数据,形成快照网元系统中的代理
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1