一种获取移动网络故障定位和故障预警的方法

文档序号:9330379阅读:527来源:国知局
一种获取移动网络故障定位和故障预警的方法
【技术领域】
[0001] 本发明涉及网络通信领域,具体地说是一种实用性强、获取移动网络故障定位和 故障预警的方法。
【背景技术】
[0002] 在移动通信中,交换设备众多、指标复杂,每天的数据日以万记的积累,若采用传 统的监控方式,就会非常被动,出现的问题往往不能及时发现,只有设备出现故障报了告警 才能知道,即使发现了又不能迅速获知问题根源,更别提对未来数据的预测了,或者只有通 过维护人员定期检查设备或者网络才能发现,使得网管系统的运营维护工作非常繁重。
[0003] 实际上,有时候多种故障可能是同一个故障引起的,如果不能进行解决,还可以引 起其他的故障,这就需要根据网络设备的运行数据,尽可能的分析出各告警之间的潜在联 系,快速进行故障定位和故障预警,这样才能减轻维护人员的工作,并能做到防患于未然, 为预警、优化、规划工作提供有力支撑。基于此,现提供一种获取移动网络故障定位和故障 预警的方法。

【发明内容】

[0004] 本发明的技术任务是针对以上不足之处,提供一种实用性强、获取移动网络故障 定位和故障预警的方法。
[0005] -种获取移动网络故障定位和故障预警的方法,其具体实现过程为: 在网管系统中将相关的告警进行分析,找出其中的潜在关系,将所有的关系拆分成可 以配置的数据,维护这些数据相关的配置表; 获取每一个标题的告警数据相应的资源或者故障信息; 将当前告警和其他已经获取相关信息的告警进行关联比较,然后将告警进行关联分 析,获取告警产生的原因; 根据不同的告警进行故障判断,将判断过程和结论根据配置好的数据进行派单和短信 发送,使相关人员能快速定位问题,预测隐患。
[0006] 所述拆分数据相关的配置表包括规则表、衍生关系表、主次关系表、告警定位表、 关联表、结论表、派单规则表、短信设置表,在一个完整的规则里面,主次和衍生关系表只能 用到一个,衍生是根据当前现有的告警在生成一条新的告警;主次是一条告警是主告警,另 一条是次告警,都是采集上来的告警,进行关联就是增加它们之间的关系。
[0007] 所述配置表中,各规则表的具体内容为: 规则表,包括规则名字、规则类型清除方式、衍生时的衍生门限、以及厂家、设备类型、 关联资源说明、是否启用信息,所述规则类型清楚方式中的规则类型是指主次或衍生; 衍生关系表,配置衍生告警标题和次告警标题的衍生规则关系,哪些类型的次告警,限 时内发生η条时则衍生一条新的告警; 主次关系表,是指哪些主告警标题和哪些次告警标题可以进行关联的关系表,限时内 进行关联;主次关联有优先级,当优先级高的存在时,则优先级低的不处理,相对应的结论 表针对不同的优先级,也有不同的故障结论; 告警定位表,根据梳理好的规则,查找到告警相关的信息,其中包括机房、电路、局站、 归属的告警相关信息是告警之间关联的依据; 定位关系表,在定位函数中,将需要关联的字段写到定位结果表中的相关字段中 RELATION_LOCATION和SYNTHE_RELATED_ACT_ALARM,两个表中的数据是一样的,字段名字 不同,关联关系表中将字段之间的关系标注,把多条具有相关关系的告警关联到一起,当衍 生超过一定数量时衍生出一条告警,当主次关联时则挂接到一起; 结论表,根据告警相关信息,分析告警产生的可能原因,记录下判断过程,以及判断结 论; 派单规则表和短信配置表,将故障结论和故障判断过程等信息进行工单派发和短信通 知给设备相关人员。
[0008] 所述告警的具体预警过程为: 当活动告警发出后,首先进行标准化入库,然后再判断是否需要进行告警定位; 如果不需要到此结束,如果需要,则进行告警定位并将定位结果入库,然后再获取此条 告警相关的关联规则; 如果是衍生,则判断是否符合衍生条件,不符合则去定位库中查找其他符合此规则的 告警,再判断是否符合衍生条件,如果不符合则结束,符合就衍生,判断故障过程并获得结 论,然后再判断是否需要派单和短信,不符合就结束,符合就派单和短信通知; 如果是主次,判断是否符合主次关联规则,如果符合就关联,判断故障原因和故障结 论,然后判断是否需要派单和短信通知,然后结束。
[0009] 还包括新规则加入的步骤,该新规则的具体增加过程为: 首先获取活动告警,增加规则信息; 根据告警标题添加定位函数; 确定告警为主次告警还是衍生告警:当为主次告警时,增加主次告警标题的关联规则; 当为衍生告警时,增加衍生标题和次告警的关联规则; 增加定位关系表、结论表结论; 确定是否需要拍单或短信:需要时则设置短信或工单规则并结束;不需要时则直接结 束。
[0010] 本发明的一种获取移动网络故障定位和故障预警的方法,与现有技术相比,具有 以下优点: 本发明提出的一种获取移动网络故障定位和故障预警的方法,可以避免维护人员的大 工作量告警数据分析,降低了工作的复杂度,更好的优化网络质量;可以自动实现告警故障 的快速定位,以及隐患预警,快速定位是指通过单个告警很难发现故障产生的原因,综合有 关系的多条件就可以快速定位,减少了维护人员的工作量,提高了工作效率;隐患预警是指 可以通过此次告警,找出故障点,可以预防其他相关设备产生同样的问题,例如有四个交换 机产生了挂接在了同一个CE上,产生了相关告警,这个CE上工挂接了六个交换机,那么就 可以预测其他的两个交换机是不是也会有问题,这样就可以进行故障预警,提高网络质量; 自动化是指需要将相关的规则进行拆分,配置相关数据就可以自动根据需要进行判断,远 比维护人员去分析来得快,来得准确,还可以随时添加新的规则来进行更多方面的预警,而 且可以节省开发时间,降低了开发的复杂度,提高了开发效率,实用性强,易于推广。
【附图说明】
[0011] 附图1是本发明的实现流程图。
[0012] 附图2是本发明中增加新规则步骤的实现流程图。
【具体实施方式】
[0013] 下面结合附图和具体实施例对本发明作进一步说明。
[0014] 现结合某移动网络运营维护的实践经验和现实需求,提供一种获取移动网络故障 定位和故障预警的方法, 如附图1所示,其具体实现过程为: 在网管系统中将相关的告警进行分析,找出其中的潜在关系,将所有的关系拆分成可 以配置的数据,维护这些数据相关的配置表; 获取每一个标题的告警数据相应的资源或者故障信息; 将当前告警和其他已经获取相关信息的告警进行关联比较,然后将告警进行关联分 析,获取告警产生的原因; 根据不同的告警进行故障判断,将判断过程和结论根据配置好的数据进行派单和短信 发送,使相关人员能快速定位问题,预测隐患。
[0015] 所述拆分数据相关的配置表包括规则表、衍生关系表、主次关系表、告警定位表、 关联表、结论表、派单规则表、短信设置表,在一个完整的规则里面,主次和衍生关系表只能 用到一个,衍生是根据当前现有的告警在生成一条新的告警;主次是一条告警是主告警,另 一条是次告警,都是采集上来的告警,进行关联就是增加它们之间的关系。
[0016] 所述配置表中,各规则表的具体内容为: 规则表,包括规则名字、规则类型清除方式、衍生时的衍生门限、以及厂家、设备类型、 关联资源说明、是否启用信息,所述规则类型清楚方式中的规则类型是指主次或衍生; 衍生关系表,配置衍生告警标题和次告警标题的衍生规则关系,哪些类型的次告警,限 时内发生η条时则衍生一条新的告警; 主次关系表,是指哪些主告警标题和哪些次告警标题可以进行关联的关系表,限时内 进行关联;主次关联有优先级,当优先级高的存在时,则优先级低的不处理,相对应的结论 表针对不同的优先级,也有不同的故障结论; 告警定位表,根据梳理好的规则,查找到告警相关的信息,其中包括机房、电路、局站、 归属的告警相关信息是告警之间关联的依据; 定位关系表,在定位函数中,将需要关联的字段写到定位结果表中的相关字段中 RELATI0N_L0CATI0N和SYNTHE_RELATED_ACT_ALARM,两个表中的数据是一样的,字段名字 不同,关联关系表中将字段之间的关系标注,把多条具有相关关系的告警关联到一起,当衍 生超过一定数量时衍生出一条告警,当主次关联时则挂接到一起; 结论表,根据告警相关信息,分析告警产生的可能原因,记录下判断过程,以及判断结 论; 派单规则表和短信配置表,将故障结论和故障判断过程等信息进行工单派发和短信通 知给设备相关人员。
[0017] 所述告警的具体预警过程为: 当活动告警发出后,首先进行标准化入库,然后再判断是否需要进行告警定位; 如果不需要到此结束,如果需要,则进行告警定位并将定位结果入库,然后再获取此条 告警相关的关联规则; 如果是衍生,则判断是否符合衍生条件,不符合则去定位库中查找其他符合此规则的 告警,再判断是否符合衍生条件,如果不符合则结束,符合就衍生,判断故障过程并获得结 论,然后再判断是否需要派单和短信,不符合就结束,符合就派单和短信通知; 如果是主次,判断是否符合主次关联规则,如果符合就关联,判断故障原因和故障结 论,然后判断是否需要派单和短信通知,然后结束。
[0018] 还包括新规则加入的步骤,该新规则的具体增加过程为: 首先获取活动告警,增加规则信息; 根据告警标题添加定位函数; 确定告警为主次告警还是衍生告警:当为主次告警时,增加主次告警标题的关联规则; 当为衍生告警时,增加衍生标题和次告警的关联规则; 增加定位关系表、结论表结论; 确定是否需要拍单或短信:需要时则设置短信或工单规则并结束;不需要时则直接结 束。
[0019] 衍生实例:监控平台在同一时段(5分钟之内)发现大于等于2个交换网元 (SERVER/MGW)出现告警(见下表),获取这些设备的归属CE,如果这些交换网元连接在同一 CE上,则衍生出一条CE的IP承载网H. 248断连的告警。
[0020] 配置数据: 关联规则配置:
衍生规则配置:
定位函数配置:
告警定位结果表RELATION_LOCATION表内容:
关联关系配置: 因为归属CE是多个,所以需要将CE拆分,关联关系就不需要配置,程序中拆分获取。 [0021] 故障结论表:
生成的告警相关信息: 告警[衍生预警]交换H. 248故障衍生CE设备预警。
[0022] 告警级别:一级告警。
[0023] 设备类型:CE。
[0024] 设备名称:UN
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1