本技术实施例涉及故障诊断的,具体而言,涉及一种业务故障诊断方法、系统和存储介质。
背景技术:
1、光传送网(optical transport network,otn)是指在光域内实现业务信号的传送、复用、路由选择、监控,并且保证其性能指标和生存性的传送网络。
2、随着越来越多的业务承载在传输otn网络上,使得维护压力变得越来越大,尤其是发生业务故障时,目前在otn业务发生故障时,基于人工查询业务路由,包括查询业务路由途径的所有端口对象,逐一查看各端口对象是否存在告警以及存在什么告警,然后依据人工维护经验进行分析和定位,输出故障定位结果,但是由人工定位故障的整个过程历时久,平均故障定位历时1.5h,导致故障诊断的效率低下。
技术实现思路
1、本技术实施例提供一种业务故障诊断方法、系统和存储介质,旨在提升故障诊断过程的效率。
2、第一方面,本技术实施例提供一种业务故障诊断方法,所述方法包括:
3、获取目标时间段内业务端到端路由的所有原始告警层速率以及所有告警,其中,不同类型的原始告警层速率配置有不同的优先级;
4、根据所述所有原始告警层速率中优先级最高的原始告警层速率,确定所述业务端到端路由在目标时间段内的根因故障以及故障区间;
5、在预先构建的所有故障诊断线程中,调用所述优先级最高的原始告警层速率对应的多个故障诊断线程,所述多个故障诊断线程根据所述故障区间内的告警,生成至少一个故障原因,其中,所述所有故障诊断线程组成所述业务端到端路由的电信侧到用户侧的故障判断逻辑;
6、生成所述目标时间段内业务端到端路由的故障工单,所述故障工单内包括所述根因故障以及至少一个故障原因。
7、可选地,在获取目标时间段内业务端到端路由的所有原始告警层速率以及所有告警之前,所述方法还包括:
8、对于任一业务,采集该业务对应的全量otn设备数据,所述全量otn设备数据包括基础数据和业务路径数据,所述基础数据包括系统名称、网元id、设备属性、子架、机框、槽位、板卡以及端口的信息,所述业务路径数据包括传输网管上snc路径信息、snc路径名称、snc路径的az端网元及端口信息;
9、采集该业务对应的空间物理信息,所述空间物理信息包括odf架信息、尾纤编号以及机房/局站名称;
10、根据所述全量otn设备数据以及所述空间物理信息,按照该业务正向或反向信号流向,生成该业务端到端路由的拓扑结构。
11、可选地,获取目标时间段内业务端到端路由的所有原始告警层速率以及所有告警,包括:
12、采集所述业务在目标时间段内的原始告警信息,所述原始告警信息中包括不同对象对应的原始告警层速率以及告警;
13、分别将所述业务端到端路由的拓扑结构中不同对象在目标时间段内各自对应的原始告警层速率以及告警进行挂载。
14、可选地,所述方法还包括:
15、将value值为lr_digital_signal_rate的原始告警层速率的优先级配置为i级;
16、将value值为lr_optical_transmission_section和lr_optical_supervision_channel的原始告警层速率的优先级配置为ii级;
17、将value值为lr_optical_transmission_section和/或lr_optical_multiplex_section的原始告警层速率的优先级配置为iii级;
18、将value值为lr_optical_channel的原始告警层速率的优先级配置为iv级;
19、其中,i级、ii级、iii级以及iv级的优先级顺序依次降低。
20、可选地,根据所述所有原始告警层速率中优先级最高的原始告警层速率,确定所述业务端到端路由在目标时间段内的根因故障以及故障区间,包括:
21、当所述所有原始告警层速率中优先级最高的原始告警层速率为i级时,确定所述业务端到端路由在目标时间段内的根因故障为用户侧故障,所述故障区间为用户侧之间;
22、当所述所有原始告警层速率中优先级最高的原始告警层速率为ii级时,确定所述业务端到端路由在目标时间段内的根因故障为电信侧的光缆故障,所述故障区间为两个光放局站之间;
23、当所述所有原始告警层速率中优先级最高的原始告警层速率为iii级时,确定所述业务端到端路由在目标时间段内的根因故障为电信侧的系统故障,所述故障区间为出现告警的局站和上游站点内尾纤或者上游站点的板卡;
24、当所述所有原始告警层速率中优先级最高的原始告警层速率为iv级时,确定所述业务端到端路由在目标时间段内的根因故障为电信侧的单波故障,所述故障区间为业务传输的两端的线路侧单板之间。
25、可选地,所述方法还包括:
26、构建10个故障诊断线程,所述10个故障诊断线程包括:
27、alarmstartneislogin故障诊断线程,用于判断电路起始设备网元是否存在ne_not_login告警,所述ne_not_login告警表征所述起始设备网元存在接入光缆和/或机房电源故障;
28、alarmnestationinfo故障诊断线程,用于判断告警网元是否存在局站信息;
29、alarmblackout故障诊断线程,用于判断告警局站是否存在停电告警;
30、alarmstartportis故障诊断线程,用于判断起始端口是否存在r_los、r_lof以及eth_los告警,其中,所述r_los、r_lof以及eth_los告警表征存在用户侧光缆或机房尾纤故障;
31、alarmismutlosm故障诊断线程,用于判断电路所有端口下是否存在mut_los告警,所述mut_los告警表征所述业务的电路存在合路信号中断故障;
32、alarmmutlos故障诊断线程,用于判断先出现mut_los告警的网元是否有上一级网元;
33、alarmisosclosimpl故障诊断线程,用于判断网元是否有osc_los告警,所述osc_los告警表征所述业务的电路存在光监控信道中断故障;
34、alarmisoch故障诊断线程,用于判断电路所有och端口是否存在r_los告警;
35、alarmisochtimeslot故障诊断线程,用于判断电路所有端口是否有时隙告警;
36、alarmiscard故障诊断线程,用于判断电路的两端是否有板卡告警。
37、可选地,在预先构建的所有故障诊断线程中,调用所述优先级最高的原始告警层速率对应的多个故障诊断线程,包括:
38、当所述所有原始告警层速率中优先级最高的原始告警层速率为i级时,调用alarmstartneislogin、alarmnestationinfo、alarmblackout以及alarmstartportis故障诊断线程;
39、当所述所有原始告警层速率中优先级最高的原始告警层速率为ii级时,调用alarmismutlosm、alarmmutlos以及alarmisosclosimpl故障诊断线程;
40、当所述所有原始告警层速率中优先级最高的原始告警层速率为iii级时,调用alarmismutlosm以及alarmiscard故障诊断线程;
41、当所述所有原始告警层速率中优先级最高的原始告警层速率为iv级时,调用alarmisoch、alarmisochtimeslot以及alarmiscard故障诊断线程。
42、可选地,生成所述目标时间段内业务端到端路由的故障工单,包括:
43、生成每个故障原因对应的故障处理建议;
44、在所述故障工单中显示所述根因故障、至少一个故障原因以及所述故障原因对应的故障处理建议。
45、第二方面,本技术实施例提供一种业务故障诊断系统,所述系统包括:
46、获取模块,用于获取目标时间段内业务端到端路由的所有原始告警层速率以及所有告警,其中,不同类型的原始告警层速率配置有不同的优先级;
47、根因故障确定模块,用于根据所述所有原始告警层速率中优先级最高的原始告警层速率,确定所述业务端到端路由在目标时间段内的根因故障以及故障区间;
48、故障原因生成模块,用于在预先构建的所有故障诊断线程中,调用所述优先级最高的原始告警层速率对应的多个故障诊断线程,所述多个故障诊断线程根据所述故障区间内的告警,生成至少一个故障原因,其中,所述所有故障诊断线程组成所述业务端到端路由的电信侧到用户侧的故障判断逻辑;
49、故障工单生成模块,用于生成所述目标时间段内业务端到端路由的故障工单,所述故障工单内包括所述根因故障以及至少一个故障原因。
50、第三方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如实施例第一方面所述的业务故障诊断方法。
51、有益效果:
52、获取目标时间段内业务端到端路由的所有原始告警层速率以及所有告警,不同类型的原始告警层速率配置有不同的优先级,根据优先级最高的原始告警层速率,确定业务端到端路由在目标时间段内的根因故障以及故障区间,然后在预先构建的所有故障诊断线程中,调用优先级最高的原始告警层速率对应的多个故障诊断线程,多个故障诊断线程根据所述故障区间内的告警,生成至少一个故障原因,最后生成目标时间段内业务端到端路由的故障工单,故障工单内包括根因故障以及至少一个故障原因。
53、相比于人工查询逐一查看各端口对象是否存在告警以及存在什么告警,并输出故障定位而言,本方法通过业务端对端路由中的优先级最高原始告警层速率,快速定位到根因故障,并调用优先级最高原始告警层速率对应的故障诊断线程进行故障诊断,可以针对最主要的故障进行诊断,提高了故障诊断的效率。