本发明涉及一种基于网络和时间约束的告警序列模式挖掘方法,属于电力通信领域。
背景技术:
随着电力通信网络及业务的快速发展,电力通信技术已经成为电力生产的一个重要环节,电力通信传输网络的可靠性成为影响着电力生产安全的重要组成部分。告警是故障的外在呈现,具有传递性和多方面、多环节显现等特点[2],即一条根告警会引起大量次要衍生告警,甚至可能引起“告警风暴”。运维人员如能第一时间对系统告警准确判断并及时处理,可以大大减少故障处理时间,迅速恢复业务系统正常使用,故告警相关性分析是故障分析和处理的基础。
然而告警相关性分析的传统手段存在如下问题:
1)传统手段主要依据告警规则树、白名单等先验知识,需要精通相关业务和技术的专家支撑,且各厂家、各设备类型的规则均不同,需要庞大的专家团队支撑
2)电力传输网络复杂多变,告警数量庞大、实时性强,传统分析手段无法适应,规则维护的难度和工作量非常大,无法自动更新规则树、白名单,可能会导致告警相关性分析的准确性和效率大大降低。
技术实现要素:
为了解决上述技术问题,本发明提供了一种基于网络和时间约束的告警序列模式挖掘方法。
为了达到上述目的,本发明所采用的技术方案是:
一种基于网络和时间约束的告警序列模式挖掘方法,包括以下步骤,
告警初始序列生成:获取网络管理系统中某段时间的告警,生成告警初始序列;
网络约束分析:将告警初始序列拆解为若干条告警序列,每条告警序列对应一组存在网络约束关系的设备;
时间约束分析:设定时间窗,过滤掉告警序列中时间窗之外的告警,得到新的告警序列;
告警序列模式挖掘:基于新的告警序列,挖掘告警序列模式;
告警规范生成:基于告警序列模式,生成最终告警规则。
对告警进行预处理,生成告警初始序列,告警预处理的过程为,
将告警按时间进行排序;
用不同的参量映射不同的告警类型;
用参量和时间表示一个告警,并按时间形成告警初始序列。
告警的表示形式为k(i),其中,k为参量,表示告警类型,i为告警发生的相对时间,即该告警发生的时间与第一个告警发生的时间之差。
根据网络管理系统业务开通情况,将涉及告警的设备集分成若干组,每组对应一个业务,每条告警序列对应一组设备。
设定频繁模式阈值c,找出大于阈值的所有频繁模式。
设定置信度conf,基于告警序列模式,生成最终告警规则,即提供给用户的告警关联知识。
本发明所达到的有益效果:1、本发明无需事先知道告警规则,对运维和管理人员的要求大大降低;2、本发明可以实现告警关联知识的自动更新,提升了告警相关性分析的准确性和效率;3、本发明通过网络和时间约束,提升了告警序列模式挖掘的针对性和效率,相对于一般的告警序列模式挖掘方法,准确性和效率更高。
附图说明
图1为本发明的流程图;
图2为电力通信网络传输拓扑实施例示范图;
图3为是序列模式挖掘实施例示范图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于网络和时间约束的告警序列模式挖掘方法,包括以下步骤:
步骤1,告警初始序列生成:获取网络管理系统中某段时间的告警,对告警进行预处理,生成告警初始序列。
告警预处理的过程为:
将告警按时间进行排序;
用不同的参量映射不同的告警类型;
用参量和时间表示一个告警,并按时间形成告警初始序列;告警的表示形式为k(i),其中,k为参量,表示告警类型,i为告警发生的相对时间,即该告警发生的时间与第一个告警发生的时间之差。
步骤2,网络约束分析:将告警初始序列拆解为若干条告警序列,每条告警序列对应一组存在网络约束关系的设备。
根据网络管理系统业务开通情况,将涉及告警的设备集分成若干组,每组对应一个业务,每条告警序列对应一组设备。
步骤3,时间约束分析:设定时间窗,过滤掉告警序列中时间窗之外的告警,得到新的告警序列;
步骤4,告警序列模式挖掘:基于新的告警序列,挖掘告警序列模式。
设定频繁模式阈值c,找出大于阈值的所有频繁模式,频繁模式的发现过程包括迭代的两个阶段,频繁模式和剪枝,依次得到1-项集,2-项集,3-项集,…,l-项集;给定支持度阈值ξ,如果序列x在序列数据库s中的次数不低于ξ,则称序列x为序列模式,长度为1的模式成为1-模式。
步骤5,告警规范生成:设定置信度conf,基于告警序列模式,生成最终告警规则,即提供给用户的告警关联知识。
下面结合具体实施例进行说明:
获取某电网公司某段时间告警记录数据,如表1所示,以此告警数据记录为例,给出本发明所述基于网络和时间约束的告警序列模式挖掘方法的实施例。
表1某段时间告警记录
步骤1、告警初始序列生成;
为表述更清晰直观,对告警类型进行映射,如表2所示:
表2告警类型映射表
基于告警类型映射表,可得到告警初始序列={a(0),a(1),b(1),c(2),c(2),d(2),g(2),e(3),g(4),f(5),f(6),e(10),f(12),d(35)},将相对时间去掉,可简化为表3的方法表示:
表3告警初始序列
其中,括号内的表示同时发生。
步骤2、网络约束分析;
告警来自设备集m,其中设备集m={设备1,设备2,设备3,设备4,设备5,设备6,设备7},结合网络管理系统得到设备连接关系如附图2所示。
结合网络管理系统业务开通情况,可得到图中包含的两条电路,分别为:设备1<->设备3<->设备4;设备2<->设备5<->设备6<->设备7;故可将告警初始序列拆分为两条子序列,如表4所示。
表4网络约束下的序列
步骤3、时间约束分析;
假定时间窗15s,即从第一个告警开始后15s,过滤掉时间窗之外的告警,可得到时间约束条件下的序列,如表5所示。
表5时间约束下的序列
步骤4、告警序列模式挖掘;
假定频繁模式阈值2,找出大于阈值的所有频繁模式。频繁模式的发现过程包括迭代的两个阶段,频繁模式和剪枝,依次得到1-项集,2-项集,3-项集,4-项集,如附图3所示。
步骤5、告警规则生成
假定置信度为70%,基于上一小节得到的告警序列模式<a,c,e,f>,生成最终告警规范:r_los->ms_ais->au_ais->tu_ais。
上述方法解决了传统告警相关性分析对于先验知识的依赖,同时通过网络约束和时间约束,确保了告警序列模式挖掘的针对性和效率,提高了电力通信网告警相关性分析和故障诊断能力,提升了通信运行管理水平。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。