一种基于伴随告警关联体的电力信息系统故障溯源方法与流程

文档序号:28922626发布日期:2022-02-16 13:35阅读:125来源:国知局
一种基于伴随告警关联体的电力信息系统故障溯源方法与流程

1.本发明涉及电力信息技术领域,提供了一种基于伴随告警关联体的电力信息系统故障溯源方法。


背景技术:

2.随着电力信息系统的不断发展,涉及的设备数量众多且种类繁杂。庞大复杂的设备构成增加了系统故障概率,故障排查和恢复难度较大,且各个系统本身具有较复杂的功能,运维人员在日常工作中需要掌握大量管理工具和策略,导致运维人难度增加。如何实现高效发现电力信息系统中信息隐患和多元故障等状况,并快速解决保证系统的正常稳定运行,已成为电力信息系统运维亟待解决的问题。
3.在当前电力信息系统的运维中,主要基于历史告警数据的挖掘进行故障溯源。常规方法流程为:基于历史告警数据的时间序列生成告警项集,再利用关联规则挖掘算法进行挖掘,随后通过匹配关联规则实现故障溯源。目前生成用于挖掘的告警项集的方法中,通常使用滑动时间窗口方法从历史数据中生成项集。该方法方便、易于实现,但在实际的电力信息系统中,由于告警的发生在时间轴上非均匀分布的,且不同类型的告警在时间和系统内的影响范围和程度不一致,同时过于简单的划分可能丢在时间序列上相邻的告警之间的关联性,为后续的关联规则挖掘带来一定的负面影响。


技术实现要素:

4.本发明的目的在于解决实际的电力信息系统中,由于告警的发生在时间轴上非均匀分布的,且不同类型的告警在时间和系统内的影响范围和程度不一致,同时过于简单的划分可能丢失在时间序列上相邻的告警之间的关联性,为后续的关联规则挖掘带来一定的负面影响的问题。
5.为了解决上述技术问题本发明采用以下技术手段:
6.一种基于伴随告警关联体的电力信息系统故障溯源方法,包括以下步骤:
7.步骤1、对历史告警数据集,通过大的滑动时间窗口对数据集进行粗划分,然后对划分结果用小的滑动时间窗口基于告警影响系数、告警时间密度情况做进一步细划分,得到告警项集alarmdatasets;
8.步骤2、统计历史告警数据集合中所有不同的告警类型,形成告警类别集合 alarmclass={ac1,ac2,

,acm},m为历史发生的告警的类型数,建立元素初始值为0,维度为m*m的初始告警关联矩阵alarmmetrix:
[0009][0010]
其中a
ij
表示类型为aci的告警发生导致类型为acj的告警的次数,即告警类型aci对于告警类型acj的支持度,对角线位置的元素可表示对应行或列的各种告警发生的次数,其
中i∈m,j∈m;
[0011]
步骤3、根据告警项集alarmdatasets对告警关联矩阵alarmmetrix中的每一元素的数值进行更新;
[0012]
步骤4、根据告警关联矩阵,快速的查找到根告警和衍生告警,对故障进行分析。
[0013]
上述技术方案中,步骤1包括如下步骤:
[0014]
步骤1.1:从历史告警数据集中最早发生的告警项开始时间起,按时间窗间隔l划分时间轴,将告警数据集alarmdata中对应每一个时间间隔l内的所有告警项按序划分一个分段数据集alarmdatasub,对每一个分段数据集 alarmdatasub,执行步骤1.2-步骤1.9;
[0015]
步骤1.2:记i=1,j=1(j是项集adsj的下标),d0为空,若分片数据集 alarmdatasub不为空,按时间顺序从分片数据集alarmdatasub中取出告警数据流di={a
i1
,a
i2
,

,a
im
},其中a
im
代表第i个分段数据集alarmdatasub中第 m个告警项;
[0016]
步骤1.3:待处理告警数据流di=di+d
i-1

[0017]
步骤1.4:若告警数据流di内告警时间宽度(am.starttime

a1.starttime) 小于2*r,则i=i+1,再从历史告警数据集中按时间顺序取一批数据d
i+1
,回到步骤1.2,否则进行步骤1.5,其中am.starttime代表am的告警发生时间,
[0018]
步骤1.5:初始化时间窗口w,w等于di的告警时间宽度,即窗口w为 [a1.starttime,am.starttime];
[0019]
步骤1.6:计算时间窗口w下的最晚告警项发生时间last(w),各告警项的平均发生时间mean(w),最接近平均发生时间mean(w)的告警项发生时间mid(w);
[0020]
步骤1.7:若mid(w)+r》last(w),则返回步骤1.2,否则记新时间窗口 w’为[mid(w)-r,mid(w)+r,],进行步骤1.8,r表示小时间尺度的初始窗口半径参数;
[0021]
步骤1.8:若mid(w’)》mid(w),则令w=w’,返回步骤1.6,否则计算告警数据流di中首项告警项的持续时间fct(di);
[0022]
步骤1.9:当fct(di)》=w’时,取告警数据流di中首个告警项持续时间内的所有告警项为一个项集adsj,项集adsj放入告警项集的集合alarmdataset 中,j=j+1,并从di中删除adsj中的对应的告警项回到步骤1.3,比如ads1= [a1,a2,a3],;从di中移出对应的告警项a1,a2,a3;
[0023]
当fct(di)《w’时,扫描告警数据流di并选择在首个告警项结束时刻至w’窗口内最后一个告警项开始时间内告警影响系数最大的告警项a
index_max
,随机以告警项a
index_max
的告警影响系数a
index_max
.alarmlevelparam为概率取告警数据流di中该告警项a
index_max
以前发生的所有告警项生成项集adsj或以(1
‑ꢀaj
.alarmlevelparam)为概率取告警数据流di中首项告警开始时间至窗口w’右侧时刻内的所有告警生成项集adsj;
[0024]
将前述生成的项集adsj,放入告警项集的集合alarmdataset中,j=j+1,,从di 中删除,回到步骤1.3;
[0025]
步骤1.10:合并每一个时间窗l划分的alarmdatasub经步骤1.2-1.9生成的alarmdataset,最终生成告警项集alarmdatasets={ads1,ads2,

, adsk}。
[0026]
上述技术方案中,步骤3包括如下步骤:
[0027]
步骤3.1、从告警项集的集合alarmdatasets中取出一个告警项集adsi;
[0028]
步骤3.2、从告警项集adsi中取出首项告警aj,记录其告警类别ack,记录告警项集
adsi中排在aj之后的每项告警的类别alarmclass
ij
={j1, j2,

},当adsi为空时跳转至步骤3.1;
[0029]
步骤3.3、将alarmmetrix[k,alarmclass
ij
{j1}],alarmmetrix[k,alarmclass
ij
{j2}]

的数值加1,即告警次数加1,其中alarmmetrix[x,y]表示 alarmmetrix矩阵中第x行,第y列的数据,;
[0030]
步骤3.4、将alarmmetrix[k,k]的数值加1,其中k为告警类别ack的下标值,跳转执行步骤3.2。
[0031]
上述技术方案中,步骤4具体包括以下步骤:
[0032]
步骤4.1、设置跟随置信度阈值conf和支持度阈值sup;
[0033]
步骤4.2、对于任意一个实时产生的告警,根据其告警类别aci的,判断告警关联矩阵中的第i行中的每一个数据a
ij
(j≠i),即alarmmetrix[i,j]的值是否满足如下条件:
[0034]
1)、alarmmetrix[i,j]》sup;
[0035]
2)、alarmmetrix[i,j]/alarmmetrix[i,i]》conf.
[0036]
当满足上述两个条件时,告警类别为acj的告警为告警类别为aci的告警的衍生告警;
[0037]
对于任意一个告警类型为aci的告警,判断告警关联矩阵中的第i列中
[0038]
的每一个数据数据a
ji
(j≠i),即alarmmetrix[j,i]是否满足如下条件:
[0039]
1)、alarmmetrix[j,i]》sup;
[0040]
2)、alarmmetrix[j,i]/alarmmetrix[j,j]》conf;
[0041]
当存在告警类别为acj的告警满足上述两个条件时,说明告警类别为 acj的告警是类型为aci的告警的前项告警,将其加入前项告警集合 prealarm={ac
j1
,ac
j2
,

};当不存在满足上述条件的数据时,将告警类型 aci加入到推荐根告警类型集合recalarm={ac
r1
,ac
r2


}中;
[0042]
步骤4.3、若prealarm不空,从prealarm中取出尾项ac
jk
,设置ac
jk
为给定的告警类型回到步骤4.2重复上述流程。
[0043]
步骤4.4、根据推荐根告警类型集合recalarm中推荐的各告警类型,查找最近时间轴上的已发生历史告警项中符合对应告警类型的告警项作为推荐根告警项,以辅助运维人员进行故障排查。
[0044]
本发明还提供了一种基于伴随告警关联体的电力信息系统故障溯源装置,其特征在于包括:
[0045]
告警项集alarmdatasets模块、对历史告警数据集,通过大的滑动时间窗口对数据集进行粗划分,然后对划分结果用小的滑动时间窗口基于告警影响系数、告警时间密度情况做进一步细划分,得到告警项集alarmdatasets;
[0046]
初始告警关联矩阵模块、统计历史告警数据集合中所有不同的告警类型,形成告警类别集合alarmclass={ac1,ac2,

,acm},m为历史发生的告警的类型数,建立元素初始值为0,维度为m*m的初始告警关联矩阵 alarmmetrix:
[0047][0048]
其中a
ij
表示类型为aci的告警发生导致类型为acj的告警的次数,即告警类型aci对于告警类型acj的支持度,对角线位置的元素可表示对应行或列的各种告警发生的次数,其中i∈m,j∈m;
[0049]
初始告警关联矩阵更新模块、根据告警项集alarmdatasets对告警关联矩阵alarmmetrix中的每一元素的数值进行更新,即对告警发生次数进行更新;
[0050]
告警溯源模块、根据更新后的告警关联矩阵,快速的查找到根告警和衍生告警,对故障进行分析。
[0051]
上述技术方案中,告警项集alarmdatasets模块实现如下:
[0052]
步骤1.1:从历史告警数据集中最早发生的告警项开始时间起,按时间窗间隔l划分时间轴,将告警数据集alarmdata中对应每一个时间间隔l内的所有告警项按序划分一个分段数据集alarmdatasub,对每一个分段数据集 alarmdatasub执行步骤1.2-步骤1.9;
[0053]
步骤1.2:记i=1,j=1,j是项集adsj的下标,d0为空,若分片数据集 alarmdatasub不为空,按时间顺序从分片数据集alarmdatasub中取出告警数据流di={a
i1
,a
i2
,

,a
im
},其中a
im
代表第i个分段数据集alarmdatasub中第 m个告警项;
[0054]
步骤1.3:待处理告警数据流di=di+d
i-1

[0055]
步骤1.4:若告警数据流di内告警时间宽度(am.starttime

a1.starttime) 小于2*r,则i=i+1,再从历史告警数据集中按时间顺序取一批告警数据流d
i+1
,回到步骤1.2,否则进行步骤1.5,其中am.starttime代表am的告警发生时间,
[0056]
步骤1.5:初始化时间窗口w,w等于告警数据流di的告警时间宽度,即窗口w为[a1.starttime,am.starttime];
[0057]
步骤1.6:计算时间窗口w下的最晚告警项发生时间last(w),各告警项的平均发生时间mean(w),最接近平均发生时间mean(w)的告警项发生时间mid(w);
[0058]
步骤1.7:若mid(w)+r》last(w),则返回步骤1.2,否则记新时间窗口 w’为[mid(w)-r,mid(w)+r,],进行步骤1.8,r表示小时间尺度的初始窗口半径参数;
[0059]
步骤1.8:若mid(w’)》mid(w),则令w=w’,返回步骤1.6,否则计算告警数据流di中首项告警项的持续时间fct(di);
[0060]
步骤1.9:
[0061]
当fct(di)》=w’时,取告警数据流di中首个告警项持续时间内的所有告警项为一个项集adsj,项集adsj放入告警项集的集合alarmdataset中,j=j+1, 并从di中删除adsj中的对应的告警项回到步骤1.3;
[0062]
当fct(di)《w’时,扫描告警数据流di并选择在首个告警项结束时刻至w’窗口内最后一个告警项开始时间内告警影响系数最大的告警项a
index_max
,随机以告警项a
index_max
的告警影响系数a
index_max
.alarmlevelparam为概率取告警数据流di中告警项a
index_max
以前发生的所有告警项生成项集adsj或以(1
‑ꢀaj
.alarmlevelparam)为概率取告警数据流di中首项告警开始时间至窗口w’右侧时刻内的所有告警生成项集adsj;
[0063]
将前述生成的项集adsj,放入告警项集的集合alarmdataset中,j=j+1,,从di 中删除,回到步骤1.3;
[0064]
步骤1.10:合并每一个时间窗l划分的alarmdatasub经步骤1.2-1.9生成的alarmdataset,最终生成告警项集alarmdatasets={ads1,ads2,

, adsk}。
[0065]
上述技术方案中,初始告警关联矩阵更新模块实现步骤如下:
[0066]
步骤3.1、从告警项集的集合alarmdatasets中取出一个告警项集adsi;
[0067]
步骤3.2、从告警项集adsi中取出首项告警aj,记录其告警类别ack,记录告警项集adsi中排在aj之后的每项告警的类别alarmclass
ij
={j1,j2,

},当adsi为空时跳转至步骤3.1;
[0068]
步骤3.3、将alarmmetrix[k,alarmclass
ij
{j1}],alarmmetrix[k, alarmclass
ij
{j2}]

的数值加1,即告警次数加1,其中alarmmetrix[x,y]表示 alarmmetrix矩阵中第x行,第y列的数据,;
[0069]
步骤3.4、将alarmmetrix[k,k]的数值加1,其中k为告警类别ack的下标值,跳转执行步骤3.2。
[0070]
上述技术方案中,告警溯源模块实现如下:
[0071]
步骤4.1、设置跟随置信度阈值conf和支持度阈值sup;
[0072]
步骤4.2、对于任意一个实时产生的告警,根据其告警类别aci的,判断告警关联矩阵中的第i行中的每一个数据a
ij
(j≠i),即alarmmetrix[i,j]的值是否满足如下条件:
[0073]
1)、alarmmetrix[i,j]》sup;
[0074]
2)、alarmmetrix[i,j]/alarmmetrix[i,i]》conf.
[0075]
当满足上述两个条件时,告警类别为acj的告警为告警类别为aci的告警的衍生告警;
[0076]
对于任意一个告警类型为aci的告警,判断告警关联矩阵中的第i列中
[0077]
的每一个数据数据a
ji
(j≠i),即alarmmetrix[j,i]是否满足如下条件:
[0078]
1)、alarmmetrix[j,i]》sup;
[0079]
2)、alarmmetrix[j,i]/alarmmetrix[j,j]》conf;
[0080]
当存在告警类别为acj的告警满足上述两个条件时,说明告警类别为 acj的告警是类型为aci的告警的前项告警,将其加入前项告警集合 prealarm={ac
j1
,ac
j2
,

};当不存在满足上述条件的数据时,将告警类型 aci加入到推荐根告警类型集合recalarm={ac
r1
,ac
r2


}中;
[0081]
步骤4.3、若prealarm不空,从prealarm中取出尾项ac
jk
,设置ac
jk
为给定的告警类型回到步骤4.2重复上述流程;
[0082]
步骤4.4、根据推荐根告警类型集合recalarm中推荐的各告警类型,从查找最近时间轴上的已发生历史告警项中符合对应告警类型的告警项作为推荐根告警项,以辅助运维人员进行故障排查。
[0083]
一种存储介质,存储有一种基于伴随告警关联体的电力信息系统故障溯源的程序,处理器执行所述程序时实现如权利要求1-4任一所述的一种基于伴随告警关联体的电力信息系统故障溯源方法。
[0084]
因为本发明采用上技术手段,因此具备以下有益效果:
[0085]
本发明能综合告警项数据在时间上的分布情况、首项告警持续时间以及不同告警的对故障扩散的影响程度,降低常规时间窗口方法导致不同项集间时序相邻的告警关联性丢失、告警数据非均匀分布时生成的丢失部分关联性的影响,并且可以通过并行运算提高由历史告警数据库生成项集的效率。
[0086]
本方案基于伴随告警关联体进行挖掘,可有效降低告警数据的关联规则挖掘过程中对内存和存储空间的消耗,能够高效匹配实时告警输出溯源结果。
具体实施方式
[0087]
根据按告警项发生时间顺序记录的历史告警数据库与告警信息收集系统获得的告警项数据流,通过一种改进的并行滑动窗口方法生成告警项集。
[0088]
针对系统中的离线历史告警数据库的原始告警数据,假设经一定预处理后,得到了的各告警项alarmitem所具有的格式如下:
[0089]
表1告警项格式
[0090][0091]
从表1中基于告警发生时间与告警恢复时间可得到该告警的持续时间,告警影响系数与告警等级一般设定为正相关,告警等级由告警源的网络拓扑、设备类型、对业务的影响程度决定,一般假设告警等级越高的告警项越可能以主告警的形式出现。
[0092]
由上述告警项alarmitem项组成用于的历史告警数据集alarmdata={a1,a2, a3,

,an}。基于历史告警数据集,基于一种改进的并行滑动时间窗口方法,顺序扫描数据,先按照较大时间尺度的固定时间窗l对所有历史告警数据进行分片。对每一个大时间片内的历史告警数据,按序取一批告警项数据,设置较小时间尺度的初始窗口半径参数r,寻找该批次数据的告警项密集中心时刻,同时考虑告警等级、告警持续时间的因素调整时间窗口,生成告警项集。具体流程如下:
[0093]
一种基于伴随告警关联体的电力信息系统故障溯源方法,其特征在于,包括以下步骤:
[0094]
步骤1、对历史告警数据集,通过大的滑动时间窗口对数据集进行粗划分,然后对划分结果用小的滑动时间窗口基于告警影响系数、告警时间密度情况做进一步细划分,得到告警项集alarmdatasets;
[0095]
步骤2、统计历史告警数据集合中所有不同的告警类型,形成告警类别集合 alarmclass={ac1,ac2,

,acm},m为历史发生的告警的类型数,建立元素初始值为0,维度为m*m的初始告警关联矩阵alarmmetrix:
[0096][0097]
其中a
ij
表示类型为aci的告警发生导致类型为acj的告警的次数,即告警类型aci对于告警类型acj的支持度,对角线位置的元素可表示对应行或列的各种告警发生的次数,其中i∈m,j∈m;
[0098]
步骤3、根据告警项集alarmdatasets对告警关联矩阵alarmmetrix中的每一元素的数值进行更新;
[0099]
步骤4、根据告警关联矩阵,快速的查找到根告警和衍生告警,对故障进行分析。
[0100]
上述技术方案中,步骤1包括如下步骤:
[0101]
步骤1.1:从历史告警数据集中最早发生的告警项开始时间起,按时间窗间隔l划分时间轴,将告警数据集alarmdata中对应每一个时间间隔l内的所有告警项按序划分一个分段数据集alarmdatasub,对每一个分段数据集 alarmdatasub,执行步骤1.2-步骤1.9;
[0102]
步骤1.2:记i=1,j=1(j是项集adsj的下标),d0为空,若分片数据集 alarmdatasub不为空,按时间顺序从分片数据集alarmdatasub中取出告警数据流di={a
i1
,a
i2
,

,a
im
},其中a
im
代表第i个分段数据集alarmdatasub中第 m个告警项;
[0103]
步骤1.3:待处理告警数据流di=di+d
i-1

[0104]
步骤1.4:若告警数据流di内告警时间宽度(am.starttime

a1.starttime) 小于2*r,则i=i+1,再从历史告警数据集中按时间顺序取一批数据d
i+1
,回到步骤1.2,否则进行步骤1.5,其中am.starttime代表am的告警发生时间,
[0105]
步骤1.5:初始化时间窗口w,w等于di的告警时间宽度,即窗口w为 [a1.starttime,am.starttime];
[0106]
步骤1.6:计算时间窗口w下的最晚告警项发生时间last(w),各告警项的平均发生时间mean(w),最接近平均发生时间mean(w)的告警项发生时间mid(w);
[0107]
步骤1.7:若mid(w)+r》last(w),则返回步骤1.2,否则记新时间窗口 w’为[mid(w)-r,mid(w)+r,],进行步骤1.8,r表示小时间尺度的初始窗口半径参数;
[0108]
步骤1.8:若mid(w’)》mid(w),则令w=w’,返回步骤1.6,否则计算告警数据流di中首项告警项的持续时间fct(di);
[0109]
步骤1.9:当fct(di)》=w’时,取告警数据流di中首个告警项持续时间内的所有告警项为一个项集adsj,项集adsj放入告警项集的集合alarmdataset 中,j=j+1,并从di中删除adsj中的对应的告警项回到步骤1.3,比如ads1= [a1,a2,a3],;从di中移出对应的告警项a1,a2,a3;
[0110]
当fct(di)《w’时,扫描告警数据流di并选择在首个告警项结束时刻至w’窗口内最后一个告警项开始时间内告警影响系数最大的告警项a
index_max
,随机以告警项a
index_max
的告警影响系数a
index_max
.alarmlevelparam为概率取告警数据流di中该告警项a
index_max
以前发生的所有告警项生成项集adsj或以(1
‑ꢀaj
.alarmlevelparam)为概率取告警数据流di中首项告警开始时间至窗口w’右侧时刻内的所有告警生成项集adsj;
[0111]
示例:对于di={a1,a2,

,an},其中告警项a1在a6发生时结束,在w’的时间窗下包含告警{a3,a4,

,a6,a7,..a9},遍历a6~a9的告警影响系数,得到a7的告警影响系数最大,a7.alarmlevelparam=0.6,则生成告警项集的有两种可能,一种为取a
index_max
以前的所有告警项,即a
1-a7,作为 ads={a1,a2,

a7},另一种情况则是取告警数据流di中首项告警开始时间至窗口w’右侧时刻内的所有告警项,即a
1-a9,作为ads={a1,a2,

,a9}。执行相关取项操作的可能性与告警影响系数有关,此示例中根据a7的告警影响系数,则执行前一种取法的可能性为60%,后一种的可能性为40%。具体实现中可使用相关随机函数模拟随机行为。)
[0112]
将前述生成的项集adsj,放入告警项集的集合alarmdataset中,j=j+1,,从di 中删除,回到步骤1.3;
[0113]
步骤1.10:合并每一个时间窗l划分的alarmdatasub经步骤1.2-1.9生成的alarmdataset,最终生成告警项集alarmdatasets={ads1,ads2,

, adsk}。
[0114]
上述技术方案中,步骤3包括如下步骤:
[0115]
步骤3.1、从告警项集的集合alarmdatasets中取出一个告警项集adsi;
[0116]
步骤3.2、从告警项集adsi中取出首项告警aj,记录其告警类别ack,记录告警项集adsi中排在aj之后的每项告警的类别alarmclass
ij
={j1, j2,

},当adsi为空时跳转至步骤3.1;
[0117]
步骤3.3、将alarmmetrix[k,alarmclass
ij
{j1}],alarmmetrix[k, alarmclass
ij
{j2}]

的数值加1,即告警次数加1,其中alarmmetrix[x,y]表示 alarmmetrix矩阵中第x行,第y列的数据,;
[0118]
步骤3.4、将alarmmetrix[k,k]的数值加1,其中k为告警类别ack的下标值,跳转执行步骤3.2。
[0119]
4.根据权利要求3所述的一种基于伴随告警关联体的电力信息系统故障溯源方法,其特征在于,步骤4具体包括以下步骤:
[0120]
步骤4.1、设置跟随置信度阈值conf和支持度阈值sup;
[0121]
步骤4.2、对于任意一个实时产生的告警,根据其告警类别aci的,判断告警关联矩阵中的第i行中的每一个数据a
ij
(j≠i),即alarmmetrix[i,j]的值是否满足如下条件:
[0122]
1)、alarmmetrix[i,j]》sup;
[0123]
2)、alarmmetrix[i,j]/alarmmetrix[i,i]》conf.
[0124]
当满足上述两个条件时,告警类别为acj的告警为告警类别为aci的告警的衍生告警;
[0125]
对于任意一个告警类型为aci的告警,判断告警关联矩阵中的第i列中
[0126]
的每一个数据数据a
ji
(j≠i),即alarmmetrix[j,i]是否满足如下条件:
[0127]
1)、alarmmetrix[j,i]》sup;
[0128]
2)、alarmmetrix[j,i]/alarmmetrix[j,j]》conf;
[0129]
当存在告警类别为acj的告警满足上述两个条件时,说明告警类别为 acj的告警是类型为aci的告警的前项告警,将其加入前项告警集合 prealarm={ac
j1
,ac
j2
,

};当不存在满足上述条件的数据时,将告警类型 aci加入到推荐根告警类型集合recalarm={ac
r1
,ac
r2


}中;
[0130]
步骤4.3、若prealarm不空,从prealarm中取出尾项ac
jk
,设置ac
jk
为给定的告警类型回到步骤4.2重复上述流程。
[0131]
步骤4.4、根据推荐根告警类型集合recalarm中推荐的各告警类型,从查找最近时间轴上的已发生历史告警项中符合对应告警类型的告警项作为推荐根告警项,以辅助运维人员进行故障排查。
[0132]
示例:若前时刻为t=10,此时系统出现实时告警a
10
,其告警类型为ac
15
,根据上述溯源方法得到推荐根告警集合recalarm={ac
10
,ac7},从t=10开始回溯,找到t=7时刻的ac10类的告警a7,t=3时刻发生的类型为ac7的告警 a3,即{a3,a7}为推荐的根源告警,运维人员可根据这两个根源告警来分析排查实际的故障根源。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1