一种多故障数据解耦方法和装置的制造方法_2

文档序号:9869895阅读:来源:国知局
据,使用单故障数据情况下的相关系数矩阵为告警数据选择归 属故障。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整 地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本 发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实 施例,都属于本发明保护的范围。 阳OW 实施例一
[0042] 本发明实施例提供一种多故障数据解禪方法,如图1所示,包括如下步骤:
[00创步骤S101,获取同一时间在同一区域采集的K组告警数据和K组故障数据,其中, 每组故障数据均按故障优先级排序;
[0044] 其中,每组告警数据中都包含M个数据,每个数据对应一个告警,用W表示该告警 是否存在;
[0045] 每组故障数据中都包含N个数据,每个数据对应一个故障,用W表示该故障是否 存在。
[0046] 步骤S102,对K组故障数据使用关联分析算法,得到故障频繁项集X,并将所述故 障频繁项集X转化为故障两两相关矩阵R ;
[0047] 其中,将故障频繁项集X转化为故障两两相关矩阵R的转化原则为:对于在任一频 繁项集中同时存在的两两故障标记为相关,对于所有频繁项集中都没有同时存在的两两故 障标记为不相关;
[0048] 所述故障两两相关矩阵R中的元素表示两两故障间是否相关。
[0049] 步骤S103,基于故障两两相关矩阵R,对K组故障数据中存在多故障的故障数据组 进行故障去相关化和根因化;
[0050] 其中,所述基于所述故障两两相关矩阵R,对K组故障数据中存在多故障的故障数 据组进行故障去相关化和根因化的原则为:
[0051] 若故障两两相关矩阵R中表示相关的两故障同时存在于多故障的故障数据组中, 则高优先级故障存在的情况下,保留高优先级故障,删除低优先级故障;
[0052] 若故障两两相关矩阵R中表示不相关的两个故障同时存在于多故障的故障数据 组中,则两个故障同时保留。
[0053] 步骤S104,提取与故障去相关化和根因化后存在多不相关故障的各故障数据组对 应的各组告警数据,根据告警与各故障之间的相关性,确定提取的各组告警数据中每个告 警所归属的故障。
[0054] 其中,根据告警与各故障之间的相关性,确定提取的各组告警数据中每个告警所 归属的故障,具体包括:
[0055] 对于提取的每组告警数据,获取与其对应的故障去相关化和根因化后的故障数据 组中包含的各故障,得到故障集合;
[0056] 对于提取的每组告警数据,确定告警数据中每个告警与对应故障集合中各故障相 关性最高的故障为对应告警所归属的故障。
[0057] 其中,告警与故障间的相关性,优选的,通过皮尔逊相关系数来表示。
[0058] 所述皮尔逊相关系数的计算方式为:根据K组故障数据中单故障的故障数据组, 计算各告警与各故障之间的皮尔逊相关系数。其中设及的具体计算方式属于已知技术,再 此不作详述。
[0059] 综上所述,本实施例所述的多故障数据解禪方案具有准确率高和鲁棒性强的特 点,并且相对于现网中的人工方法提高了工作效率,为故障告警数据的大规模数据挖掘分 析提供了可能。 W60] 实施例二
[0061] 本实施例提供了一种多故障数据解禪方法,该方法的实施原理与实施例一相同, 其通过公开实现本发明所述方法的更多技术细节,W更清楚的表述本发明的具体实现过 程。需要说明的是,本实施例是一种较佳的实施例,其公开的内容并不用于唯一限定本发明 的实施过程。
[0062] 本实施例提供一种通信网络中多故障情况下的故障数据解禪方法,如图2所示, 包括如下步骤:
[0063] 步骤1 :数据采集与预处理方法:
[0064] 对于通信网络,定义故障的优先级,并按照优先级进行排序。故障优先级可W根据 故障波及的网元数量,硬件数量和受其影响的KPI (Key Perhrmance Indicator,关键性能 指标)的关键程度进行评估。
[0065] 将按照优先级排序后的故障(为了与后续的故障数据区分,下述通过故障变量 表述)记为咕,Gz, ...,Gn}。例如W网元N孤邸为例,故障变量的集合可W为:{N孤邸断 电..N孤邸退服,N孤邸控制单板故障..IUB断链}
[0066] 将系统告警(为了与后续的告警数据区分,下述通过告警变量表述)记为 巧1,Es, ...,Em}。例如(NOD邸断电告警,..RRU退服,板间通信流量超过告警口限,性能口 限越界}。
[0067] 采集现网中的K组告警数据和优先级排序后的K组故障数据,组成W下矩阵:
[0068]
W例其中,矩阵中元素 eim(K = K = K, K = m< = M),记录第i组采样数据中,告警 变量Em是否存在:如果告警变量E m存化则e Im= 1,否则e Im= 0。 阳070] 其中,矩阵中元素 gh(l< = K = K, K = n< = N)记录第i组采样数据中,故障变 量G。是否存在:如果告警变量G。存在,则gm= 1,否则gi。= 0。
[0071] 假设第i组采样数据中,存在多故障发生,那么gii. .. giw中存在多个非零项,如: 邑U...邑iN= (1,0,…1,0. . }
[0072] 步骤2 :对K组故障信息样本使用Apriori关联分析算法获得频繁项集X。假设 获得的频繁项集的数目为J,将故障信息的频繁项集记为1X1,X2, ...,Xj,其中Xi~X J都 是故障变量祐1,Gz,. . .,Gn}集合的子集。例如Xj= (N孤邸断电,N孤邸退服},其中,j = 1, ? ? ? , J。
[0073] 步骤3 :将故障频繁项集X转化为故障两两相关矩阵R。
[0074] 定义故障两两相关矩阵R中元素为故障G济G y的两两相关系数。r yy的计算 方法如下:如果所有频繁项集中都没有的和G y同时存在,则r yy= 0,否则r yy= 1。其中,X =1,. . .,N ;Y = 1,. . .,N
[00巧]步骤4 :根据故障两两相关矩阵R,对样本中多故障的数据组进行故障去相关化和 根因化。
[0076] 对于第i组故障数据中,如果g。. .. giw中存在多个非零项,则认为是多故障数据, 那么对故障数据组gii. .. giw进行去相关化和根因化操作,转换为去相关和根因后的故障数 据组g' il. ..g' iN。其中,g' ;。(11=1,...,脚的计算方法如下: 阳077] g' 1。= gin,如果 g' in 非零,则:
[007引在优先级高于当前故障的所有故障g。,gi2, ... gih 1冲进行捜索,若存在某故障数 据gi。,非零,且该故障与当前故障的故障相关系数r。,。二1,则令g' 1。= 0。 W79] 步骤5:筛选单故障的数据组,并根据单故障的数据组,计算告警变量 巧1,Es, ...,Em}与故障变量咕,Gz, ...,W之间的皮尔逊相关系数。定义告警Em与故障G。 的皮尔逊相关系数为Pm。。 W80] 步骤6 :遍历故障去相关化和根因化后的各故障数据,若某故障数据 (g' 11...g' iw}为多不相关故障数据,则分析与该多不相关故障数据对应的告警数据 {eu...eiM}中每个告警归属故障。
[0081] 对于第i组采样数据中,如果g' 11. .. g' IW中存在多个非零项,则认为是多不相 关故障数据。
[00間如果Gim非零(即有告警),则分析e im归属故障的方法如下:
[0083]将{g' 11... g' 中非零项对应的故障组成故障集合,寻找故障集合中与告警Em 皮尔逊相关系数最大的故障为Sim的归属故障。 阳〇84] 实施例=
[008
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1