告警事件关联规则挖掘方法

文档序号:6632079阅读:1162来源:国知局
告警事件关联规则挖掘方法
【专利摘要】本发明涉及网络管理【技术领域】,是一种告警事件关联规则挖掘方法,基于分支筛选优化策略和Apriori算法:依次读取数据库里的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到有效的关联规则。本发明通过构建支持度计算支撑数组,简化了支持度的计算,大大减少了读取数据库的次数,提高了算法效率;通过构建邻接字典链表,可以动态发现满足支持度要求的二项频繁集,提供了分支筛选优化策略的执行基础;动态删除无效分支,快速生成二项频繁集,提高了算法效率。
【专利说明】告警事件关联规则挖掘方法

【技术领域】
[0001] 本发明涉及网络管理【技术领域】,是一种告警事件关联规则挖掘方法。

【背景技术】
[0002] 网络告警事件的关联规则技术作为现代网络管理中的标志性技术,在网络故障管 理和数据挖掘中占据着重要地位。随着网络规模的不断扩张,网络告警事件频发,但大部分 网络告警事件是无用的。如何在这些事件中找到可用的部分,如何对可用部分进行分析,这 是近年来的研究热点。因此,网络告警事件的管理规则挖掘在网络管理中得到了大量应用 和进一步发展。
[0003] 算法是一种可用于网络告警事件关联规则挖掘的优秀算法,在实践中得到了广泛 应用,很多专家学者对其进行了深入研究并做了大量改进。Apriori算法通过迭代计算Ck 和Lk来寻找候选集,消耗在Cl、LI、C2、L2生成上的时间太多,效率比较低(随着K的增大, Ck和LK减少的很快,特别是当支持度比较大的时候);此外,Apriori算法在执行过程中,需 要频繁读取数据库,这也极大地影响了计算效率。


【发明内容】

[0004] 本发明提供了一种告警事件关联规则挖掘方法,克服了上述现有技术之不足,其 能有效解决现有Apriori算法中存在的通过迭代计算Ck和Lk来寻找候选集,消耗在C1、 L1、C2、L2生成上的时间太多,效率比较低的问题,以及Apriori算法在执行过程中,需要频 繁读取数据库,极大地影响计算效率的问题。
[0005] 本发明的技术方案是通过以下措施来实现的:一种告警事件关联规则挖掘方法, 基于分支筛选优化策略和Apriori算法,具体按照以下步骤进行:步骤101,依次读取数 据库中的每个事务项,并生成与每个事务项相对应的支持度计算支撑数组;步骤102,在 Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集;步骤103,在频繁项集和支 持度计算支撑数组的基础上,执行关联规则的置信度计算,在最小置信度约束下,得到关联 规则。
[0006] 下面是对上述发明技术方案的进一步优化或/和改进: 上述在步骤101中,所述支持度计算支撑数组的构建方式为

【权利要求】
1. 一种告警事件关联规则挖掘方法,其特征在于基于分支筛选优化策略和Apriori算 法,具体按照以下步骤进行: 步骤101,依次读取数据库中的每个事务项,并生成与每个事务项相对应的支持度计算 支撑数组; 步骤102,在Apriori算法的基础上,执行分支筛选优化策略,生成频繁项集; 步骤103,在频繁项集和支持度计算支撑数组的基础上,执行关联规则的置信度计算, 在最小置信度约束下,得到关联规则。
2. 根据权利要求1所述的告警事件关联规则挖掘方法,其特征在于在步骤101中,所述 支持度计算支撑数组的构建方式为 為[6(2,......? f 其中,令t代表数据库中的事务项的数量,则支持度计算支撑数组的数量为t,i的取值 范围为1至t;n代表数据项的数量,当某个数据项在事务中存在时,设置相应的数组元素为 1,否则设置相应的数组元素为0。
3. 根据权利要求2所述的告警事件关联规则挖掘方法,其特征在于在步骤102中,对第 一个事务项所属的数据项集执行笛卡尔乘积,得到二项频繁集候选集,并建立邻接字典链 表,将二项频繁集与邻接字典链表一一对应; 迭代地生成第2至第t个事务项的二项频繁集候选集; 分支筛选优化策略为:根据支持度计算支撑数组来计算相应二项频繁集的支持度,并 动态的根据最小支持度,剔除掉无用的数据项; 基于Apriori算法,在二项频繁集候选集的基础上依次生成三项频繁集候选集和三项 以上的频繁集候选集,直到完成候选集的计算。
4. 根据权利要求3所述的告警事件关联规则挖掘方法,其特征在于根据支持度计算支 撑数组计算相应二项频繁集的支持度的算法为:
其中,P、q、r为数据项。
5. 根据权利要求3或4所述的告警事件关联规则挖掘方法,其特征在于建立邻接字典 链表的方式为: 计算邻接字典链表中母节点的数量 F =/*(10^ + 1) 其中/为二项频繁项集中二项频繁集的个数,g为确保ICf大于/的最小次幂; 确定二项频繁集候选集中所有数据项的位置: s(m, n) = (lm+In *1 Cf) mod N 其中4代表二项频繁集中第一项的索引,A代表二项频繁集中第二项的索引。
【文档编号】G06F17/30GK104361036SQ201410591113
【公开日】2015年2月18日 申请日期:2014年10月29日 优先权日:2014年10月29日
【发明者】周文婷, 安文燕, 刘嘉华, 于勇, 陈龙 申请人:国家电网公司, 国网新疆电力公司信息通信公司, 南京南瑞集团公司, 南京南瑞集团公司信息通信技术分公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1