告警事件关联规则挖掘方法

文档序号：6632079阅读：1162来源：国知局

告警事件关联规则挖掘方法
【专利摘要】本发明涉及网络管理【技术领域】，是一种告警事件关联规则挖掘方法，基于分支筛选优化策略和Apriori算法：依次读取数据库里的每个事务项，并生成与每个事务项相对应的支持度计算支撑数组；在Apriori算法的基础上，执行分支筛选优化策略，生成频繁项集；在频繁项集和支持度计算支撑数组的基础上，执行关联规则的置信度计算，在最小置信度约束下，得到有效的关联规则。本发明通过构建支持度计算支撑数组，简化了支持度的计算，大大减少了读取数据库的次数，提高了算法效率；通过构建邻接字典链表，可以动态发现满足支持度要求的二项频繁集，提供了分支筛选优化策略的执行基础；动态删除无效分支，快速生成二项频繁集，提高了算法效率。
【专利说明】告警事件关联规则挖掘方法

【技术领域】
[0001] 本发明涉及网络管理【技术领域】，是一种告警事件关联规则挖掘方法。

【背景技术】
[0002] 网络告警事件的关联规则技术作为现代网络管理中的标志性技术，在网络故障管理和数据挖掘中占据着重要地位。随着网络规模的不断扩张，网络告警事件频发，但大部分网络告警事件是无用的。如何在这些事件中找到可用的部分，如何对可用部分进行分析，这是近年来的研究热点。因此，网络告警事件的管理规则挖掘在网络管理中得到了大量应用和进一步发展。
[0003] 算法是一种可用于网络告警事件关联规则挖掘的优秀算法，在实践中得到了广泛应用，很多专家学者对其进行了深入研究并做了大量改进。Apriori算法通过迭代计算Ck 和Lk来寻找候选集，消耗在Cl、LI、C2、L2生成上的时间太多，效率比较低（随着K的增大， Ck和LK减少的很快，特别是当支持度比较大的时候);此外，Apriori算法在执行过程中，需要频繁读取数据库，这也极大地影响了计算效率。

【发明内容】

[0004] 本发明提供了一种告警事件关联规则挖掘方法，克服了上述现有技术之不足，其能有效解决现有Apriori算法中存在的通过迭代计算Ck和Lk来寻找候选集，消耗在C1、 L1、C2、L2生成上的时间太多，效率比较低的问题，以及Apriori算法在执行过程中，需要频繁读取数据库，极大地影响计算效率的问题。
[0005] 本发明的技术方案是通过以下措施来实现的：一种告警事件关联规则挖掘方法，基于分支筛选优化策略和Apriori算法，具体按照以下步骤进行：步骤101，依次读取数据库中的每个事务项，并生成与每个事务项相对应的支持度计算支撑数组；步骤102,在 Apriori算法的基础上，执行分支筛选优化策略，生成频繁项集；步骤103,在频繁项集和支持度计算支撑数组的基础上，执行关联规则的置信度计算，在最小置信度约束下，得到关联规则。
[0006] 下面是对上述发明技术方案的进一步优化或/和改进：上述在步骤101中，所述支持度计算支撑数组的构建方式为

【权利要求】
1. 一种告警事件关联规则挖掘方法，其特征在于基于分支筛选优化策略和Apriori算法，具体按照以下步骤进行：步骤101，依次读取数据库中的每个事务项，并生成与每个事务项相对应的支持度计算支撑数组；步骤102,在Apriori算法的基础上，执行分支筛选优化策略，生成频繁项集；步骤103,在频繁项集和支持度计算支撑数组的基础上，执行关联规则的置信度计算，在最小置信度约束下，得到关联规则。
2. 根据权利要求1所述的告警事件关联规则挖掘方法，其特征在于在步骤101中，所述支持度计算支撑数组的构建方式为為[6(2，......? f 其中，令t代表数据库中的事务项的数量，则支持度计算支撑数组的数量为t，i的取值范围为1至t;n代表数据项的数量，当某个数据项在事务中存在时，设置相应的数组元素为 1，否则设置相应的数组元素为0。
3. 根据权利要求2所述的告警事件关联规则挖掘方法，其特征在于在步骤102中，对第一个事务项所属的数据项集执行笛卡尔乘积，得到二项频繁集候选集，并建立邻接字典链表，将二项频繁集与邻接字典链表一一对应；迭代地生成第2至第t个事务项的二项频繁集候选集；分支筛选优化策略为：根据支持度计算支撑数组来计算相应二项频繁集的支持度，并动态的根据最小支持度，剔除掉无用的数据项；基于Apriori算法，在二项频繁集候选集的基础上依次生成三项频繁集候选集和三项以上的频繁集候选集，直到完成候选集的计算。
4. 根据权利要求3所述的告警事件关联规则挖掘方法，其特征在于根据支持度计算支撑数组计算相应二项频繁集的支持度的算法为：
其中，P、q、r为数据项。
5. 根据权利要求3或4所述的告警事件关联规则挖掘方法，其特征在于建立邻接字典链表的方式为：计算邻接字典链表中母节点的数量 F =/*(10^ + 1) 其中/为二项频繁项集中二项频繁集的个数，g为确保ICf大于/的最小次幂；确定二项频繁集候选集中所有数据项的位置： s(m, n) = (lm+In *1 Cf) mod N 其中4代表二项频繁集中第一项的索引，A代表二项频繁集中第二项的索引。
【文档编号】G06F17/30GK104361036SQ201410591113
【公开日】2015年2月18日申请日期:2014年10月29日优先权日:2014年10月29日
【发明者】周文婷, 安文燕, 刘嘉华, 于勇, 陈龙申请人:国家电网公司, 国网新疆电力公司信息通信公司, 南京南瑞集团公司, 南京南瑞集团公司信息通信技术分公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周文婷;安文燕;刘嘉华;于勇;陈龙;
技术所有人：国家电网公司;国网新疆电力公司信息通信公司;南京南瑞集团公司;南京南瑞集团公司信息通信技术分公司;
我是此专利的发明人

上一篇：医院门户网站门诊专家信息抽取系统的制作方法
上一篇：桌面终端管理系统异常自动声光告警装置及其使用方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。