一种基于Apriori算法的电网设备监控信息置信关联分析方法与流程

文档序号:13137966阅读:639来源:国知局

本发明属于电力系统调度自动化技术领域,尤其涉及一种基于apriori算法的电网设备监控信息置信关联分析方法。



背景技术:

随着电网发展越来越快,用电负荷逐步攀升,电网稳定安全运行经受着严峻的考验,电网设备能否可靠运行已经变为人们关心的焦点。电网公司作为资产密集型企业,其核心竞争力是资产效率最大化和成本最低化。多年来也在不断尝试设备资产管理的新理念,从早期的事后故障修理,到强调事先保养的预防性维护,电网设备资产精细化管理的意识正在逐步建立。如何有效管理资产,并将其与企业的生产成本和盈利能力综合平衡,是对企业生产经营能力的一种考量。

在整个社会对电力供应的依赖性日益强烈的今天,因电力设备故障而引起的损失是无法估量的,除了人为的操作不当及自然条件的突变所引起的设备损坏而无法预知外,正常情况下,通过对监控设备运行时发出的告警信号做分析,可以了解设备运行状态及可能发生的事故,对即将发生的电网事故做出预警的作用。

目前为止,电网规模庞大,每天发出的信号量繁多,一种信号的发生往往无法预知,事故类告警信号的发生也只有在信号发生了才能得知,对电网运行无法做到预警的效果。

从大规模的信号集中寻找信号之间隐含关系,主要问题在于,寻找信号的不同组合是一项十分耗时的任务,所需的计算代价很高,蛮力搜索并不能解决这个问题。



技术实现要素:

针对背景技术中的问题,本发明提供了一种基于apriori算法的电网设备监控信息置信关联分析方法,为监控人员提供帮助,以确保集中监控业务的安全高效运行,从而全面提升监控运行工作的质量。

为了实现上述目的,本发明提出如下技术方案:

一种基于apriori算法的电网设备监控信息置信关联分析方法,其特征在于,所述方法包括如下步骤:

(s1)根据apriori算法找出一定时间内电网历史告警信号的频繁项集;

(s2)通过频繁项集找出信号之间的关联规则;

(s3)比较关联规则的置信度大小,筛选出置信度大于预先设定的最小置信度的关联规则。

进一步地,所述步骤(s1)又包括如下步骤:

(s1-1)自连接获取候选集:

第一轮的候选集就是数据集d中的项,而其他轮次的候选集则是由前一轮次频繁集自连接得到,频繁集由候选集剪枝得到;

(s1-2)对于候选集进行剪枝:

候选集的每一条记录,如果它的支持度小于最小支持度,那么就会被剪掉;如果一条记录,它的子集有不是频繁集的,也会被剪掉;

如果自连接得到的已经不再是频繁集,那么取最后一次得到的频繁集作为结果。

本发明的有益效果为:

1、快速分析得出电网告警信号的频繁项集,不必计算所有告警信号的支持度,大大降低了计算量。

2、知道告警信号之间的关联规则,能够有效对即将发生的告警信号做出预警,可以让监控人员做到对电网事故防患于未然,实现安全防线从事后分析至事前预控的飞跃。

具体实施方式

下面结合实施例,对本发明的具体实施方案作详细的阐述。这些实施例仅供叙述而并非用来限定本发明的范围或实施原则,本发明的保护范围仍以权利要求为准,包括在此基础上所作出的显而易见的变化或变动等。

相关概念:

项集(itemset):同时出现的项的集合。

候选集(candidateitemset):通过向下合并得出的项集。

频繁项集(frequentitemset):指经常出现在一起的信号的集合,支持度大于等于特定的最小支持度的项集。

一个项集的支持度(support)被定义为数据集中包含该项集的记录所占的比例。我们事先需要定义一个最小支持度(minsupport),而只保留满足最小支持度的项集。

occur(x)指该项集出现次数,count(d)指总记录数。

置信度(confidence)是针对一条诸如{x}->{y}的关联规则来定义的。

apriori的原理是如果某个项集是频繁的,那么它的子集也是频繁的。反过来说,如果一个项集是非频繁的,那么它的所有超集也是非频繁的。

举例:

假设有一信号集合d={[s1,s2,s5],[s2,s4],[s2,s3],[s1,s2,s4],[s1,s3],[s2,s3],[s1,s3],[s1,s2,s3,s5],[s1,s2,s3]}。

预先设定的最小支持度为2/9,最小置信度为0.6。

本发明提供一种基于apriori算法的电网设备监控信息置信关联分析方法,包括如下步骤:

(s1)根据apriori算法找出一定时间内电网历史告警信号的频繁项集;

(s2)通过频繁项集找出信号之间的关联规则;

关联规则都是形如x->y,即从频繁项集中找出各项的关联,比如频繁项集[s1,s2],可以得出关联规则s1->s2,意味着发生了信号s1,极大可能发生信号s2,还可以得到关联规则s2->s1,两条关联规则并不相同。

(s3)比较关联规则的置信度大小,筛选出置信度大于预先设定的最小置信度的关联规则。

实施例1:

步骤(s1)包含两个步骤:

1.自连接获取候选集。第一轮的候选集就是数据集d中的项,而其他轮次的候选集则是由前一轮次频繁集自连接得到(频繁集由候选集剪枝得到)。

数据集d指若干组信号集的集合,形如d={[s1,s2,s5],[s2,s4],[s2,s3]},每一组信号集如[s2,s4]都是数据集d中的一个项集。

2.对于候选集进行剪枝。候选集的每一条记录,如果它的支持度小于最小支持度,那么就会被剪掉;此外,如果一条记录,它的子集有不是频繁集的,也会被剪掉。

算法的终止条件是,如果自连接得到的已经不再是频繁集,那么取最后一次得到的频繁集作为结果。

那么,第一轮候选集和剪枝结果为:

由于最小支持度为2,所以没有被剪枝的。

第二轮的候选集和剪枝结果为:

第三轮的候选集和剪枝结果为:

两个k项集能够连接的条件是,它们有k-1项是相同的。所以[s2,s4],[s3,s5]这种是不能连接的。

如果某个项集是频繁的,那么它的子集也是频繁的,[s1,s2]和[s2,s4]得到[s1,s2,s4],但是由于[s1,s4]不是频繁集,所以[s1,s2,s4]也不是频繁集。

第四轮的候选集和剪枝结果为:

第四轮剪枝后的结果为空。所以取最后一次计算得到的频繁集作为最终的频繁集结果,即[s1,s2,s3],[s1,s2,s5]。

实施例2:

依据频繁项集获得关联规则:

对于[s1,s2,s3]这个频繁项集,可以得到它的子集:[s1]、[s2]、[s3]、[s1,s2]、[s1,s3]、[s2,s3]。那么可以得到的规则如下:

s1->s2,s3:

s2->s1,s3:

s3->s1,s2:

s1,s2->s3:

s1,s3->s2:

s2,s3->s1:

对于[s1,s2,s5]这个频繁项集,可以得到它的子集:[s1]、[s2]、[s5]、[s1,s2]、[s1,s5]、[s2,s5]。那么可以得到的规则如下:

s1->s2,s5:

s2->s1,s5:

s5->s1,s2:

s1,s2->s5:

s1,s5->s2:

s2,s5->s1:

过滤掉置信度小于预先设定的最小置信度的规则,所以得到强规则为:

s5->s1,s2=1.0

s1,s5->s2=1.0

s2,s5->s1=1.0

也就是说,发生信号s5,极有可能发生信号s1和s2;发生了信号s1,s5,极有可能发生信号s2;发生了信号s2,s5,极有可能发生信号s1。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1