基于Apriori算法的异常SER/SOE事件识别方法与流程

文档序号:15462979发布日期:2018-09-18 18:37阅读:501来源:国知局

本发明涉及一种识别方法,尤其涉及一种基于Apriori算法的异常SER/SOE事件的识别方法。



背景技术:

在直流输电系统及其它大多数工控系统中,事件顺序记录功能即SER(Sequence Event Recorder)或SOE(Sequence Of Event)功能负责在系统运行期间实现事件记录的目的,SER/SOE系统按事件发生的时序捕获和记录事件信息,主要包括Date(日期)、Time(时间)、Number(事件编号,每个事件有唯一编号)、Message Text(事件描述)、Class(事件等级,如紧急事件、告警事件、状态事件)等信息,记录的信息供运维人员事后翻查与分析,用于事件追溯、分析事故原因等。

通常,SER/SOE功能用于运维人员监视、查询和分析,如换流站控制系统等重要运行系统还需运维人员对SER/SOE进行实时监视,以迅速响应异常SER/SOE事件,一旦出现这类事件,运维人员需要立刻去现场检查、分析产生该异常事件的原因和处理方法。但是人工监视SER/SOE事件难以做到时刻保持精力集中,存在异常SER/SOE事件漏看、错看情况,导致异常事件不能及时处置,造成严重后果。

Apriori算法是一种常用于挖掘数据关联规则的算法,用于从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含其中事先不知道的、但又潜在有用的信息,如果能将Apriori算法用于SER/SOE记录的事件,挖掘出每条SER/SOE事件与伴随出现的其他SER/SOE事件的关联规则,可实现自动识别异常SER事件,辅助运维人员对SER事件性质进行判断,将会极大地解放劳动力,提高事件判断准确性,提高工作效率。



技术实现要素:

本发明所要解决的技术问题是,克服以上所术缺陷,提供一种基于Apriori算法的异常SER/SOE事件识别方法,取代人工监视SER/SOE的传统模式,减少异常SER/SOE事件被漏看、错看的可能性,提高判断准确性,提高工作效率,确保电网安全稳定运行。

为了解决以上所述技术问题,本发明所述基于Apriori算法的异常SER/SOE事件识别方法,包括以下步骤:

(1)从运行系统按时序捕获SER/SOE事件序列,从捕获的事件序列中选择一条SER/SOE事件作为目标事件;

(2)运行系统中步骤(1)所述目标事件出现时,提取该目标事件前后5-10秒内伴随发生的全部其他SER/SOE事件作为所述目标事件的1个训练样本,此为一次提取所得结果,如此提取不少于十次,得到不少于10个训练样本,作为所述目标事件的训练样本库;

(3)根据步骤(2)所得训练样本库挖掘所述目标事件的频繁伴随出现事件——最大频繁项集,找出经常同所述目标事件一起出现的其它事件:

a、统计所述步骤(2)所得训练样本库内每条伴随所述目标事件出现的SER/SOE事件的出现次数,根据Apriori算法的支持度计算公式计算每条SER/SOE事件的支持度;所述支持度计算公式定义如下:

b、定义最小支持度Smin,所述步骤a计算所得每条SER/SOE事件的支持度若小于Smin,说明该条SER/SOE事件与所述目标事件关联度不高,丢弃该SER/SOE事件;保留支持度大于或等于Smin的SER/SOE事件并组成频繁项集L1;

c、对步骤b所得频繁项集L1的各事件按排列组合的方式进行相互组合,生成集合度更高的候选项集,候选项内各元素无序且不重复;根据Apriori算法的支持度计算公式计算所述候选项集内各候选项的支持度;

d、支持度小于Smin的候选项丢弃,支持度大于或等于Smin的候选项保留并组成频繁项集L2;

e、对步骤d所得频繁项集L2内各频繁项按关联规则进行两两关联,生成集合度更高的候选项集,候选项集内各候选项的元素无序且不重复;对于频繁项集内任意两个频繁项X和Y,记Xi和Yi分别表示X的第i个元素和Y的第i个元素,记k为X、Y的元素个数;其关联规则为:

若满足:

则X和Y可以关联,生成的候选项为{X1,X2......Xk-1,Xk,Yk},所有候选项组成候选项集;

f、迭代执行所述步骤d~步骤e,直到无法生成集合度更高的候选项、或者从候选项集里无法找到支持度大于或等于Smin的候选项再组成新的频繁项集时,迭代终止,此时最后一个频繁项集即为最大频繁项集;最大频繁项集里的事件就是与所述目标事件频繁伴随出现的事件,即某时刻运行系统一旦产生所述目标事件,就有很大概率同时会伴随产生这些SER/SOE事件;

(4)根据步骤(3)挖掘出的所述目标事件的最大频繁项集,在运行系统针对所述目标事件进行异常识别,所述识别分为目标事件已出现时的识别和目标事件未出现时的识别,具体识别方法为:

a、所述目标事件已出现时的识别

若运行系统已出现所述目标事件,提取所述目标事件前后5-10秒内伴随发生的其他SER/SOE事件作为分析样本,将此分析样本与所述目标事件的最大频繁项集进行对比,如果所述目标事件的最大频繁项集内的所有事件全部能在此分析样本中找到,说明当前时机出现所述目标事件符合历史出现规律,应识别为正常SER/SOE事件,反之识别为异常SER/SOE事件,提醒运维人员所述目标事件在错误时机出现,及时予以分析处理;

b、所述目标事件未出现时的识别

若运行系统出现某一条非所述目标事件的SER/SOE事件,提取该SER/SOE事件前后5-10秒内伴随发生的所有SER/SOE事件作为分析样本,将此分析样本与所述目标事件的最大频繁项集进行对比,如果所述目标事件的最大频繁项集内的所有事件全部能在此分析样本中找到,说明当前时机未出现所述目标事件不符合历史出现规律,应识别成异常SER/SOE事件,并提醒运维人员所述目标事件应出现而未出现,需及时予以分析处理;反之则识别为正常情况。

本发明的有益效果:本发明利用Apriori算法,分析出各SER/SOE事件的关联规则,然后利用该规则自动找出不符合关联规则的异常SER/SOE,取代了人工监盘关注SER的传统模式,减少异常SER被漏看、错看的可能性,方法简单、提高工作效率,保证电网安全稳定运行。

附图说明

图1为实施例所述±800kV楚雄换流站的事件顺序记录系统的显示界面截图(部分);

图2为本发明所述迭代流程图。

具体实施方式

下面结合附图和实施例对本发明作进一步详细说明。

本发明所述基于Apriori算法的异常SER/SOE事件识别方法,包括以下步骤:

(1)从运行系统按时序捕获SER/SOE事件序列,从捕获的事件序列中选择一条SER/SOE事件作为目标事件;

(2)运行系统中步骤(1)所述目标事件出现时,提取该目标事件前后5-10秒内伴随发生的全部其他SER/SOE事件作为所述目标事件的1个训练样本,此为一次提取所得结果,如此提取不少于十次,得到不少于10个训练样本,作为所述目标事件的训练样本库;

(3)根据步骤(2)所得训练样本库挖掘所述目标事件的频繁伴随出现事件——最大频繁项集,找出经常同所述目标事件一起出现的其它事件:

a、统计所述步骤(2)所得训练样本库内每条伴随所述目标事件出现的SER/SOE事件的出现次数,根据Apriori算法的支持度计算公式计算每条SER/SOE事件的支持度;所述支持度计算公式定义如下:

b、定义最小支持度Smin,所述步骤a计算所得每条SER/SOE事件的支持度若小于Smin,说明该条SER/SOE事件与所述目标事件关联度不高,丢弃该SER/SOE事件;保留支持度大于或等于Smin的SER/SOE事件并组成频繁项集L1;

c、对步骤b所得频繁项集L1的各事件按排列组合的方式进行相互组合,生成集合度更高的候选项集,候选项内各元素无序且不重复;根据Apriori算法的支持度计算公式计算所述候选项集内各候选项的支持度;

d、支持度小于Smin的候选项丢弃,支持度大于或等于Smin的候选项保留并组成频繁项集L2;

e、对步骤d所得频繁项集L2内各频繁项按关联规则进行两两关联,生成集合度更高的候选项集,候选项集内各候选项的元素无序且不重复;对于频繁项集内任意两个频繁项X和Y,记Xi和Yi分别表示X的第i个元素和Y的第i个元素,记k为X、Y的元素个数;其关联规则为:

若满足:

则X和Y可以关联,生成的候选项为{X1,X2......Xk-1,Xk,Yk},所有候选项组成候选项集;

f、迭代执行所述步骤d~步骤e,直到无法生成集合度更高的候选项、或者从候选项集里无法找到支持度大于或等于Smin的候选项再组成新的频繁项集时,迭代终止,此时最后一个频繁项集即为最大频繁项集;最大频繁项集里的事件就是与所述目标事件频繁伴随出现的事件,即某时刻运行系统一旦产生所述目标事件,就有很大概率同时会伴随产生这些SER/SOE事件;

(4)根据步骤(3)挖掘出的所述目标事件的最大频繁项集,在运行系统针对所述目标事件进行异常识别,所述识别分为目标事件已出现时的识别和目标事件未出现时的识别,具体识别方法为:

a、所述目标事件已出现时的识别

若运行系统已出现所述目标事件,提取所述目标事件前后5-10秒内伴随发生的其他SER/SOE事件作为分析样本,将此分析样本与所述目标事件的最大频繁项集进行对比,如果所述目标事件的最大频繁项集内的所有事件全部能在此分析样本中找到,说明当前时机出现所述目标事件符合历史出现规律,应识别为正常SER/SOE事件,反之识别为异常SER/SOE事件,提醒运维人员所述目标事件在错误时机出现,及时予以分析处理;

b、所述目标事件未出现时的识别

若运行系统出现某一条非所述目标事件的SER/SOE事件,提取该SER/SOE事件前后5-10秒内伴随发生的所有SER/SOE事件作为分析样本,将此分析样本与所述目标事件的最大频繁项集进行对比,如果所述目标事件的最大频繁项集内的所有事件全部能在此分析样本中找到,说明当前时机未出现所述目标事件不符合历史出现规律,应识别成异常SER/SOE事件,并提醒运维人员所述目标事件应出现而未出现,需及时予以分析处理;反之则识别为正常情况。

实施例:本发明所述识别方法以±800kV楚雄换流站的事件顺序记录系统为例进行说明。

(1)从控制系统按时序获取SER/SOE事件列表,见图1,图1即为±800kV楚雄换流站的事件顺序记录系统在某一时段的显示界面的部分截图,图中即为SER/SOE事件的序列。现场每发生一个事件,控制系统就产生一条新SER显示出来,供运行人员查看,以了解现场发生了什么事,其中MessageText就是事件信息,运行人员一看信息就知道是什么事,Number是事件编号,每个事件都有唯一的事件编号,为了简化,本发明的算法用事件编号作为事件标识代替事件本身,以区分不同事件;从图1的事件序列提取出事件编号并按时序排列,见表1,从表1中选择一条SER/SOE事件作为目标事件(随意选择),本实施例以编号235736的事件作为目标事件,该目标事件可以是任何一条未用本识别方法处理的SER/SOE事件:

表1:某时段从控制系统获取的SER/SOE事件列表(截取部分)

(2)运行系统中目标事件(编号235736的事件)出现时,提取该目标事件前后固定时限T(5-10秒)内伴随发生的全部其他SER/SOE事件作为所述目标事件的1个训练样本;本实施例取T=5秒,在表1中的目标事件即第11条编号235736事件前后5秒内,伴随发生的事件(编号)见表2,此为一次提取所得结果:

表2:目标事件前后5秒内的伴随事件

固定时间T的数值为运行系统产生系列关联事件所需的最大时间值,例如电力系统中继电保护出口延时普遍为0毫秒~5秒,最慢的隔离开关动作时间普遍为6秒~10秒,因此分析电力系统的运行系统SER时T的取值范围为5秒~10秒。

如此提取不少于十次,每次提取后均仿照表2样列表(为了简便,本实施例只列出一次提取情况——表2)得到不少于10个训练样本,作为所述目标事件的训练样本库,用于分析该目标SER/SOE事件的出现规律。对全部提取(捕获)的结果列表,可用字母代表每一次捕获到的相应事件。本实施例为简化数据量,主要突出算法流程,例出六次捕获的情况,将每次捕获到的事件以字母代替,形成6个训练样本,作为训练样本库,见表3:

表3目标事件的完整训练样本

表3的意思是:

第1次出现所述目标事件(编号235736的事件)时,前后5秒内伴随出现了A、B、C、D、E、F、G、H、I、J事件;

第2次出现目标事件(编号235736的事件)时,前后5秒内伴随出现了A、B、D、E、C、G、I、J、K事件;

第3次出现目标事件(编号235736的事件)时,前后5秒内伴随出现了B、Y、D、E、K、C、G、Y事件;

第4次出现目标事件(编号235736的事件)时,前后5秒内伴随出现了D、B、Z、F、H、A、X、L事件;

第5次出现目标事件(编号235736的事件)时,前后5秒内伴随出现了F、D、B、A、Z、I、C、E、H事件;

第6次出现目标事件(编号235736的事件)时,前后5秒内伴随出现了X、B、F、E、A、J、K、L事件。

(3)根据步骤(2)所得训练样本库挖掘所述目标事件的频繁伴随出现事件——最大频繁项集,找出经常同所述目标事件一起出现的其它事件:

a、对表3的数据(训练样本库)进行扫描和统计,并计算每条伴随目标事件出现的SER/SOE事件的支持度,结果见表4;支持度计算公式定义如下:

表4:训练样本库内事件支持度

b、定义最小支持度Smin,本实施例定义Smin=0.51,对表4中每条SER/SOE事件计算所得支持度小于Smin的,如表4中的G、H、I、J、K、L、X、Y、Z,说明这些事件与目标事件关联度不高,丢弃这些事件(数据剪枝);支持度大于或等于Smin的所有SER/SOE事件组成频繁项集L1,见表5;

最小支持度Smin决定频繁项集内的事件与目标事件的关联程度,Smin越大则频繁项集内的事件与目标事件关联度越高,反之越低;对于较简单的运行系统可采用较大的Smin(0.7~1.0)以获得更精确的SER/SOE事件出现规律,而中大型的运行系统由于SER/SOE事件较多较复杂,数据噪声明显,可采用较小的Smin(0.5~0.8)以获得更好的算法鲁棒性。

表5频繁项集L1

c、对步骤表5的频繁项集L1的各事件按排列组合的方式进行相互组合,生成集合度更高的候选项集(例如频繁项集为{A,B,C,D},则可两两组合生成候选项集为{AB},{AC},{AD},{BC},{BD},{CD}),候选项内各元素(即事件)无序且不重复。对表5的集合按关联规则进行关联并计算支持度(支持度计算与步骤a相同),得到如下表6候选项集:

表6候选项集

d、将表6中各候选项的支持度与最小支持度Smin进行比较,由于最小支持度Smin=0.51,表6中,AC、CF、DF、EF均小于最小支持度,删除掉关联度不高的数据后,得出频繁项集L2,见表7:

表7频繁项集L2

e、对表7频繁项集L2内各频繁项按关联规则进行两两关联,生成集合度更高的候选项集,对于频繁项集内任意两个频繁项X和Y,记Xi和Yi分别表示X的第i个元素和Y的第i个元素,记k为X、Y的元素个数;其关联规则为:

若满足:

则X和Y可以关联,生成的候选项为{X1,X2......Xk-1,Xk,Yk},所有候选项组成候选项集。

f、然后开始迭代操作,第i次的迭代过程包括计算候选项的支持度,根据最小支持度对其剪枝得到频繁项集L2+i和连接生成新的候选项集三步,直到无法生成集合度更高的候选项,或者从候选项集里无法找到支持度大于等于的候选项组成新的频繁项集时,迭代终止,此时最后生成的频繁项集即为最大频繁项集,在本例中计算出的最大频繁项集为L4={B、C、D、E},图2为迭代流程及输出结果。

(4)根据最大频繁项集L4在运行系统针对该目标事件进行异常识别,识别种类分为采集分析样本期间目标事件已出现的识别,以及目标事件未出现时的识别,举例如下:

表8异常SER事件识别举例

以上仅举一个实施例用以对本发明的技术方案加以说明,所选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化,本说明书选取并具体描述的实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明,只要使用了以上所述技术方案,均应落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1