一种多计量异常事件关联度分析方法与流程

文档序号：19385447发布日期：2019-12-11 00:54阅读：117来源：国知局

本发明涉及一种异常事件分析方法，尤其涉及一种多计量异常事件关联度分析方法。

背景技术：

随着经济的发展和用电量的增大，因电能计量故障引起电能损失的问题变得越来越突出，供电企业乃至国家为此经受了巨大的经济损失。因此，对电能计量故障分析与处理就愈发重要。计量异常报警是用电信息采集系统的一个重要功能模块，异常报警功能对用电现场的异常情况设置报警标志，报警标志可以由系统实时查询或由终端主动上报。对终端的异常报警事件进行分析，能够实时监测用电现场的运行状况，针对性地判断用户的用电情况是否有异常，尤其失压和断流事件更是反窃电检查的重中之重。异常报警功能加大了对终端的监控力度，能够起到及时处理计量故障的重要作用。于是，对用电信息采集平台上所反映出来的异常事件和异常数据的正确分析判断就成为了计量人员迫切需要解决的难题。

目前针对单个计量异常事件，通过异常原因分类、处理流程、异常现象及处理步骤的研究总结，已经有较规范统一的处理流程和方法。然而，日常运行中的计量异常种类繁多、情况复杂，用电信息采集系统发出的事件告警信息混杂在一起；仅对单个计量异常事件进行分析，工作量大，部分告警信息不能得到有效分析和处理，限制了故障准确率的提高。

对计量异常事件之间的关系进行研究，可以有效地对并发事件进行甄别和筛选；对并发异常事件组合进行异常原因分析分析，能够有效地提高计量故障原因分析准确性。目前对计量异常事件的关联度计算的现有技术很少，皮尔逊相关分析法、灰色关联度等常用关联度计算模型不适用于计量异常事件的关联度计算。原因在于：

现有研究电力设备故障统计数据与电能质量监测数据采用皮尔逊相关分析法(也称为积差相关)进行多维度的关联度分析。对电力设备故障数据与电能质量监测数据进行处理：对各变电站内的各类设备故障的每一电力设备故障发生的次数和各变电站电能质量指标的平均值进行统计汇总；将汇总得到的数据进行归一化处理，变换至[0，1]之间。最后根据皮尔逊相关系数计算公式计算出电力设备故障统计数据与电能质量监测数据的关联度，皮尔逊相关系数范围为[-1，1]之间，越靠近1表示关联度越大，越靠近0表示关联度越小，负数表示负相关。该方法若运用到计算两两异常事件的关联度中，存在数据不足的问题，因而不适合电力异常的关联度计算。

现有的工程技术中，灰色关联度的计算方法也应用较为广泛。灰关联分析方法的基本思想是根据序列曲线几何形状间的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之就越小。同时可描述系统发展过程中的相对变化情况,如果二者在发展过程中的相对变化基本一致,则认为二者关联度大,反之,关联度小。但是该关联度受两级最小绝对值差和两级最大绝对误差影响较大。一旦数据列中出现某个极大值点或极小值点,那么各特征点的关联系数都将受到较大影响,从而使关联度值具有较大的波动性,数据值极不稳定。并且各特征点的关联系数受样本量影响，关联系数、关联度受分辨率因子p的影响极大。另一方面灰色关联度模型计算关联度所需要的样本数据是具体的数字，而本发明中计量异常事件的发生只有是或否，即输入只有0和1，所以灰色关联度计算模型同不适用于计算计量异常事件的关联度。

现阶段急需要一种基于计量异常事件的关联度计算方法，来实现关联度的准确分析。

技术实现要素：

本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进，提供一种多计量异常事件关联度分析方法，以达到关联度准确分析的目的。为此，本发明采取以下技术方案。

一种多计量异常事件关联度分析方法，其特征在于包括以下步骤：

1)数据预处理

获得数据库数据，数据库中的数据包含每一用户发生的各种异常事件、每一个异常的发生时间和恢复时间、造成异常发生原因；

检索出异常事件发生日期一栏空白的地方，并将该空白处所在整行数据删除；

2)初步确定可能存在关联的两两异常事件组合

分别求出每种异常事件出现的总次数nk，接着对所有的异常事件进行两两组合，求出两两异常组合时，两异常事件出现在同月且为同一用户的次数nij；当nij大于阈值时，初步判断两异常可能具有关联；

3)对可能存在关联的异常事件组合进行关联度计算

关联度计算步骤包括：

a)根据两个计量异常事件发生的先后顺序，计算获得异常事件ai先于异常事件aj发生的，异常事件ai与异常事件aj之间的关联系数；计算获得异常事件aj先于异常事件ai发生的，异常事件ai与异常aj之间的关联系数；

关联系数的计算公式为：

式中d为同一用户两个异常事件ai、aj发生日期间隔天数，n为设定的天数，n为大于或等于7的自然数，其中d的取值范围为[0,n]；

b)分别基于关联系数计算两个异常事件之间的关联度rij和rji；其中rij表示异常事件ai先发生时，异常事件ai与异常事件aj之间的关联度；rji表示异常事件aj先发生时，异常事件ai与异常事件aj之间的关联度；在关联度计算时，将得到的多个异常事件ai先发生的关联系数取平均值，得到该并发异常事件ai先发生的关联度，同时将得到的多个异常事件aj先发生的关联度取平均值，得到该并发异常事件aj先发生的关联度；

c)当关联系数大于设定值的占比大于50％时，去掉关联系数为0的数据求关联系数均值，获得关联度；当关联系数大于设定值的占比小于50％时，保留所有数据求均值，获得关联度；

4)根据关联度大小对并发异常事件组合进行甄别

通过设定阈值对并发异常事件进行筛选，当计算得到的关联度高于此阈值时，将其视为一组并发异常事件；对于需要考核的异常事件，将阈值设置为0.5～0.7；对于不进行考核的异常事件组合，则根据相关系数与关联性强弱的对应关系将阈值设置为0.3～0.5。

数据主要包括用户编号、异常类型名称、异常发生时间、异常恢复时间、异常归档时间等信息。其中异常恢复时间受多种因素影响，针对要纳入考核的计量异常事件，一般在一周内会进行人工恢复；而对于不进行考核的异常事件，则对恢复时间没有要求，会视现场运行情况和工人工作安排来进行恢复；历史告警数据中给出的恢复时间可能是归档时间，而不是实际恢复时间，实际恢复时间无法确定。鉴于目前已有的历史数据中异常事件的发生时间是确定的，所以在求两两异常事件之间关联度时以异常事件发生的时间为参考，通过两个异常发生时间的间隔天数来计算关联度。

作为优选技术手段：在步骤4)中，对于需要考核的异常事件，在一周内进行处理，此时将阈值设置为0.6；对于不进行考核的异常事件组合，则根据相关系数与关联性强弱的对应关系将阈值设置为0.4；

作为优选技术手段：在步骤4)中，关联度rij的计算公式为：

式中mi≤ni，当间隔天数在6以内的次数小于总次数ni的50％时，mi＝ni，此时rip’即为rip；反之，当间隔天数在6以内的占比大于等于50％时，mi<ni，此时rip’为rip中不为0的部分；同理可得关联度rji的计算公式为：

作为优选技术手段：在步骤c)中，当关联系数大于0.68的占比大于50％时，去掉关联系数为0的数据求关联系数均值，获得关联度；当关联系数大于0.68的占比小于50％时，保留所有数据求均值，获得关联度。

作为优选技术手段：在步骤1)中，数据库的数据来源包括:变电站的电能质量监测数据及检修人员进行对异常进行排查、确定原因和检修后填写的档案数据。

作为优选技术手段：在步骤3)中，关联系数根据下式计算：

d的取值范围为[0,15]。

对于同一用户，理论上两个计量异常事件如果前后紧接着发生，且第二个异常事件发生在第一个异常事件恢复前，可以认为两异常事件具有一定的关联；两个异常发生日期的间隔天数越大，二者的关联系数越小。由于异常考核时间为一周，以2倍考核时间为界限，当两个计量异常发生日期间隔超过15天时，认为无关联，不进行关联系数计算；发生日期间隔天数在15天以内，一个异常恢复后另一个异常才发生，关联系数为0；发生日期间隔天数在15天以内且在一个异常恢复前另一个异常发生时，间隔天数越小，关联系数越大。

有益效果：本发明通过对历史数据的分类及筛检，计算出两两异常事件发生的关联程度，直观的看出两个异常事件的发生是否有因果观关系，并对结果进行筛选，提高精确度；最后对关联度设置阈值，实现对并发异常事件组合的筛选。本技术方案有效地对并发异常事件组合进行甄别，从而提高计量异常事件分析、利用的准确性和完整性。

附图说明

图1是本发明流程图。

图2是本发明的关联度计算流程图。

具体实施方式

以下结合说明书附图对本发明的技术方案做进一步的详细说明。

如图1、2所示，本发明包括以下步骤：

1)数据预处理

获得数据库数据，数据库中的数据包含每一用户发生的各种异常事件、每一个异常的发生时间和恢复时间、造成异常发生原因；

检索出异常事件发生日期一栏空白的地方，并将该空白处所在整行数据删除；

2)初步确定可能存在关联的两两异常事件组合

3)对可能存在关联的异常事件组合进行关联度计算

关联度计算步骤包括：

关联系数的计算公式为：

式中d为同一用户两个异常事件ai、aj发生日期间隔天数，n为设定的天数，n为大于或等于7的自然数，其中d的取值范围为[0,n]；

4)根据关联度大小对并发异常事件组合进行甄别

以下就实施例作具体说明。

1数据来源

本实施例进行关联度分析所用的数据来源为某市2015年至2016年两年的专变用户和低压用户同月同一用户出现多种异常的历史告警数据。数据主要包括用户编号、异常类型名称、异常发生时间、异常恢复时间、异常归档时间等信息。其中异常恢复时间受多种因素影响，针对要纳入考核的计量异常事件，一般在一周内会进行人工恢复；而对于不进行考核的异常事件，则对恢复时间没有要求，会视现场运行情况和工人工作安排来进行恢复；历史告警数据中给出的恢复时间可能是归档时间，而不是实际恢复时间，实际恢复时间无法确定。鉴于目前已有的历史数据中异常事件的发生时间是确定的，所以在求两两异常事件之间关联度时以异常事件发生的时间为参考，通过两个异常发生时间的间隔天数来计算关联度。

进行故障疑似度分析所用的数据来源为2015年7月至2016年8月某市389个变电站的电能质量监测数据及检修人员对异常进行排查、确定原因和检修后填写的档案数据。数据库中的数据包含每一用户发生的各种异常事件、每一个异常的发生时间和恢复时间、异常发生原因等信息。

2关联分析方法

2.1关联系数函数构造

式中d为同一用户两个异常事件发生日期间隔天数。

2.2关联分析流程

首先对历史数据进行分析处理，得到两年来所有出现过的计量异常事件种类，记为ak(k＝1,2,…,n)；然后对所有的异常事件进行两两组合，分别进行关联分析。根据两个计量异常事件发生的先后顺序，分别基于关联系数计算两个异常事件之间的关联度rij和rji。rij表示异常ai先发生时，异常ai与异常aj之间的关联度；rji表示异常aj先发生时，异常ai与异常aj之间的关联度。

基于历史数据得到异常ai与异常aj发生日期间隔在15天以内且为同一用户，异常ai先发生(包含同一天发生)的次数ni，以及异常aj先发生(包含同一天发生)的次数nj；再根据公式(1)分别计算这ni和nj次并发异常事件的关联系数，记为rip(p＝1,2,3,…,ni)和rjq(q＝1,2,3,…,nj)。

考虑到关联系数中取值为0的情况比较多，会降低大部分发生间隔天数较短的两个异常事件关联度的准确性，因此在求关联度时需要根据具体情况考虑是否包含关联系数为0的部分。以关联度rij为例，当异常ai先发生，且两异常间隔天数在6天以内的次数小于总次数ni的50％时，根据统计学经验可以认为两个异常事件之间的关联度较小，求关联度时保留关联系数为0的项，直接对所有的关联系数求平均值得到关联度rij；否则求均值时剔除关联系数为0的项。由此可得关联度rij的计算公式为：

式中mi≤ni，当间隔天数在6以内的次数小于总次数ni的50％时，mi＝ni，此时rip’即为rip；反之，当间隔天数在6以内的占比大于等于50％时，mi<ni，此时rip’为rip中不为0的部分。同理可得关联度rji的计算公式为：

3对并发事件进行甄别

通过式(2)和式(3)计算出的关联度的范围为[0,1]，越接近1，关联性越强；越接近于0，关联性越弱。通过设定阈值对并发异常事件进行筛选，当计算得到的关联度高于此阈值时，将其视为一组并发异常事件组合。表1给出相关系数与关联性强弱的对应关系。

表1相关系数与关联性强弱的对应关系^[12]

对于需要考核的异常事件，一般会在一周内进行处理，此时可将阈值设置为即0.618；对于不进行考核的异常事件组合，则根据相关系数与关联性强弱的对应关系将阈值设置为0.4。通过关联度计算、设置阈值对并发异常事件进行了甄别，筛选出了需要进行一步进行故障疑似度分析的异常事件组合。

4故障疑似度计算

4.1求单一异常事件由某类原因引起的故障疑似度

对异常原因数据进行分析处理，求得引起各异常ai(i＝1,2,…,n)的原因共有m类，表示为bj(j＝1,2,…,m)；然后根据式(4)求得各类原因发生的概率p(bj)；

式中a为所有异常原因发生的总次数，bj为第j类异常原因发生的次数。

每种异常事件都有多个导致其发生的原因，根据式(5)求得某一原因发生的情况下，某异常发生的概率p(ai|bj)——在原因bj发生的条件下，异常ai发生的概率；

式中cj为异常ai发生的条件下，第j类异常原因发生的次数。

然后由全概率公式^[13]求得每种异常事件发生的概率p(ai)。

最后再根据式(7)贝叶斯公式^[13]求得p(bj|ai)——异常事件ai的发生由原因bj引起的概率，该概率即为单一异常事件由某类原因引起的故障疑似度。

4.2计算并发异常事件由某类原因引起的故障疑似度

通过对单一异常事件的故障原因子集求交集，确定形成异常并发事件组合的异常原因集合，当有异常告警并发时，触发异常的原因为异常原因交集中的一种的概率较大。基于历史数据计算出单一异常事件下各异常原因的故障疑似度，再与并发异常事件组合的关联度相结合，即可得到并发异常事件下各种异常原因的故障疑似度。

以并发异常事件组合a1和a2为例，单一异常a1和a2由原因bj引起的概率分别为p(bj|a1)和p(bj|a2)，则单异常事件故障疑似度矩阵为：

d＝[p(bj|a1)p(bj|a2)](8)

异常a1先发生，异常a2后发生两者的关联度为r12；异常a2先发生，异常a1后发生的关联度为r21。则关联度矩阵为：

那么当异常a1和异常a2并发时，异常原因为bj的疑似度矩阵为：

其中e1为异常a1先发生，异常a2后发生由原因bj引起的疑似度；e2为异常a2先发生，异常a1后发生由原因bj引起的疑似度；异常a1与异常a2同日发生时，由原因bj引起的故障疑似度为(e1+e2)/2。

通过式(10)计算得到的故障疑似度范围为[0,1]，越接近1，疑似度越高；越接近于0，疑似度越低。

5实例分析

为了证明上述关联分析方法的准确性和可靠性，选取其他错接线与潮流反向两组计量异常事件进行分析。

从故障疑似度计算结果可以看出，当其他错接线与潮流反向异常告警并发时，不论是其他错接线先发生，还是潮流反向先发生，或者是其他错接线与潮流反向同日发生，触发异常的原因为档案差错的可能性都最大，而触发异常的原因为人为窃电的可能性都最小。

根据现场工人排查经验，当其他错接线与潮流反向异常告警并发时，异常原因为档案差错的情况最多，异常原因为人为窃电的情况极少。与故障疑似度计算结果基本一致。

以上图1、2所示的一种多计量异常事件关联度分析方法是本发明的具体实施例，已经体现出本发明实质性特点和进步，可根据实际的使用需要，在本发明的启示下，对其进行形状、结构等方面的等同修改，均在本方案的保护范围之列。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡毅;廖绍成;裘华东;曹君波;陈卫民;严华江;卢鑫;李波;李熊
技术所有人：国网浙江新昌县供电有限公司;国网浙江省电力有限公司;中国计量大学;浙江华云信息科技有限公司;国家电网公司
我是此专利的发明人

上一篇：一种处理畜禽废水的生物填料的制作方法
上一篇：一种处理畜禽废水的生物填料的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。