一种基于频繁项集的配电设备故障因素关联性挖掘方法与流程

文档序号:23308408发布日期:2020-12-15 11:39阅读:128来源:国知局
一种基于频繁项集的配电设备故障因素关联性挖掘方法与流程

本发明涉及电力系统技术领域,特别是涉及一种基于频繁项集的配电设备故障因素关联性挖掘方法。



背景技术:

配电网是由架空线路、环网柜、电缆、配电变压器、隔离开关以及一些附属设备组成的,在电能的分配中起重要的作用。多年来由于检测设备以及诊断技术的限制,我国对配网设备一直采用定期检修的制度,这既缺少合理性和科学性,又存在很大的盲目性,许多配网设备应修而没有及时整修,轻则影响其使用寿命和技术性能,重则会造成设备的损毁甚至造成重大事故;也有很多的设备不该修而却依照计划进行整修,从而造成人力和财力的浪费,甚至还会导致设备因检修不当影响其正常运行。

在配网设备在线监测与状态评估方面,传统的配电设备侧重于设备故障诊断及故障原因分析,而对设备风险预警关注较少。且配网设备状态评价依据通常来自多维度信息,不同来源的信息可能存在冲突和矛盾。如绝缘电阻和过载累计时长两个状态变量单独评价设备状态可能得到不同的结果,此时不能单独考虑一种状态变量的结果。在已有的工作中,大部分检测分析体系只是将不同的变量所表征的结果单一打分或是简单加权,没有很好地解决不同来源证据之间的冲突性与冗余性,只是针对配电设备影响因素开展粗略的数值分析与专家推理,且由于配网设备众多,在监测、记录的过程中可能会出现数据缺失的情况。目前已有的检测分析体系往往需要确定的变量作为检测分析条件,当数据缺失时往往无法进行检测分析或是检测分析结果不全面。因此,需要有针对性的对每起配网设备故障事件追根溯源,对配网故障信息进行汇总和深度挖据,分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联。通过对配网故障数据整合分析、深入挖掘,为今后配网设备的状态预警和运维检修提供前瞻性预防措施,形成配电设备多模态信息融合的状态诊断方法,对配电设备健康状况进行全方位、多视角的诊断、评价及风险预警。

目前最简单的相关性分析是分析两个变量是否线性相关,常见的方法有画散点图、方差分析、相关系数分析、线性回归分析,但是这些方法也有许多弊端,在处理多元、非线性、高维的大数据时所得到的结果不够全面,且运行过程速度太慢,采用频繁项集理论可以解决上述问题。



技术实现要素:

本发明的目的是提供一种基于频繁项集的配电设备故障因素关联性挖掘方法,基于频繁项集理论分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,促进配网设备实现健康模式。

为实现上述目的,本发明提供了如下方案:

一种基于频繁项集的配电设备故障因素关联性挖掘方法,包括以下步骤:

s1,建立含有多故障因素的配电设备故障信息库;

s2,将配电设备故障信息库中的各种故障因素转换为“0,1”矩阵文件,并设置最小支持度minsup、最小置信度minconf和输出最大规则数,按照支持度排序后,规则输出文件;

s3,采用apriori算法对不同故障因素的频繁项集进行挖掘,构建涵盖不同故障因素个数的频繁候选项集;

s4,分别为规则和大小为1、2的频繁候选项集的单元数组预分配内存;

s5,查找大小为1的频繁项集,即含有minsup的所有项目的列表,查找大小大于等于2的频繁项集,并从中找出带有minconf的规则,基于先验原理通过支持度对候选项集进行剪枝;

s6,根据置信度或支持度按降序对规则进行排序,将规则保存在文本文件中并在显示屏上显示,得到配电设备多种故障因素的关联性。

优选的,所述步骤s1中,建立含有多故障因素的配电设备故障信息库,具体包括:配网设备属性、运行环境、地区属性、设备故障类型频发性、设备故障发生可能性和设备故障严重程度中的一种或多种。

优选的,所述步骤s2中,支持度公式为support(a,b)=p(a,b),置信度公式为confidence(a,b)=p(b|a);

引入二进制值sortflag,指示规则是否应按支持度或置信度排序,当sortflag=1,表示规则按支持度大小排序,当sortflag=2表示规则按置信度大小排序。

优选的,所述步骤s3中,进行不同故障因素的频繁项集挖掘,构建涵盖不同故障因素个数的频繁候选项集,具体包括:

如果输入因素个数nargin<7,则保存规则的可选文件名为默认;如果输入因素个数nargin<6,则labels=cellfun(@(x){num2str(x)},num2cell(1:n)),其中数据集中的案例数量m=size(cases,1);数据集中的属性数n=size(cases,2);如果输入因素个数nargin<5,则sortflag=1;如果输入因素个数nargin<4,则标量值nrules=100;如果输入因素个数nargin<3,则最小置信度minconf=0.5;如果输入因素个数nargin<2,则最小支持度minsup=0.5;如果输入因素个数nargin=0,则显示错误。

优选的,所述步骤s5中,所述先验原理为:如果一个集合是频繁项集,则它的所有子集都是频繁项集;如果一个集合不是频繁项集,则它的所有超集都不是频繁项集。

优选的,所述步骤s5还包括存储频繁项集,删除由于预分配而产生的不需要的行。

根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于频繁项集的配电设备故障因素关联性挖掘方法,在频繁项集的基础上分析不同参量(配网设备属性、运行环境、地区属性)组合情况下与设备故障类型频发性、设备故障发生可能性和设备故障严重程度等故障信息的关联程度,进行多项因素与故障信息的关联分析;有针对性的对每起配网设备故障事件追根溯源,对配网故障信息进行汇总和深度挖据,分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,对配网设备运行维护决策起到了重大的作;利用先验原理对项集进行基于支持度的剪枝,不用计算支持度就能删除掉某些非频繁项集,系统地控制候选项集指数增长,一定程度上提升了效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于频繁项集的配电设备故障因素关联性挖掘方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于频繁项集的配电设备故障因素关联性挖掘方法,基于频繁项集理论分析配网设备自身及运行环境影响的各类因素和故障事件及故障特征之间的关联,解决配网设备数据冲突,促进配网设备实现健康模式。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明基于频繁项集的配电设备故障因素关联性挖掘方法流程图,如图1所示,本发明提供的基于频繁项集的配电设备故障因素关联性挖掘方法,包括以下步骤:

s1,建立含有多故障因素的配电设备故障信息库;

s2,将配电设备故障信息库中的各种故障因素转换为“0,1”矩阵文件,并设置最小支持度minsup、最小置信度minconf和输出最大规则数,按照支持度排序后,规则输出文件;

s3,采用apriori算法对不同故障因素的频繁项集进行挖掘,构建涵盖不同故障因素个数的频繁候选项集;

s4,分别为规则和大小为1、2的频繁候选项集的单元数组预分配内存;

s5,查找大小为1的频繁项集,即含有minsup的所有项目的列表,查找大小大于等于2的频繁项集,并从中找出带有minconf的规则,基于先验原理通过支持度对候选项集进行剪枝;

s6,根据置信度或支持度按降序对规则进行排序,将规则保存在文本文件中并在显示屏上显示,得到配电设备多种故障因素的关联性。显示disp为['关联规则算法完成,规则数为:'num2str(size(rulesup,1))]。

其中,所述步骤s1中,建立含有多故障因素的配电设备故障信息库,具体包括:配网设备属性、运行环境、地区属性、设备故障类型频发性、设备故障发生可能性和设备故障严重程度中的一种或多种。

所述步骤s2中,支持度公式为support(a,b)=p(a,b),置信度公式为confidence(a,b)=p(b|a);

引入二进制值sortflag,指示规则是否应按支持度或置信度排序,当sortflag=1,表示规则按支持度大小排序,当sortflag=2表示规则按置信度大小排序。其中,最小支持度是用户或专家定义的衡量支持度的一个阈值,表示项目集在统计意义上的最低重要性;最小置信度是用户或专家定义的衡量置信度的一个阈值,表示关联规则的最低可靠性,同时满足最小支持度阈值和最小置信度阈值的规则称作强规则。

设置这些参数的目的是找到强关联规则,控制规则数。在s5需要用到最小支持度、最小置信度和最大规则数。

设置参数可以如下所示:

minsup=0.2;%最小支持度

minconf=0.5;%最小置信度

nrules=1000;%输出最大规则数

按照支持度或置信度排序表示如下:

sortflag=1;%按照支持度排序

sortflag=2;%按照置信度排序

本发明使用的是按照支持度排序,规则输出文件,将输出的规则存储在文件中。

所述步骤s3中,进行不同故障因素的频繁项集挖掘,构建涵盖不同故障因素个数的频繁候选项集,具体包括:

如果输入因素个数nargin<7,则保存规则的可选文件名为默认;如果输入因素个数nargin<6,则labels=cellfun(@(x){num2str(x)},num2cell(1:n)),表示创建一个单元数组,将数组中的从1取到n转换成字符串,其中数据集中的案例数量m=size(cases,1);数据集中的属性数n=size(cases,2);如果输入因素个数nargin<5,则sortflag=1;如果输入因素个数nargin<4,则标量值nrules=100;如果输入因素个数nargin<3,则最小置信度minconf=0.5;如果输入因素个数nargin<2,则最小支持度minsup=0.5;如果输入因素个数nargin=0,则显示错误,表示没有提供输入参数。

所述步骤s4中,规则表示的是2*1单元阵列,第一个单元格(规则{1}{}):包含规则左边的项集,第二单元(规则{2}{}):包含右边的项集的规则。

例如,如果第一个规则是{1,2}->3,那么规则{1}{1}=[1,2],规则{2}{1}=[3])。

freqitemsets表示:大小为1、2等的频繁项目集的单元数组,其中项目集支持度>=minsup,freqitemsets{1}表示大小为1的项目集,freqitemsets{2}表示大小为2的项目集等等。

所述步骤s5中,所述先验原理为:如果一个集合是频繁项集,则它的所有子集都是频繁项集;如果一个集合不是频繁项集,则它的所有超集都不是频繁项集。

所述步骤s5还包括存储频繁项集,删除由于预分配而产生的不需要的行,有助于提高运算速度。

本发明一具体实施例中,以运行环境的故障因素为例,其中包含了如表1中的多种运行环境,将日平均相对湿度、极大风速、日累计降水量、日最高气温、雷电个数、雷电小时这些属性分别对应成r、w、pr、te、ln、lh。架空导线异常停电对应为f,探究气象因素与架空导线故障之间的关系。

案例数据如下所示

r3,w3,pr3,te2,f

r2,w3,pr3,te2,f

r1,w2,pr1,te3,f

r3,w3,pr3,te3,f

r3,w3,pr3,te1,ln1,f

r2,w3,pr2,te2,f

r1,w3,pr2,te2,f

r2,w3,pr3,te3,ln1,lh1,f

r2,w3,pr3,te3,ln2,lh2,f

r3,w2,pr3,te3,ln1,lh1,f

设置参数如下所示:

minsup=0.4;%最小支持度

minconf=0.5;%最小置信度

nrules=1000;%输出最大规则数

sortflag=1;%按照支持度排序

得到的关联规则为:

w3->f(80%,100%)

pr3->f(70%,100%)

pr3,w3->f(60%,100%)

te3->f(50%,100%)

r2->f(40%,100%)

r3->f(40%,100%)

te2->f(40%,100%)

pr3,r3->f(40%,100%)

pr3,te3->f(40%,100%)

r2,w3->f(40%,100%)

te2,w3->f(40%,100%)

由上述关联规则可看出,极大风速大于等于10m/s时对架空导线造成影响的程度最大,日累计降水量大于等于25mm时对架空导线的影响次之,极大风速大于等于10m/s且日累计降水量大于等于25mm时对架空导线的影响位居第三。此外,日最高气温大于等于30℃对架空导线故障也有一定的影响。

表1气象数据等级划分表

本发明提供的基于频繁项集的配电设备故障因素关联性挖掘方法,在频繁项集的基础上分析不同参量(配网设备属性、运行环境、地区属性)组合情况下与设备故障类型频发性、设备故障发生可能性和设备故障严重程度等故障信息的关联程度,进行多项因素与故障信息的关联分析;实现将现有配电网故障数据融合故障下的其他多源数据,融合频繁项集数据挖掘方法,挖掘故障关联规则,缩小配电网巡视运维范围,以提高配电网运行可靠性,解决配网设备数据冲突,促进配网设备实现健康模式。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1