一种用于输电系统的层次概率模糊推理方法

文档序号:31152237发布日期:2022-08-17 04:19阅读:36来源:国知局
1.本发明涉及一种用于输电系统的层次概率模糊推理方法。
背景技术
::2.现有的针对输电系统的推理系统,运算复杂度高,且没有考虑到罕见变量,因此,有必要设计一种新的用于输电系统的层次概率模糊推理方法。技术实现要素:3.本发明所要解决的技术问题是提供一种用于输电系统的层次概率模糊推理方法,该方法能减小fis的运算复杂度并提升实用性。4.发明的技术解决方案如下:5.一种用于输电系统的层次概率模糊推理方法,其特征在于,基于层次概率模糊推理系统进行推理;6.层次概率模糊推理系统的输入变量为影响输电线的各参数,包括平均风速,日降雨量,平均气压,平均气温,最高气温和最低气温;;采用四组三角形函数作为输入隶属度函数以对应pdf中的四个数值区间,pdf为概率分布函数;并将这四个数值区间分别定义为:罕见(r)、较少(i)、可能(p)、常见(f),其中模糊集的划分都取决于各个连续特征中数值区间的划分;7.层次概率模糊推理系统的输出量为风险等级;基于四组梯形函数设计输出隶属度函数,其中的四个模糊集分别对应四个概率模糊风险等级:低(l)、中(m)、高(h)、极高(e)。8.表1选取的环境特征及所含元素汇总9.[0010][0011]表2第一个fis应用的模糊规则[0012][0013][0014]模糊规则集如表1和表2所示。[0015]其中:1)表1表示图5中左上角处第一个fis所应用的模糊规则集,而表2表示图5中其余四个fis所使用的模糊规则集;2)表4-2中的“风险”表示前一个fis输出的结果;3)“&&”在隶属度中的计算方法为m(a&&b)=min(ma,mb)。[0016]有益效果:[0017]本发明对传统模糊推理系统(fuzzyinferencesystem,fis)提出了两点改进。一方面,采用了层次结构,可以减小fis的运算复杂度;另一方面,在构建隶属度函数时应用了概率模糊风险取代传统的直接模糊风险,能够以相同的函数形式处理不同类型的连续特征,从而可以减小fis的运算复杂度并提升实用性。此外,基于概率模糊风险还能够直接将连续特征中的罕见变量纳入到分析中。综合以上两方面设计层次概率模糊推理系统(hierarchicalprobabilityfuzzyinferencesystem,hpfis)附图说明[0018]图1为输入特征筛选流程图;[0019]图2为输入特征有效性验证原理图;[0020]图3为连续环境特征值pdf及各个数值区间概率分布示意图,其中图a-f分别对应平均气温、最高气温、最低气温、平均气压、日降水量和平均风速的概率分布图;[0021]图4为fis输入隶属度函数;[0022]图5为hfis结构示意图;[0023]图6为fis输出隶属度函数示意图;[0024]图7为fis概率模糊风险分析示例图;[0025]图8为集成式模型的结构示意图;[0026]图9为fcarm模型流程图。图10为预测模型流程图。具体实施方式[0027]以下将结合附图和具体实施例对本发明做进一步详细说明:[0028]实施例1:[0029]输电线路系统外部环境数据可以分为两种类型:离散特征和连续特征。其中,离散特征的环境元素以相互分离的个体形式存在,可直接通过关联规则挖掘进行处理;而连续特征则需要事先离散化,由于主观性较大而存在一定的随机性和不确定性,故直接基于关联规则挖掘进行处理时的预测效果通常有限。而fis相较关联规则挖掘模型更适用于处理连续特征。[0030]将计及罕见变量的关联规则挖掘(associationruleminingwithrareelementsandtimeseries,armret)模型与hpfis(层次模糊推理系统)相结合,构建了一种集成式模型:模糊条件关联规则挖掘(fuzzyconditionalassociationrulemining,fcarm)预测模型,从而可以将离散特征和连续特征分别基于不同的专家模型进行挖掘分析,尽可能发挥出不同模型各自的优势,进而提升预测的准确性。将连续特征与离散特征分离,其中离散特征仍由armret模型进行处理,而连续特征采用基于armret模型和fis组成的集成式模型进行处理。通过构建集成式学习(ensemblelearning,el)模型分别求解了fis和armret子模型各自的最优专家权重,以尽可能减小误差的影响。[0031]实例及数据分析:[0032]本专利采用位于南部某省的高压输电线路系统作为算例测试系统。由于该省具有地形复杂、气候多变的特点,能够提供充足的故障样本以满足验证预测效果的数据需求。本专利基于从2012至2016年发生在该系统110kv及以上线路中的故障进行分析。相应时段内该省份的相关气象数据由中国气象部门提供,其中数据更新频率为以utc通用协调时为基础的每一小时更新一次。本专利所采用的原始故障记录中含有24个环境特征,原始气象数据中包含25个气象特征。[0033]一方面,为增强本专利所提出的fcarm模型在不同应用场景中的实用性和灵活性,需要对原始数据中的特征进行筛选。因此,本专利依据图1中的五个特征筛选条件进行筛选。通过筛选,一些适用性窄的特征被剔除,如绝缘器材质、导线覆冰厚度、杆塔编号等。[0034]另一方面,为确保所筛选的环境特征有助于预测效果的提升,本专利选择格兰杰因果关系测试对通过初步筛选的输入环境特征进行有效性验证,即在不受其他特征影响时衡量单个特征在预测过程中的作用。假设一组时间序列u能够有助于预测另一组时间序列v,或时间序列u的历史信息能够改善时间序列v的预测效果时,则称时间序列u和时间序列v之间存在格兰杰因果相关。本专利采用auroc作为预测效果的衡量标准。因此,将比较当应用除待验证特征fj外的其他特征时的预测效果,与当包括待验证特征fj在内的所有特征时的预测效果之间是否存在改善。此外,预测效果的对比将基于每一个研究周期进行,并重复直至所有的研究周期均被验证完毕。验证的原理示意图如图2所示。[0035]结合以上两个方面的筛选,本专利采用故障记录中的九个环境特征和气象数据中的九个特征进行预测。[0036]综合以上信息,本算例所选取的环境特征以及所含元素如表1所示。[0037]表1选取的环境特征及所含元素汇总[0038][0039][0040]连续特征的预处理[0041]针对输电线路系统外部环境中的连续环境特征,现有fis往往基于直接模糊风险对它们进行处理。。例如现有fis在分析连续输入特征“日平均气温”时,首先需要将该输入特征划分为不同的模糊集。传统思路为直接基于特征本身数值划分不同区间,例如模糊集“寒冷”对应日平均气温为“‑10℃至0摄氏度”。这种基于输入特征本身数值和单位的直接模糊风险相对更加直观,且在用于为一些特征划分模糊集时也更加精确。但直接模糊风险在面对不同特征时需要构建不同的隶属度函数,从而增加了运算负担,还降低了在不同应用场景中的适应能力。与直接模糊风险不同,概率模糊风险能够以相同的标准为不同特征划分模糊集,即仅基于各个特征值在数据库中的出现频率。在这种情况下,当被应用到不同场景中时,fis的适应能力将得到极大地提升。此外,采用概率模糊风险意味着将直接基于各个特征值的出现频率进行分析,所以相应的fis还能够直接分析其中的罕见数据,相比基于关联规则挖掘方法的模型更为简便易行。[0042]在本专利中,首先计算所有输入连续环境特征的概率分布,并通过采用概率模糊风险的fis将这些概率分布转化为模糊风险指数(fuzzyriskindex,fri)。由算例数据可知,输入数据库中共有六种连续环境特征,分别为:平均气温,最高气温,最低气温,平均气压,日降水量,平均风速。这六种连续环境特征中的特征值在输入数据库中的出现频率可通过概率分布函数(probabilitydistributionfunction,pdf)表示。基于这些pdf曲线,本专利将每一个连续环境特征的特征值都划分为四个数值区间:[0043]日降水量(mm):~2.5,2.5~10,10~50,50~[0044]平均风速(km/h):~22.5,22.5~34,34~45,45~[0045]平均气温(℃):~16,16~21,21~26,26~[0046]最高气温(℃):~19,19~25,25~31,31~[0047]最低气温(℃):~13,13~18,18~23,23~[0048]平均气压(hpa):~1006.5,1006.5~1013,1013~1019,1019~[0049]基于这些pdf曲线和划分的数值区间,能够求解出各个特征值出现在相应特征中每一个数值区间的概率。六个连续环境特征的pdf曲线和数值区间划分如图3所示。[0050]概率模糊风险的求解[0051]对于所求解的各个连续环境特征值属于每一个数值区间的概率,应用输入隶属度函数将这些概率模糊化。本专利采用四组三角形函数作为输入隶属度函数以对应pdf中的四个数值区间,并将这四个数值区间分别定义为:罕见(r)、较少(i)、可能(p)、常见(f),其中模糊集的划分都取决于各个连续特征中数值区间的划分。本专利采用的输入隶属度函数如图4所示,由于所有连续特征所采用的输入隶属度函数形状均为三角形函数,故在图4中仅展示针对“最高气温”的输入隶属度函数的形状,其余输入隶属度函数均只显示模糊集之间的边界。[0052]本专利采用mamdani型fis分析概率模糊风险。在mamdani型fis中,如果采用单层结构的fis,当分析各包含四个模糊集的六个连续环境特征时,共需要考虑46=4096条模糊规则,将造成极大的运算负担。为解决这一问题,本专利采用了层次模糊推理系统(hfis)。相比单层结构的fis,hfis改为将系统划分为多个子系统并逐一求解,从而能够有效减少需要考虑的模糊规则数目。本专利所构建的hfis如图5所示,仅需考虑共计5·16=80条模糊规则。[0053]根据电力安全事故应急处置和调查处理条例,输电线路系统故障根据所造成的人员伤亡、经济损失等,可以被分为四级,其中一级事故到四级事故所造成的损失依次递减。因此,故障级别越高则需要得到更多的重视,故应赋予更高的相对权重。基于条例中各等级事故所造成的不同损失程度,本专利为所有模糊规则设定了一组模糊风险权重。在本专利中,输出概率模糊风险依据条例对故障的分级被划分为四类:低(l)、中(m)、高(h)、极高(e),分别对应数值为0.13、0.23、0.33、1的模糊风险权重。通常来说,一级事故最为罕见但一旦发生将会造成最高程度的损失,而四级故障虽然危害程度较低但出现频率较高。综合考虑以上因素,本专利构建的模糊规则集如表2和表3所示,其中:1)表4-1表示图4-5中左上角处第一个fis所应用的模糊规则集,而表4-2表示图4-5中其余四个fis所使用的模糊规则集;2)表4-2中的“风险”表示前一个fis输出的结果;3)“&&”在隶属度(m)中的计算方法为取各变量隶属度中的最低值,可写为m(a&&b)=min(ma,mb)。[0054]表2第一个fis应用的模糊规则[0055]table.2fuzzyrulesappliedinthefirstfis[0056][0057]表3其余四个fis应用的模糊规则[0058]table.3fuzzyrulesappliedintheotherfourfis[0059][0060][0061]最后,本专利基于四组梯形函数设计了输出隶属度函数,其中的四个模糊集分别对应四个概率模糊风险等级:低(l)、中(m)、高(h)、极高(e)。通过对输入数据库中所有记录的汇总,能够获得对应四个事故等级的故障记录的数据占比。故可以将函数中的四个模糊集与四个事故等级对应,即概率模糊风险等级中的“低(l)”对应“四级事故”而“极高(e)”对应“一级事故”。基于此,四个模糊集之间的边界能够基于对应的四个事故等级故障记录的统计结果确定。最终生成的输出隶属度函数如图6所示。[0062]本专利以基于某一次输电线路系统故障的概率模糊风险分析为例论述整个fri的求解过程,具体如图7所示。在这一条故障记录中,六个连续环境特征依据其特征值以及pdf分布能够计算出相应特征值的出现概率:p(平均风速)=30%,p(日降水量)=35%,p(平均气压)=7%,p(平均气温)=2.5%,p(最高气温)=2%,p(最低气温)=3%,并在图7中以虚线表示。由此得到的概率模糊风险所代表的的区域面积将被加权并累加。接下来,累加风险区域面积经重心法进行去模糊化后,能够求解出相应的fri并在图7中以实线表示。由图5可知,本专利采用的hfis将前一个fis的输出结果作为后一个fis的输入,直到六个fis都运行完毕。故在本例中,最后求解得到的fri为0.887。[0063]多模型的集成[0064]为提高输电线路故障的预测准确性,相较单个数据挖掘专家模型,el方法能够结合多个不同的专家模型,从而实现更好的预测效果。其中,本专利在处理输入特征中的连续特征时,将同时应用armret模型和hpfis,因此相应的风险指数也由这两种专家模型共同计算;而在处理离散特征时,仍单独采用armret模型计算相应的风险指数。由于需要集成两种模型,故需要确定每种模型的专家权重,即每种模型所计算的风险指数在综合风险指数中的占比。为此,本专利设计了一种门控网络(gatingnetwork,gn)以将两种专家模型softmax化。结合两种专家模型的集成式模型的结构如图8所示。连续特征两个模型同时应用,门控网络控制每一个子模型的权重;离散特征只采用下面那个armret。[0065]gn主要用于优化两个专家权重以减少预测过程中的潜在误差。为此,本专利采用遍历的方式测试不同专家权重下集成式模型的预测效果以求解误差最低时的专家权重。如果在某一次测试中应用了第q组专家权重,则该次测试的误差可以通过“理想输出向量在高斯分布上的负对数概率”来表示,相应的数学表达为[0066][0067]式中:ωq(x)表示gn对模型x在第q组测试中赋予的专家权重,dq表示理想结果,oq(x)表示模型x所产生的实际结果。[0068]由于在应用不同专家权重时求解到的风险指数也将产生变化,因此每一组测试中误差的变化趋势同样值得分析。故在每一组测试中将加入对误差函数导数的求解,其数学表达为[0069][0070]式中:u表示两个专家模型中的任意一个。[0071]fdcarm预测模型的实施流程[0072]基于以上章节的讨论和分析,本专利所提出的fcarm模型的具体实施步骤如下所示:[0073]1.将输入数据库d中的环境特征分为离散环境特征和连续环境特征;[0074]2.当数据库d中的单个环境特征fj为离散环境特征时,fj中所含所有元素,采用基于条件重要度诊断标准阈值(式(2-10)到(2-14))的重要度诊断标准计算方法挖掘出相应的罕见元素,余下的环境元素即为常见元素;[0075]3.不含该特征中任何罕见元素的故障记录被保留在d中;[0076]4.含有该特征中任意罕见元素的故障记录被归类于子矩阵中,并通过条件重要度诊断标准计算方法(式(2-16)到(2-20))从特征fj的罕见元素中进一步挖掘hilp元素,以高频变量集和频繁关联规则的形式体现;[0077]5.对于d中的每一个环境特征,依次重复进行第2-4步;[0078]6.对于每一个环境元素,由式(3-7)求解相应的eri;[0079]7.对于d中的各个季度,由式(3-20)求解相应的tri;[0080]8.基于第6-7步求解各条测试故障记录涵盖特征的tfri,计算相应记录的预测故障风险度,并归一化(0→1:不可能发生故障→一定发生故障);[0081]9.将预测故障风险度与测试集中真实记录相比较(0或1:故障发生或未发生),从而评估armret模型的预测性能。[0082]10.求解离散环境特征中各个元素的最终tfri。[0083]11.对所有的连续环境特征进行预处理;[0084]12.对于所有连续环境特征,由armret模型(第2-10步)求解相应的tfri;[0085]13.对于所有连续环境特征,计算它们各自的概率模糊风险,并求解相应的fri;[0086]14.通过gn对专家权重进行优化,基于tfri和fri求解出各个连续环境特征量的综合风险指数;[0087]15.基于第10步和第14步的结果,整合所有环境特征的风险指数;[0088]16.基于第15步中所有环境特征的风险指数求解测试数据集中各条故障记录的预测故障风险度,并归一化(0→1:不可能发生故障→一定发生故障);[0089]17.将预测故障风险度与测试集中相应记录的真实故障处理结果相比较(0或1:故障处理结果发生或未发生),从而评估fdcarm模型的预测性能;[0090]基于以上实施步骤,本专利所构建的fcarm算法预测流程如图9所示。[0091]本发明还是合计tfri模型,介绍如下:[0092]一种tfri权重计算模型的建立方法,其特征在于,基于armfet预测模型(该模型为现有技术),建立tfri权重计算模型,tfri是指双重风险指数。[0093]所述的tfri权重计算模型由下式表征:[0094][0095]式中:ωe和ωt分别为和的权重,均取值为“1”,为tfri值;[0096]tfri权重计算模型涉及年度输入数据库;对年度输入数据库的定义如下:[0097]由于年度这一时间单位具有周期重复性,故将输入数据按年度划分并分别进行挖掘,以便验证预测的效果;[0098]年度输入数据库dy为:[0099][0100]式中:[0101]第一个变量dy:dy∈d={d1,d2,...,dz}代表输入数据库d中一年的数据,即在一年内所有发生故障的记录,d1,d2,...,dz代表输入数据库d中第一年、第二年直至最后一年(dz)的数据。[0102]第二个变量ti:ti代表任意一个(位置为第i行)故障记录的编号。其中假设总计收录了m条故障记录,因此,i=1,2,...,m。[0103]第三个变量fj:f={f1,f2,...,fj,...,fn,fy}为一个包含所有环境特征的集合,fj为环境特征变量(如天气),fy为相应的目标特征变量(目标变量,此处为故障是否处理成功)。[0104]第四个变量vij:每一个环境特征fj都由一组环境元素ej,1,ej,2,…,ej,k,...,ej,l组成(特征“天气”包含元素:“晴天”、“阴天”、“多云”。。。),其中第一个下标表示元素对应第j个特征fj,其中第二个下标k=1,2,...,l表示总计l个元素中的任意一个。选定环境元素作为输入变量。设i={v1,v2,...}为一个包含所有输入变量的集合,则ej,k等同输入变量集合i中的任意一个变量vij(假设出现在第i行的故障记录中,对应第j个特征fj);[0105]第五个变量yi:设{y1,y2,...,yi,...,ym}为所有的目标变量,具体为故障的实际处理结果。在处理故障时,共考虑两种故障处理措施:自动重合闸和强送电。因此,故障处理结果的设定如下:当故障发生时,若自动重合闸成功,则称为“成功”;若自动重合闸失败或未动作而强送电成功或未启用,则称为“勉强成功”;其他,则统称为“失败”。因此,出现在第i行的故障记录中目标变量yi可采用三种故障处理结果中的一种(成功、勉强成功、失败)来表示,并设y(hy)∈{y(s),y(p),y(f)}代指三种故障处理结果(success、proper、failure)中的任意一种。[0106]第六个变量d={d1,d2,...,di,...,dm}:表示包含所有故障所导致电力中断持续时间的集合[0107]第七个变量s={s1,s2,...,si,...,sm}:表示包含所有故障所在季度的集合,其中si表示一次故障所在的季度,s(hs)∈{s(1),s(2),s(3),s(4)}表示四个季度中的任意一个。[0108]第八个变量a={a1,a2,...,ai,...,am}:表示所包含研究地区所有子区域的集合,其中ai表示一次故障所在的子区域,a(ha)∈{a(1),a(2),a(3),...}表示所研究地区中的任意一个子区域。[0109]第九个变量l={l1,l2,...,li,...,lm}:表示包含所有故障所在故障日稳定性评估等级的集合,其中li表示一次故障所在故障日的稳定性评估等级,l(hl)∈{l(m),l(s),l(b)}表示三种等级(med,sed,bed)中的一个等级。[主要故障日(majoreventday,med)、严重故障日(severeeventday,sed)和一般故障日(basiceventday,bed)。]。[0110]为任意一个特征fj中的单个元素ej,k∈fj的eri(环境风险指数),由两部分组成:[0111][0112]式中:表示来自常见元素的风险;表示来自罕见元素的风险;[0113]其中,的表达式为[0114][0115]式中:[0116]采用年度输入数据库矩阵dy作为eri的数据求解空间;[0117]为分别对常见变量集和罕见变量集进行分析,设dy的子矩阵为罕见变量集子矩阵dy中包含特征fj中任意罕见环境元素的故障记录;[0118]fjr,fjg分别表示此外,基于单个特征fj所包含元素的集合构建了两个子集合:[0119]常见元素子集合fjg:包含所有特征fj中的常见元素;[0120]罕见元素子集合fjr:包含所有特征fj中的罕见元素;[0121]上半部分中的0表示不考虑来自罕见元素的风险;[0122]下半部分中:[0123]|...|:代表年度输入数据库dy中同时满足所包含的全部条件的故障记录的条数ti∈dy:表示相应故障记录ti必须位于该年度输入数据库dy中[0124]|m|:表示年度输入数据库dy中所有记录的条数,有|m|=m;[0125]dy(i,j)=ej,k表示故障记录ti里目标特征中的相应环境元素必须为ej,k;[0126]i=2,3,...,(m+1)代表年度输入数据库dy中的一条故障记录;[0127]j=2,3,...,(n+1)代表目标环境特征fj;n为环境特征数量。[0128]4.根据权利要求1所述的tfri权重计算模型的权重优化方法,其特征在于,[0129]结合raw和rrw综合衡量来自罕见元素的风险指数,(即)的表达式为[0130][0131]式中:ω1和ω2为raw和rrw的影响权重,可根据实际需求确定,w1=w2=0.5,ej,k为某一条记录;[0132]rraw、rrrw分别表示来自raw和rrw的故障风险,数学表达分别为[0133][0134][0135]式中:[0136]n+1:表示年度输入数据库dy中所存在的全部特征总数;[0137]j=2,3,...,(n+1)代表总计n+1个特征中的目标环境特征fj;[0138]k=1,2,...,l表示总计l个元素中的任意一个;[0139]l:表示特征fj中的全部元素总数;[0140]dy(i,j)≠ej,k:表示故障记录ti里目标特征中的相应环境元素必须不是ej,k。[0141]以上所述仅是本发明的优选实施方式,本发明的保护范围并不局限于此。在不脱离本发明原理的前提下,还可对相关技术做出改进或替换,这些改进和替换也应视为本发明的保护范围。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1