一种基于组合分类器的雷击输电线路故障概率分析方法与流程

文档序号:20920938发布日期:2020-05-29 14:08阅读:213来源:国知局
一种基于组合分类器的雷击输电线路故障概率分析方法与流程

本发明涉及输电线路雷击风险评估领域,特别是涉及一种基于多支持向量机组合分类器的雷击输电线路故障概率分析方法。



背景技术:

近年来,随着电网的快速发展和强对流天气的增加,雷害故障频繁发生。由于有效的侵入波和直击雷防护装置,变电站的雷击风险大大降低。目前,电网中雷击损害的风险主要集中在输电线路上,雷击导致传输线的两相闪络,同一塔的双回线路同时闪络,并且诸如同一传输信道上的多条线路的连续跳闸之类的严重故障显着增加。高电压,长距离,大容量输电线路的防雷工作面临新的挑战。

运行统计数据表明,雷击已经成为造成输电线路跳闸的主要原因。尽管目前已经采取了各种各样的防雷措施,但是雷击跳闸率仍然居高不下。线路避雷器等防雷措施的使用能够有效地降低雷击跳闸率,但是由于造价十分昂贵,不可能在输电线路上大规模使用。现有研究表明,不同地区、不同雷区等级、不同杆塔结构输电线路的防雷性能是存在差异的,因此如何更加有效地对输电线路杆塔雷击风险进行评估,从而针对风险等级最高的杆塔安装有效防雷措施将会极大降低输电线路的雷击跳闸率,同时也具有最好的经济性。

然而现有的防雷评估技术在实际的推广应用中还有以下问题尚需研究:

一是线路杆塔雷击风险受到雷电活动、地形、杆塔结构的众多因素的影响,且各个因素之间也存在着相互联系,因此雷击机理非常复杂,需要进一步研究输电线路杆塔在不同运行环境条件下的雷击风险,完善输电线路杆塔雷击风险评估方法;

二是传统防雷改造措施研究较少涉及防雷措施的有效性及其适用范围的研究。实际运行中,由于缺乏有效方法对防雷措施的有效性进行定量分析评价,造成不同防雷措施的有效性评估主观差异性较大,不同运行单位、不同运维人员针对同一种防雷措施可能给出完全相悖的有效性评价结果,不利于防雷改造措施的选择与防治效果的后评估,因此需要研究不同防雷措施的有效性定量评价方法及其适用范围,使得防雷措施的选择更加科学有效;

三是传统输电线路防雷性能评估技术所需参数较多,步骤复杂,且主要依靠人工录入和计算,对运维人员的专业水平和工作时间要求较高,不利于差异化防雷技术的推广应用,因此需要研究集合杆塔信息录入、雷电参数统计、雷击跳闸率计算和防治措施生成等功能于一体的专业防雷分析系统,具有操作简单,易用性强,便于线路运维人员掌握,开展输电线路差异化防雷评估与治理工作。

因此,可针对差异化防雷技术推广应用过程中存在的不足,研究雷击运行经验的量化分析方法,并深入挖掘历史雷击故障与杆塔运行环境特征参数的关联关系,从而建立基于历史雷击故障特征的输电线路雷击风险评估技术,考虑输电线路杆塔运行环境特征对雷击跳闸风险的影响,用以指导输电线路防雷改造具有十分重要的意义。



技术实现要素:

为了解决背景技术中的技术问题,本发明的目的是提供一种输电线路雷击故障的概率分析方法。建立了一种基于多支持向量机组合分类器的雷击故障特征分类模型,从雷击运行经验角度出发,研究杆塔雷击故障与所处地区落雷密度、海拔、坡度、高程差和相对高程差之间的关联关系;针对支持向量机参数寻优的问题,提出了一种自适应的遗传算法,有效地改善了常规遗传算法由于得到的惩罚参数c值过大而导致模型分类准确率较低的问题。

为了达到上述目的,本发明采用以下技术方案实现:

一种基于组合分类器的雷击输电线路故障概率分析方法,包括步骤:

步骤1:导入测试数据集(包括数据的特征属性和分类类别),随机生成模型的训练数据集和验证数据集;对训练的数据进行预处理,包括离散化处理和归一化处理等,归一化处理如式x→x'=(x-xmin)/(xmax-xmin),其中,xmax,xmin分别表示此列特征属性中的最大值和最小值,x'表示归一化后的特征属性;

步骤2:针对样本的不平衡分布进行处理。在分类问题中,训练数据不平衡指的是不同类别下的样本数量相差太大,实际上,训练数据不平衡在分类问题中是十分常见且合理的情况,当数据样本分布不平衡时,容易导致训练得到的模型的泛化能力较差。

步骤3:采用kmeans聚类分析划分训练子集数,优化各个子支持向量机的参数,分别对各个子训练模型的惩罚参数c和核函数参数g进行寻优,本步骤进一步包括子步骤:

3.1设置网格搜索法中c和g的搜索范围和搜索步距。其中,c的初始范围设为[2-5,25],g的初始范围设为[2-10,210],搜索步长设为2,相较传统网格搜索法中将搜索步距设为0.1的做法,大大节省了算法搜索的时间;

3.2利用步骤3.1中网格搜索法搜索出参数组(c,g)的初步最佳值,即(bestc,bestg),将该组参数值作为后续遗传算法的基准值;

3.3设定遗传算法中参数寻优的范围。其中,c的范围设为(0.5bestc,2bestc),g的范围设定为(0.5bestg,2bestg);

步骤4:对各个子模型的分类结果采用如下的评价指标进行比较;

步骤5:建立雷击故障概率预测模型,通过选取分类性能靠前的支持向量机分类器构建多支持向量机的组合分类器,综合不同参数训练下的支持向量机的输出,得到输电线路杆塔的雷击故障概率。

与现有技术相比,本发明的有益效果是:

本发明建立了一种基于多支持向量机组合分类器的雷击故障特征分类模型,从雷击运行经验角度出发,研究杆塔雷击故障与所处地区落雷密度、海拔、坡度、高程差和相对高程差之间的关联关系;针对支持向量机参数寻优的问题,提出了一种自适应的遗传算法,有效地改善了常规遗传算法由于得到的惩罚参数c值过大而导致模型分类准确率较低的问题。

附图说明

图1是自适应遗传算法流程图;

图2是多支持向量机组合分类器的建立示意图;

图3是多支持向量机组合分类器的建立流程图。

具体实施方式

以下结合附图对本发明提供的具体实施方式进行详细说明。

如图1-3所示,本发明输电线路雷击故障概率分析方法的具体步骤如下:

步骤1:在收集到模型训练需要的数据特征集合时,先对数据进行提取、过滤,去掉不真实或者不需要的数据,并根据训练算法的需要对数据进行预处理,如数据的归一化处理、连续特征属性的离散化处理等。对于输电线路杆塔雷击运行数据的特征属性,选取落雷密度、杆塔海拔、坡度、高程差和相对高程差这些特征。设特征为xi的所有样本数据的标准差为σ,均值为μ,则原始样本数据xij(特征为xi的第j个样本)经过标准差标准化后得到的新数据为

步骤2:对数据样本的不平衡分布进行处理。采用数据集划分的方式设计相应的大样本类别(称为ma类别)和小样本类别(称为mi类别)的比例,假设原始数据集中各类别的样本比例为ma:mi=p:q(p>>q),样本总数为m,则ma类别的样本数为mp/(p+q),mi类别的样本数为mq/(p+q),假若希望子集中的ma类别样本数和mi类别样本数的比为s:t,则mp/(p+q)个ma类样本应该被划分为pt/qs个子集,该划分的子集数即为kmeans聚类分析的聚类群数k;

步骤3:进行训练子集的划分,先对未曾发生过雷击跳闸故障的输电线路杆塔进行k-means聚类分析得到k个子集,再将发生过雷击跳闸故障的杆塔样本加入到上述k个子集中得到k个训练子集。优化支持向量机的参数,分别对k个训练模型的惩罚参数c和核函数参数g进行寻优,并对各个模型的分类结果进行比较。

其中,参数c和g采用如下方法进行寻优。首先,设置网格搜索法中c和g的搜索范围和搜索步距。其中,c的初始范围设为[2-5,25],g的初始范围设为[2-10,210],搜索步长设为2;其次,利用上述网格搜索法搜索出参数组(c,g)的初步最佳值,即(bestc,bestg),将该组参数值作为后续遗传算法的基准值;最后,设定遗传算法中参数寻优的范围,其中,c的范围设为(0.5bestc,2bestc),g的范围设定为(0.5bestg,2bestg),算法实现的流程见图1。

步骤4:采用分类准确率(accuracy)、查全率(recall)和查准率(precision)对各子模型的分类结果进行评价,从中选取综合性能最好的模型对整个杆塔样本集进行分类预测。分类准确率、查全率和查准率的计算公式如下:

步骤5:通过建立多svm组合分类器对整个样本集进行分类预测,根据每个svm模型中各个杆塔样本分别到相应分类超平面的距离得到每株杆塔归属类别的概率,建立基于多svm组合分类器的杆塔的雷击风险评估方法。

其中,各个杆塔样本所属类别的概率计算采用如下的方法。

式中,g(x)的大小表示待分类的样本到分类超平面的距离,其正负表示该样本与分类超平面的相对位置的方向;p(c1|x)和p(c0|x)分别表示待分类的样本被分类为1和0的概率,易知p(c1|x)+p(c0|x)=1。

svm输出的概率反映了待分类样本属于不同类别的可能性,能够有效地针对待分类样本与最优分类超平面的距离进行归一化处理,从而针对输出结果进行可信度评价:

r=max{p(c1|x),p(c0|x)}(4)

对于二分类问题,可信度r在50%—100%之间。

利用多个svm训练得到的模型组合成一个多svm分类器的过程见图2。

图2中,xi(i=1,2,...,n)为输电线路杆塔的特征输入量;yi(i=1,2,...,m)(yi=1表示输电线路雷击风险为“1”,yi=0表示输电线路雷击风险为“0”)为利用不同参数进行svm训练后分别得到的对于输电线路雷击风险的预测值;z表示多svm分类器的输出结果。

即当且仅当多个svm的输出结果均为1时,多svm分类器对于输电线路杆塔雷击风险的评估结果才为“1”,此时,需要针对该杆塔安装有效的防雷措施;否则,多svm分类器的输出结果为0,表示输电线路杆塔的雷击风险为“0”。

实施例

基于多支持向量机组合分类器的雷击输电线路故障概率分析方法的有效性校验

数据:湖北省实际的500kv架空输电线路杆塔雷击运行数据

对于输电线路杆塔雷击运行数据的特征属性,选取落雷密度、杆塔海拔、坡度、高程差和相对高程差这些特征,由于这些特征属性的数值较多,需要先进行离散化处理。以落雷密度的离散化处理结果为例,根据对湖北省500kv输电线路雷击运行情况中落雷密度的分析,可将输电线路周围的雷区等级划分为少雷区(a级),中雷区(b1和b2级),多雷区(c1和c2级)和强雷区(d1和d2级),特征离散化后的标记情况见表1。

表1落雷密度的离散化

从湖北省500kv杆塔雷击运行数据来看,曾发生过雷击跳闸故障的杆塔样本和未曾发生过雷击跳闸故障的样本存在严重的分布不平衡性,其中未曾发生过雷击跳闸故障的杆塔数(称为ma类别)和发生过雷击跳闸故障的杆塔数(称为mi类别)的比例约为256:1,因此必须对数据的不平衡分布进行处理。根据发明内容中步骤6介绍的对样本不平衡分布的处理方式,采用数据集划分的方式设计相应的ma和mi类别的比例。在本例中,样本总数m=22108,原始数据集中各类别样本比例为ma:mi≈250:1,假设期望的子集样本分布为s:t≈10:1,则22022个ma样本应该被划分为(250×1)/(10×1)=25个子集,该划分的子集数就是k-means的聚类群数k。

表2训练样本25个子集的分布

当ma类别样本划分子集数确定后,即需要将原始数据集中未曾发生过雷击跳闸故障的杆塔样本划分成25个子集,子集的划分采用k-means聚类分析技术,将22022个未曾发生过雷击跳闸故障的样本根据聚类中心划分成相应的子集。ma类别的样本子集划分完成后,将mi类别的样本(即曾经发生过雷击跳闸故障的杆塔样本)分别加到上述各个子集中形成25个训练子集,具体的样本分布见表2。

在对各个训练子集得到的模型进行测试时,采用从另外24个子集中随机选取一个子集作为测试样本集的方法对模型的分类性能进行测试。利用libsvm软件包构造分类器,从而得到各个子集上训练模型的最佳参数组(c,g)和模型的分类性能。通过选择分类性能最好的模型对整个杆塔样本集进行分类训练,得到在整个杆塔样本集上的分类结果见表3。

根据图2的多svm组合分类器的构建流程,得到多svm组合分类器的分类性能见表4。

对比分析表3和表4可知,采用多svm分类器可以在保证整个模型的分类准确率和查全率不降低的情况下,将分类的查准率由68.80%提高到78.18%,提高了输电线路雷击风险评估的可靠性和经济性。

表3单一svm在整个样本集上的分类性能

表4多svm组合分类器的分类性能

上述分析实例验证了基于多支持向量机组合分类器的雷击输电线路故障概率分析方法的有效性,通过对输电线路杆塔的特征属性数据进行离散化和标准化处理,利用k-means聚类分析划分样本集的方法,从而建立基于多svm组合分类器的输电线路雷击风险评估模型,从而提高对输电线路雷击风险评估的可靠性和经济性。

以上实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于上述的实施例。上述实施例中所用方法如无特别说明均为常规方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1