基于改进随机森林算法的电缆局放故障识别方法、系统及介质与流程

文档序号:18407798发布日期:2019-08-10 00:34阅读:192来源:国知局
基于改进随机森林算法的电缆局放故障识别方法、系统及介质与流程

本发明涉及电缆老化检测领域,具体涉及一种基于改进随机森林算法的电缆局放故障识别方法、系统及介质。



背景技术:

电能在现实生活中起到了不可缺少的作用,而电缆作为传输电能重要部件,已经得到了广泛的应用,特别是在城市配电网中占据了主要的地位。电缆发生局部放电的局部放电量和其当前的绝缘状况有着密切的关系,因此评价电缆绝缘状况的最有效、最直观的方式就是测量电缆的局部放电量。因此,完善运行中电缆局部放电的诊断方法,对提高电力系统的可靠性和安全性具有重要意义。

电缆产生局部放电时会伴随光、热、电磁波、电脉冲等物理现象,这些物理现象就是电缆局部放电检测的依据。从电缆产生的局部放电中虽然可以了解电缆的绝缘状况,但是要判别电缆局部放电故障的缺陷类型,需要对局部放电信号进行模式识别。目前局部放电模式识别的主要方法是首先根据电缆几种常见的局部放电类型,设置对应类型的试验,并进行大量的试验,然后再从每组类型的试验中提取特征数据,并对得到的特征数据建立图谱库,最后采用智能算法对得到的几类图谱数据进行训练,最终达到分类识别的效果。在分类识别的过程中最常采用的智能算法包括基于距离的模式随机森林分类器、支持向量机、神经网络以及模糊随机森林分类器等。在大量的训练数据和训练时间的前提下,这些智能算法都能取得不错的效果,但局部放电模式识别在准确率和时间上往往不能兼得。



技术实现要素:

本发明要解决的技术问题:针对现有技术的上述问题,提供一种能够在保证识别准确性的同时也提高了识别的效率、实现识别准确性和效率兼备的基于改进随机森林算法的电缆局放故障识别方法、系统及介质。

为了解决上述技术问题,本发明采用的技术方案为:

一种基于改进随机森林算法的电缆局放故障识别方法,实施步骤包括:

1)采集电缆的局部放电信号;

2)提取局部放电信号的特征数据;

3)将提取得到的特征数据输入预先构建并完成训练的分类器,得到所述电缆局部放电信号对应的电缆局放故障类型,所述分类器为基于改进随机森林算法的分类器,所述改进随机森林算法运用特征构建法挖掘高维属性数据及基于adaboost算法的数据权重修正思想指导属性子集的选取,且所述分类器被预先训练建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。

优选地,步骤2)中的特征数据包括24个高维属性的至少一种,24个高维属性包括三者的不对称度asy以及互相关系数cc,的偏斜度sk、陡峭度ku、峰值peak;其中,表示平均放电量相位分布二维谱图,表示最大放电量相位分布二维谱图,表示放电次数相位分布谱图;表示正半周平均放电量相位分布二维谱图,表示负半周平均放电量相位分布二维谱图,表示正半周最大放电量相位分布二维谱图,表示负半周最大放电量相位分布二维谱图,表示正半周放电次数相位分布谱图,表示负半周放电次数相位分布谱图。

优选地,所述电缆局放故障类型包括内部放电、沿面放电、电晕放电。

优选地,步骤3)之前还包括训练分类器的步骤,详细步骤包括:

s1)分别针对各种电缆局放故障类型采集电缆局部放电信号并提取特征数据,分别选取一部分作为训练集,另一部分作为测试集;对训练集采用bootstrap方法进行重采样,随机产生训练集,其中训练集的属性总数为m,属性总数为分别判断特征数据所对应的评判依据总数,子属性的个数为n;

s2)采用adaboost算法的数据集权重修正思想指导属性子集的选取,对属性子集进行优化处理,所述属性子集即是分类过程中所用特征参数所对应的评判依据的集合;在上述的训练集的基础上进行属性子集q的选择,训练集是分类过程中所用的特征参数,子属性是特征参数分别对应的评判依据;且通过上一个子决策树的ci中的故障数据直接修整属性子集q(i+1)被选的概率,子决策树是对每组数据从分类开始到结束的形象化描述,根据修整后的概率值,按照常规随机方法完成属性子集的选取;

s3)利用构建出的训练集及对应的属性子集生成对应的决策树,以信息增益为划分原则,当信息增益取得最大时的分裂方式就是该类决策树的最佳分裂方式,并以该方式对对应的节点进行分裂;且每棵树都完整成长,而不进行剪枝;

s4)利用决策树对测试集进行测试,得到对应的类别,将决策树中输出最多的类别作为该测试集所属的类别,从而建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。

本发明还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括计算机设备,该计算机设备被编程或配置以执行本发明前述基于改进随机森林算法的电缆局放故障识别方法的步骤。

本发明还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括计算机设备,该计算机设备的存储介质上存储有被编程或配置以执行本发明前述基于改进随机森林算法的电缆局放故障识别方法的计算机程序。

本发明还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括相互连接的局放信号采集设备和上位机,该上位机被编程或配置以执行本发明前述基于改进随机森林算法的电缆局放故障识别方法的步骤。

本发明还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括相互连接的局放信号采集设备和上位机,该上位机的存储介质上存储有被编程或配置以执行本发明前述基于改进随机森林算法的电缆局放故障识别方法的计算机程序。

本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行本发明前述基于改进随机森林算法的电缆局放故障识别方法的计算机程序。

本发明还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括:

信号采集程序单元,用于采集电缆的局部放电信号;

特征提取程序单元,用于提取局部放电信号的特征数据;

分类识别程序单元,用于将提取得到的特征数据输入预先构建并完成训练的分类器,得到所述电缆局部放电信号对应的电缆局放故障类型,所述分类器为基于改进随机森林算法的分类器,所述改进随机森林算法运用特征构建法挖掘高维属性数据及基于adaboost算法的数据权重修正思想指导属性子集的选取,且所述分类器被预先训练建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。

和现有技术性,本发明具有下述优点:本发明将提取得到的特征数据输入预先构建并完成训练的分类器,得到电缆局部放电信号对应的电缆局放故障类型,分类器为基于改进随机森林算法的分类器,改进随机森林算法运用特征构建法挖掘高维属性数据及基于adaboost算法的数据权重修正思想指导属性子集的选取,且分类器被预先训练建立了局部放电信号的特征、电缆局放故障类型之间的映射关系,分类器利用改进随机森林算法对电缆局部放电故障类型进行识别,通过运用特征构建法挖掘高维属性数据,以及基于adaboost算法的数据集权重修正思想,指导属性子集的选取,对电缆局部放电故障类型的识别,保证正确率的情况下大大缩短了时间,提高了识别效率。

附图说明

图1为本发明实施例方法的基本流程示意图。

图2为本发明实施例中300组测试数据的电缆局部放电故障类型识别将分布图。

具体实施方式

如图1所示,本实施例基于改进随机森林算法的电缆局放故障识别方法的实施步骤包括:

1)采集电缆的局部放电信号;

2)提取局部放电信号的特征数据;

3)将提取得到的特征数据输入预先构建并完成训练的分类器,得到电缆局部放电信号对应的电缆局放故障类型,分类器为基于改进随机森林算法的分类器,改进随机森林算法运用特征构建法挖掘高维属性数据及基于adaboost算法的数据权重修正思想指导属性子集的选取,且分类器被预先训练建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。

本实施例中,步骤2)中的特征数据包括24个高维属性,参见表1:

如表1所示,上述24个高维属性包括三者的不对称度asy以及互相关系数cc,的偏斜度sk、陡峭度ku、峰值peak;其中,表示平均放电量相位分布二维谱图,表示最大放电量相位分布二维谱图,表示放电次数相位分布谱图;表示正半周平均放电量相位分布二维谱图,表示负半周平均放电量相位分布二维谱图,表示正半周最大放电量相位分布二维谱图,表示负半周最大放电量相位分布二维谱图,表示正半周放电次数相位分布谱图,表示负半周放电次数相位分布谱图。此外,也可以根据需要选择前述24个属性中的一种或多种来构建特征数据,只是从准确度而言,采用的属性越多,则构建的特征数据完备性越好,电缆局放故障识别结果越准确。步骤3)中的运用特征构建法挖掘高维属性数据具体是指以基本局部放电波形为对象,构建出相应的特征数据,即表1所示的24个高维属性。

本实施例中,电缆局放故障类型包括内部放电、沿面放电、电晕放电。

本实施例中,步骤3)之前还包括训练分类器的步骤,详细步骤包括:

s1)分别针对各种电缆局放故障类型采集电缆局部放电信号并提取特征数据,分别选取一部分作为训练集,另一部分作为测试集;对训练集采用bootstrap方法进行重采样,随机产生训练集,其中训练集的属性总数为m,属性总数为分别判断特征数据所对应的评判依据总数,子属性的个数为n;

s2)采用adaboost算法的数据集权重修正思想指导属性子集的选取,对属性子集进行优化处理,属性子集即是分类过程中所用特征参数所对应的评判依据的集合;在上述的训练集的基础上进行属性子集q的选择,训练集是分类过程中所用的特征参数,子属性是特征参数分别对应的评判依据;且通过上一个子决策树的ci中的故障数据直接修整属性子集q(i+1)被选的概率,子决策树是对每组数据从分类开始到结束的形象化描述,根据修整后的概率值,按照常规随机方法完成属性子集的选取;

本实施例中,通过电缆内部放电、沿面放电、电晕放电三种类型的局部放电试验,在大量试验后,对每组试验分别提取600组具有24个属性的特征数据,得到1800组特征数据后,随机选取1500组特征数据作为训练数据,剩下300组数据作为测试集。创建随机森林分类器:运用bootstrap方法对训练数据重采样,得到1500个训练集,s1,s2,s3,…,s1500,其属性总数为m,子属性的个数为n。

在上述的1500个训练集的基础上进行属性子集q的选择,上一个子决策树的ci中的故障数据直接影响一个属性子集q(i+1)的被选概率,属性子集中各属性为qi,j为第j个属性qj的被选概率值,其中j=1,2,3,…,m;。假设ci子决策树中训练子集中诊断错误的数据集合为mi,当训练子集si+1中属于集合mi中的数据个数为ni时,则下一个属性子集qi+1中各属性的被选概率p发生变化。本实施例中,通过上一个子决策树的ci中的故障数据直接修整属性子集q(i+1)被选的概率p的计算函数表达式为:

上式中,m为训练集的属性总数,n为子属性的个数,k为中空间变量,计算方式如下:

上式中,ni为下一个训练子集si+1中属于上一个诊断故障集合mi中的数据个数,mi为ci子决策树中训练子集中诊断错误的数据集合;qi,j为第j个属性qj的被选概率值,其中j=1,2,3,…,m;pj为第j个属性qj的被选概率值;m为属性总数;n为子属性集中属性个数;qi为上一个子决策树的属性集;α为决策树训练的准确率阈值。

s3)利用构建出的训练集及对应的属性子集生成对应的决策树(c1,c2,c3,…,c1500),以信息增益为划分原则,当信息增益取得最大时的分裂方式就是该类决策树的最佳分裂方式,并以该方式对对应的节点进行分裂;且每棵树都完整成长,而不进行剪枝;

本实施例中,利用每个训练集生成对应的决策树c1、c2、c3、…、c1500,在每个非叶子节点上选择属性前,从24个属性中随机抽取m个属性作为当前节点的分裂属性集,m<24,并以这m个属性中最好的分裂方式对该节点进行分裂,每棵树都完整成长,而不进行剪枝。

以信息增益为划分原则,其具体步骤如下:

将m个数据划分成n类,每一类的比例为pi=第i类的个数/m;

设d为样本训练集,则样本训练集d的熵inf(d)为:

上式中,pi为将m个数据划分成n类得到的第i类的比例,n为数据划分类数。

假设按照属性a划分样本训练集d中的样本,属性a将样本训练集d划分为v个不同的类,划分之后样本训练集d的熵infa(d)为:

上式中,dj为划分的v类中第j类的个数,v为属性a将样本训练集d划分的分类梳理,info(dj)为dj的熵,d为样本训练集d。

由此可知,信息增益gain(a)为:

gain(a)=inf(d)-infa(d)

上式中,inf(d)为样本训练集d的熵,infa(d)为按照属性a划分样本训练集d中的样本后本训练集d的熵,两者相减即为信息增益gain(a)。

s4)利用决策树对测试集进行测试,得到对应的类别,将决策树中输出最多的类别作为该测试集所属的类别,从而建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。本实施例中,将单独的等待测试的数据作为测试集样本x,利用每个决策树进行测试,利用随机森林法建立的1500个决策树进行测试,得到对应的类别c1(x)、c2(x)、c3(x)、…、c1500(x),采用投票的方法,将1500个决策树中输出最多的类别作为测试集样本x所属的类别,从而建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。

图2为本发明实施例中300组测试数据的电缆局部放电故障类型识别将分布图,参见图2可知,该300组测试数据的识别结果中,内部放电(气隙放电)、沿面放电、电晕放电三种决策树类别中,内部放电(气隙放电)决策树颗数最多,因此识别出最终的电缆局放故障类型为内部放电(气隙放电)。采用本实施例中的分类器对变压器局部放电故障模式识别,能够在保证准确率的同时,大大缩短了时间。

此外,本实施例还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括计算机设备,该计算机设备被编程或配置以执行本实施例前述基于改进随机森林算法的电缆局放故障识别方法的步骤。此外,本实施例还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括计算机设备,该计算机设备的存储介质上存储有被编程或配置以执行本实施例前述基于改进随机森林算法的电缆局放故障识别方法的计算机程序。此外,本实施例还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括相互连接的局放信号采集设备和上位机,该上位机被编程或配置以执行本实施例前述基于改进随机森林算法的电缆局放故障识别方法的步骤。此外,本实施例还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括相互连接的局放信号采集设备和上位机,该上位机的存储介质上存储有被编程或配置以执行本实施例前述基于改进随机森林算法的电缆局放故障识别方法的计算机程序。此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行本实施例前述基于改进随机森林算法的电缆局放故障识别方法的计算机程序。此外,本实施例还提供一种基于改进随机森林算法的电缆缺陷识别系统,包括:

信号采集程序单元,用于采集电缆的局部放电信号;

特征提取程序单元,用于提取局部放电信号的特征数据;

分类识别程序单元,用于将提取得到的特征数据输入预先构建并完成训练的分类器,得到所述电缆局部放电信号对应的电缆局放故障类型,所述分类器为基于改进随机森林算法的分类器,所述改进随机森林算法运用特征构建法挖掘高维属性数据及基于adaboost算法的数据权重修正思想指导属性子集的选取,且所述分类器被预先训练建立了局部放电信号的特征、电缆局放故障类型之间的映射关系。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1