一种基于决策树算法的故障诊断方法与流程

文档序号:15934270发布日期:2018-11-14 02:08阅读:3055来源:国知局

本发明涉及故障诊断技术领域,尤其涉及一种基于决策树算法的故障诊断方法。

背景技术

六氟化硫(sf6)气体绝缘电力设备凭借其可靠性高,占地面积小等优点,广泛地应用于高压、超高压和特高压领域,在电网中有非常重要的地位,其运行状态直接关系到电力系统的稳定性,在sf6气体绝缘电力设备的故障中,绝缘故障因其发生频率高、破坏性大而最为引人关注,绝缘故障如果不能被及时识别,很可能会发生连锁反应,导致事故范围扩大,造成巨大经济损失,通常,绝缘故障是由早期的潜伏性绝缘隐患发展而来,因此,早期潜伏性绝缘故障的监测与诊断技术的研究具有十分重要的理论意义和实用价值。

基于决策树原理构造的模式识别器是一种内部结构明确的识别器,通过决策树分类可以清楚的看到识别器内部具体构造及模式识别的整个过程,更好的理解输入量与输出量之间的关系,其结构和使用简单,易于工业现场使用者掌握,通过基于决策树算法进行绝缘故障类型识别,可以有效提高识别率,识别效果好。



技术实现要素:

鉴以此,本发明的目的在于提供一种基于决策树算法的故障诊断方法。

一种基于决策树算法的故障诊断方法,包括以下步骤:

s1、获取若干组六氟化硫分解组分数据组成的样本集s,并创建节点;

s2、依次判断每个样本是否为空或样本数少于设定值;

s3、判断节点中样本是否同属于一个类别;

s4、计算各个候选属性的信息增益率,获取信息增益率最大的属性a;

s5、判断属性a是否为连续量,并找出属性a的分割阀值;

s6、根据属性a生成新的决策树节点;

s7、计算估计错分率并对决策树进行剪枝;

s8、生成决策树,根据决策树对绝缘缺陷故障进行识别。

进一步的,s2中,当判断样本不为空或样本数不少于设定值时,继续判断节点中样本是否只有一个类别,否则将该样本作为叶节点并命名为相应类别。

进一步的,s3中,如果节点中样本只有一个类别,则以该类别命名该节点。

进一步的,s4中,所述信息增益率为信息增益值对分割信息量的比值,设s是s个数据样本的集合,这些样本属于m个不同的类cj(j=1,k,m),用a对s进行划分的信息增益率为:

其中,pj为任意样本属于cj的概率。

进一步的,s5中,若a为连续型属性,则首先将样本集s的样本根据属性a的值从小到大进行排序,排序后根据属性a的取值序列按顺序逐一取相邻值的平均值作为分割点,分别计算每个分割点的信息增益率,选择信息增益率最大的分割点作为局部阀值,然后在所述取值序列中找到最接近但不超过局部阀值的取值作为属性a的分割阀值。

进一步的,s7中,如果分支后子树的根节点估计错分率比分支前叶节点的估计错分率大,则进行修剪,否则不修剪。

进一步的,叶节点的估计错分率的计算式为:

其中f为通常意义上的错分率,f=e/n,其中e为叶节点中错分的样本个数,n为当前叶子样本的总数,z为置信极限,子树根节点的估计错分率为各叶节点估计错分率的加权平均和,即:

其中k为分支数量,ni为第i个分支中所分到的样本的数量。

与现有技术相比,本发明的有益效果是:

本发明所提供的一种基于决策树算法的故障诊断方法,实现简单、学习能力较强,通过将连续属性的值域分割为离散的区间集合,可以对连续属性的信号进行处理,对绝缘缺陷取得了较为良好的识别效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例的决策树构造流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所列举实施例只用于解释本发明,并非用于限定本发明的范围。

参照图1,本发明提供一种基于决策树算法的故障诊断方法,对局部放电进行识别以诊断绝缘故障,所述故障诊断方法通过采用c4.5算法生成决策树,c4.5算法基于id3算法进行改进,在保留id3算法的优点的基础上通过一系列改进大大提高了算法的性能,所述方法包括以下步骤:

s1、获取若干组六氟化硫分解组分数据组成的样本集s,并创建节点;

s2、依次判断每个样本是否为空或样本数少于设定值;

s3、判断节点中样本是否同属于一个类别;

s4、计算各个候选属性的信息增益率,获取信息增益率最大的属性a;

s5、判断属性a是否为连续量,并找出属性a的分割阀值;

s6、根据属性a生成新的决策树节点;

s7、计算估计错分率并对决策树进行剪枝;

s8、生成决策树,根据决策树对绝缘缺陷故障进行识别。

具体的,首先,收集若干组六氟化硫分解组分数据组成样本集s,并创建节点,随后判断样本集s中的样本是否为空或者样本数量少于设定值。

当样本集s中的样本不为空或样本数量多于设定值时,继续判断节点中的样本是否仅有一个类别。当节点中的样本仅有一个类别时,将该节点作为叶节点并命名为相应类别;当节点中的样本不只有一个类别时,计算样本各属性的信息增益率,获取信息增益率最大的属性作为测试属性,并定义为属性a。

具体的,所述故障诊断方法采取基于信息增益率的方法来选择测试属性,信息增益率等于信息增益值对分割信息量的比值,设s是s个数据样本的集合,这些样本属于m个不同的类cj(j=1,k,m),用属性a对样本集s进行划分的信息增益率为:

其中pj为任意样本属于cj的概率。

随后判断属性a是否为连续型属性。当属性a为连续型属性时,计算并找出该属性的分割阀值,将样本集划分为若干子样本集,对每个子样本集进行同样的操作直至不可继续分割或达到停止条件为止。

具体的,c4.5算法可以对连续属性的信号进行处理,其基本思想是将连续属性的值域分割为离散的区间集合。如果属性a是连续型属性,首先将样本集s中的样本根据属性a的值从小到大进行排序。假设样本集s中a有v个不同的取值,则排好序后属性a的取值序列为{a1,a2,k,av},随后按顺序逐一取相邻值的平均值作为分割点,则共有v-1个分割点,分别计算每个分割点的信息增益率,选择具有最大信息增益率的分割点作为局部阀值,然后在序列{a1,a2,k,av}中找到最接近但又不超过局部阀值的取值vmax作为属性a的分割阀值。

当样本集s中的样本为空或样本数量少于设定值时,将节点作为叶节点并命名为相应类别,随后对决策树进行剪枝操作。剪枝操作是指用一个叶节点替换一整棵子树,基本的决策树构造没有考虑到噪声的情况,生成的决策树会完全与训练例子拟合,而在噪声情况下,对训练数据的完全拟合会使算法对现实数据的分类预测性能下降,通过剪枝能够对噪声进行一定程度的克服,同时能够简化决策树,使其更易于理解。剪枝的修剪原则是,如果分支后子树的根节点估计错分率比分支前叶节点的估计错分率大,则进行修剪,否则不修剪。叶节点的估计错分率的计算式为:

其中f为通常意义上的错分率,f=e/n,其中e为叶节点中错分的样本个数,n为当前叶子样本的总数,z为置信极限,子树根节点的估计错分率为各叶节点估计错分率的加权平均和,即:

其中k为分支数量,ni为第i个分支中所分到的样本的数量。

完成剪枝后,生成决策树,相关人员可以借助决策树对绝缘故障类型进行识别,通过本发明所提供的基于决策树算法的故障诊断方法,可对连续属性的信号进行处理,对绝缘故障类型的识别效果更好,识别率更高。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1