基于改进决策树的电力通信设备状态的预测方法与流程

文档序号:19376157发布日期:2019-12-10 23:53阅读:264来源:国知局
基于改进决策树的电力通信设备状态的预测方法与流程

本发明涉及电力设备的状态分析技术领域,具体涉及基于改进决策树的电力通信设备状态的预测方法。



背景技术:

随着我国智能电网规模的持续扩展,作为承载经营管理和生产调度业务的电力通信网络,其通信设备数量和网络覆盖范围都得到了快速增长,电力通信作为电网综合服务基础支撑的作用愈发凸显。因此,进一步提升电力通信网络的运维水平和保障质量,对于电力通信网以及智能电网的安全运行至关重要;当前,电力通信网络的运维主要还是针对通信设备的实时告警信息进行故障的事后处置,这种被动响应式的运维模式已远远无法满足通信网络在线、智能的创新发展需要,难以有效支撑和促进智能电网的蓬勃发展。为提高通信生产运行维护效率,实现电力通信网络的精益化管理,有必要借助信息化手段,综合历史缺陷与检修、当前性能值与状态值等海量历史和实时数据,利用数据挖掘技术实现基于运行状态的通信设备寿命预测分析,为通信网络提供主动维护技术手段,解决运维人员短缺与网络覆盖范围和设备数量不断扩大的问题。

通过多种数据挖掘技术进行设备运行状态的预测分析已成为网络运维研究的发展趋势。决策树学习算法具有分类速度快、算法实现简单等优点,已成为最广泛的状态预测算法之一。然而在实际应用场景中,经典决策树学习算法存在着诸如内在多值偏向、计算效率低下等不足之处,需要进一步改进决策树学习算法,使其能够更适应电力通信网络的实际应用要求。

经典的决策树学习算法作为数据挖掘分支中最常用的一种经典算法,决策树学习算法通常用于对未知数据进行分类和预测。自20世纪60年代以来,决策树学习在规则提取、数据分类、预测分析等领域有着广泛应用,特别是j.r.quinlan在引入基于香农的信息论中熵的概念后,提出的id3(iterativedichotomiser3)算法,因其简洁、高效的决策选择过程使得决策树学习算法在不同新兴应用领域得到了持续应用及巨大发展。

在id3决策树算法中不需要重复遍历已选的测试属性,而是采用了贪婪算法和深度优先策略自顶向下的搜索遍历所有的测试属性,从而构造出整个决策树。其核心思想是在决策树的各层级节点选择上,以最大信息熵降作为当前节点测试属性的划分标准,即当节点上如果有尚未被划分的、具有最高信息增益的测试属性,则将其作为划分标准。通过不断的搜索遍历,直到获取能够完美分类训练样例的决策树。其主要算法如下:

设样本数据集合s,其可划分为不同类别ci(i=1,2,...,n),其中si为类别ci的样本数量,则集合s划分为n个类别对应的信息熵为:

式(1)中,pi表示集合s中属于第i类别ci的概率,即

假定测试属性a中所有互斥值的集合为xa,sv为样本数据集合s中由测试属性a为v的样本子集,即sv={s∈s|as=v},在选择测试属性a后的每一个分枝节点上,对该节点的样本集sv分类的熵为h(sv)。选择测试属性a导致的信息熵定义为每个子集sv熵的加权平均值,权值为属于sv的样本占原始样本s的比例由于已知测试属性a而得到的信息熵为:

式(2)中,h(sv)为样本子集sv的信息熵。

测试属性a对于数据集合s的信息增益gain(s,v)为:

gain(s,v)=h(s)-h(s,a)(3)

gain(s,v)是指已知测试属性a值后所导致的信息熵期望值的减少量。若gain(s,v)值越大,则说明测试属性a的选择对样本数据集的分类可提供的信息量越大,其分类效果也会越好。

与其它统计模型、神经网络、遗传算法等分类算法相比,id3决策树学习算法以实例为基础进行归纳学习,具有实现简单直观、分类速度快、平均深度最小等特点。但同时也存在着生成树效率较低、内在多值偏置、只能检验单一属性等不足。在电力通信网络中,不同通信设备之间的运行状态值可能会存在着强相关性或弱相关性,同时网络拓扑结构比较复杂。

因此,针对电力通信网络实际的运维管理需要,有必要开发一种基于改进决策树的电力通信设备状态的预测方法;通过对传统算法进行改进,将其运用到电力通信设备的状态预测分析中,从而为电力通信网络的运行维护提供一种事前状态的预测方法。



技术实现要素:

本发明要解决的技术问题是,提供一种基于改进决策树的电力通信设备状态的预测方法,对可能存在的故障隐患进行预测与判断,最终提供给运维人员进行事前检修。

为解决上述技术问题,本发明采用的技术方案是:该基于改进决策树的电力通信设备状态的预测方法,具体包括以下步骤:

(1)收集的电力通信设备的固有数据并将收集的固有数据存入数据库;同时采集所述电力通信设备的实时监测信息;

(2)对所述步骤(1)中收集的固有数据进行数据挖掘与分析,构建出多变量数的预测分析决策树,获得所述电力通信设备与监测点的关联参数及相关值和所述电力通信设备的异常特征值;

(3)通过所述电力通信设备与监测点的关联参数及相关值和所述电力通信设备的异常特征值结合所述电力通信设备的实时监测信息对所述电力通信设备进行运行状态分析,从而得出所述电力通信设备的故障预测与检修指导。

采用上述技术方案,通过对电力通信设备的历史运行与维护信息进行抽取,采用改进的多变量数的预测分析决策树挖掘设备异常情况下的特征值,分析设备的关联参数值以及它们之间的相关性,结合当前实时监测采集到的设备运行数据,对可能存在的故障隐患进行预测与判断,最终提供给运维人员进行事前检修。

作为本发明的优选技术方案,所述步骤(1)中收集的电力通信设备的固有数据包括设备的履历信息、设备检修信息和设备缺陷信息。

作为本发明的优选技术方案,所述步骤(2)对所述步骤(1)中收集的固有数据进行数据挖掘与分析构建出多变量数的预测分析决策树的具体方法为:

s21定义一个决策表信息系统s=(u,r,v,f),其中论域u为一个非空有限对象的集合,r为所有属性集合;所述r分为测试属性集a和决策属性集d;

s22从测试属性集a相对决策属性集d的核开始,逐步构建出完整的多变量数的预测分析决策树。

作为本发明的优选技术方案,所述步骤s21中的所述r与所述测试属性集a和决策属性集d的关系为:v=∪r∈r(vr),vr是属性r的值域,信息函数f:u×r→v。通过对id3决策树算法深入研究的基础上,借助粗糙集理论对决策表属性进行约简、求核、泛化等处理,进而构造出简洁、高效的多变量决策树,从而可以有效避免id3算法决策树存在的先天缺陷,有效降低了计算复杂度,提高了预测分析效率,具有较大的实用价值和应用前景。作为数据挖掘分支中最常用的一种经典算法,决策树学习算法通常用于对未知数据进行分类和预测。自20世纪60年代以来,决策树学习在规则提取、数据分类、预测分析等领域有着广泛应用,特别是j.r.quinlan在引入基于香农的信息论中熵的概念后,提出的id3(iterativedichotomiser3)算法,因其简洁、高效的决策选择过程使得决策树学习算法在不同新兴应用领域得到了持续应用及巨大发展。

作为本发明的优选技术方案,所述步骤s22的具体方法为:

s221根据样本数据集构造出决策表;

s222计算测试属性集a相对决策属性集d的核,记为cared={a1,a2,…,ak,},若则转到步骤s223,否则到步骤s224;

s223采用id3决策树算法,选择一个最佳属性,以此作为该节点的检验属性;

s224给出合取范式形式p=a1∧a2∧…∧ak,计算p相对决策属性d的泛化gend(p),并将其作为决策树根节点的检验属性;

s225在当前样本数据集中计算剩下的条件属性集合a/cared(a)a中每个属性对决策属性集d的粗糙度,从中选择出粗糙度最小的属性作为该结点检验属性的最优解;其粗糙度计算公式如下:

其中为粗糙度;

αci(x)为近似精度;

为x的下近似集合;

为x的上近似集合:

bncix为边界区,表示集合x的上近似集合和下近似集合的差,在知道r的判断下,无法确定是否属于x的对象所组成的集合。

采用上述技术方案,利用粗糙度计算方法对传统的id3决策树学习算法进行改进,将原来信息熵降替换成最小粗糙度来确定分类的检验属性,有效增强了不同属性之间的结构关联,改善了生成的决策树结构。因此,在电力通信设备运行状态属性取值之间关联度较强,无冲突数据的状态预测分析时,运用改进的决策树算法可以得到更优化的解,且计算工作量相对较小。

作为本发明的优选技术方案,所述多变量数的预测分析决策树中的测试属性集包括误码异常、光功率异常、飘移异常、光纤异常、偏置电流异常、抖动电流异常、机房温度异常和机房供电异常。

附图说明

下面结合附图和本发明的实施方式进一步详细说明:

图1是基于改进决策树的电力通信设备状态的预测方法的流程示意图;

图2是基于改进决策树的电力通信设备状态的预测方法的基于改进的决策树的结构图。

具体实施方式

如图1所示,该基于改进决策树的电力通信设备状态的预测方法,具体包括以下步骤:具体包括以下步骤:

(1)收集的电力通信设备的固有数据并将收集的固有数据存入数据库;同时采集所述电力通信设备的实时监测信息;所述步骤(1)中收集的电力通信设备的固有数据包括设备的履历信息、设备检修信息和设备缺陷信息;

(2)对所述步骤(1)中收集的固有数据进行数据挖掘与分析,构建出多变量数的预测分析决策树,获得所述电力通信设备与监测点的关联参数及相关值和所述电力通信设备的异常特征值;

所述步骤(2)对所述步骤(1)中收集的固有数据进行数据挖掘与分析构建出多变量数的预测分析决策树的具体方法为:

s21定义一个决策表信息系统s=(u,r,v,f),其中论域u为一个非空有限对象的集合,r为所有属性集合;所述r分为测试属性集a和决策属性集d;

s22从测试属性集a相对决策属性集d的核开始,逐步构建出完整的多变量数的预测分析决策树,所述步骤s21中的所述r与所述测试属性集a和决策属性集d的关系为:v=ur∈r(vr),vr是属性r的值域,信息函数f:u×r→v;

所述步骤s22的具体方法为:

s221根据样本数据集构造出决策表;

s222计算测试属性集a相对决策属性集d的核,记为cared={a1,a2,…,ak,},若则转到步骤s223,否则到步骤s224;

s223采用id3决策树算法,选择一个最佳属性,以此作为该节点的检验属性;

s224给出合取范式形式p=a1∧a2∧…∧ak,计算p相对决策属性d的泛化gend(p),并将其作为决策树根节点的检验属性;

s225在当前样本数据集中计算剩下的条件属性集合a/cared(a)a中每个属性对决策属性集d的粗糙度,从中选择出粗糙度最小的属性作为该结点检验属性的最优解;其粗糙度计算公式如下:

其中为粗糙度;

aci(x)为近似精度;

为x的下近似集合;

为x的上近似集合:

bncix为边界区,表示集合x的上近似集合和下近似集合的差,在知道r的判断下,无法确定是否属于x的对象所组成的集合;

(3)通过所述电力通信设备与监测点的关联参数及相关值和所述电力通信设备的异常特征值结合所述电力通信设备的实时监测信息对所述电力通信设备进行运行状态分析,从而得出所述电力通信设备的故障预测与检修指导;

所述多变量数的预测分析决策树中的测试属性集包括误码异常、光功率异常、飘移异常、光纤异常、偏置电流异常、抖动电流异常、机房温度异常和机房供电异常。

采用上述该基于改进决策树的电力通信设备状态的预测方法中构建出多变量数的预测分析决策树的具体算法应用:

依据收集的电力通信设备相关运行状态的试验数据样本,构建的决策表,如表1所示。

其中,论域u对应于收集到的试验数据样本集合为{1,2,......,8};测试属性a对应于试验数据样本中的7类测试特征集合为{a1,a2,......,a7};决策属性d对应的试验数据样本异常类型集合为{i,ii,......,viii};

表1通信设备状态对应的决策表

其中,论域u对应于收集到的试验数据样本集合为{1,2,......,8};测试属性a对应于试验数据样本中的7类测试特征集合为{a1,a2,......,a7};决策属性d对应的试验数据样本异常类型集合为{i,ii,......,viii};

其次,计算测试属性a对应的决策属性d的核;定义posind(a)(d)={1,2,3,4,5,6,7,8}=u;

判断测试属性ai(i=1,2,…,7)在测试属性a中对于决策属性d的重要性:若则表示该ai为非必要的,否则表示该ai为必要的;

根据表1计算得知,a2,a3,a4,a5在测试属性a中对于决策属性d是非必要的,而a1,a6,a7在测试属性a中对于决策属性d是必要的;即cored(a)={a1,a6,a7}。

然后,设定合取范式形式p=a1∧a6∧a7,计算出p对决策属性d的泛化在论域u上的等价类划分,可以得到u/ind(p)={{1},{3},{4},{5},{7},{8},{2,6}};由于构成的泛化gend(p)将测试属性a和决策属性d可划分成惟一的等价映射关系,因此可将gend(p)作为本决策树的根节点;

最后,依次计算下一层级决策树节点的校验属性,直至测试属性集为空;对于决策属性d′={2,6},根据式(4)分别计算a2,a3,a4,a5对于d′的粗糙度;其粗糙度见表2。

表2决策属性d′的粗糙表

由表2可知,最小粗糙度为因此测试属性a3和a5可作为d′的校验属性。

以粗糙度最小的属性作为判定依据,不断从剩余的测试属性集中筛选出各层级节点的校验属性,最终可得到的基于改进决策树结构如图2所示。利用粗糙度的计算进而确定分类检验属性的方法有效改进了传统决策树学习算法的不足,能够对数据不确实、多变量以及数据不完整等分类问题给予妥善处置,优化和简化了决策树结构。电力通信网络中设备运行状态异常的表现多种各样,其发生机理也是复杂多变,本文提出的改进决策树可从样本数据中学习规则,具有自组织和自适应性。随着实际环境中运行状态信息的不断收集,使得可用的样本数据不断增多,错误样本将逐渐“淹没″在海量的正确样本中,使得决策树的构建越来越准确。同时,粗糙集理论的引入,能够较好地处理实际生产环境中获取的连续量、数值量等不同特征值的样本数据,实现了一种简略、快捷的预测分析分类方法。

上面结合附图对本发明的实施方式作了详细的说明,但是本发明不限于上述实施方式,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1