一种基于大数据分析的变压器缺陷评估方法与流程

文档序号:19418567发布日期:2019-12-14 01:11阅读:277来源:国知局
一种基于大数据分析的变压器缺陷评估方法与流程
本发明属于变电站巡检
技术领域
,具体涉及一种基于大数据分析的变压器缺陷评估方法。
背景技术
:随着无人值守变电站的发展,变电站采用多种智能巡检方式,如:机器人巡检、无人机巡检、高清视频监控等多种巡检监控方式。但是各系统未基于周期评价结果进行趋势预判,无法诊断出变压器的质量异常情况,缺陷风险无法及时消除。变压器轮换方案往往依赖于固定周期,易造成资源浪费。历史巡检数据未充分挖掘,各系统海量数据价值未被有效利用。变压器的缺陷预测及质量分析评价依赖于人工分析,极大影响了处理效率。技术实现要素:为了解决上述问题,本发明提供了一种基于大数据分析的变压器缺陷评估方法,具体技术方案如下:一种基于大数据分析的变压器缺陷评估方法,包括以下步骤:s1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;s2:数据预处理:对采集的数据进行去重处理、异常值处理、缺失值处理;s3:对数据集进行挖掘,建立缺陷特征向量;s4:构建基于xgboost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。优选地,所述步骤s2中对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。优选地,所述步骤s3中的缺陷特征包括绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷。优选地,所述步骤s4具体包括以下步骤:s41:正则化学习目标函数:对于给定的m个特征、n个样本的训练集,d={(xi,yi)}(i=1,2,...,n,xi∈rm,yi∈r,|d|=n),树的集成模型为k个子函数相加获得的最终输出,如下式所示:式中,f={f(x)=wq(x),}(q:rm→t,w∈rt);其中,代表预测值,k代表cart树的数量,q代表样本映射到相应的叶子节点的决策规则,t代表一棵树的叶子节点数量,f代表cart树,fk代表第k棵决策树,w代表叶子的权重,f所有cart树的集合;xgboost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:…最小化下列正则化目标函数:其中,l为损失函数,用于描述模型模拟数据的程度;ω为正则化项,用于描述模型复杂程度;γ为复杂参数,λ为固定系数,t为树的叶子节点数量;s42:采用梯度树提升算法:用表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:使用二阶近似优化上述目标函数,则:其中,为一阶偏导数,为二阶偏导数,去除常数项,获得简化的目标函数为:其中ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:用贪婪算法,迭代添加枝干,:il、ir分别为分割点左边和右边的样本集,且i=il∪ir,则损失函数减少量如下所示:上式用来评价分割的候选节点;s43:采用建立的目标函数评估变压器缺陷趋势:根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。本发明的有益效果为:采用本发明可以充分挖掘变电站设备巡检数据价值,通过设备健康度评分,实现缺陷自动判别,可节省90%以上人工,效率提升10倍以上,将变电站巡维工作由“经验判断”变为“数据驱动”;由“计划检修”转向“状态检查”;由“事后被动处理”转向“事前主动预防”,实现运行设备精益化管理,为变电站巡检工作提供增值服务。附图说明图1为本发明中的流程图。具体实施方式为了更好的理解本发明,下面结合附图和具体实施例对本发明作进一步说明:如图1所示,一种基于大数据分析的变压器缺陷评估方法,包括以下步骤:s1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;采集数据时间跨度为1年。s2:数据预处理:各系统数据存在字段描述不统一、编码规则不对应、数据字段缺失等问题,通过制定数据质量、完整性等校验规则,行标准化处理;具体对采集的数据进行去重处理、异常值处理、缺失值处理,完成数据预处理工作;对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。s3:对数据集进行挖掘,建立缺陷特征向量;具体为:s31:分析变压器巡检报告的特征分布;s32:根据历史变压器缺陷类型,可将缺陷特征划分为绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷等6类;s33:模型特征提取,采用最大信息相关系数作为评价标准,不同特征的选取范围相对误差呈先增大后减小,综合考虑模型的精度与运算时间,本发明选取排名前50%的强关联因素。绕组缺陷包括:绕组低温过热、绕组匝间短路、绕组断线;铁芯缺陷包括:悬浮放点、铁芯多点节点、散热不均;主绝缘缺陷包括:绝缘击穿、围屏放电、油流带电;引线缺陷包括:对地闪络、引线断股、引线过热;分接缺陷包括:拨叉放点、触头烧损、断线;套管缺陷包括:套管闪络、套管过热、均匀球悬浮放电;s34:将特征量化成一组特征向量。s4:构建基于xgboost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。具体包括以下步骤:s41:正则化学习目标函数:对于给定的m个特征、n个样本的训练集,d={(xi,yi)}(i=1,2,...,n,xi∈rm,yi∈r,|d|=n),本实施例数据集中有748个样本,6个特征x1、x2、x3、x4、x5、x6,则数据集如下表所示:表1数据集树的集成模型为k个子函数相加获得的最终输出,如下式所示:式中,f={f(x)=wq(x),}(q:rm→t,w∈rt);其中,代表预测值,k代表cart树的数量,q代表样本映射到相应的叶子节点的决策规则,t代表一棵树的叶子节点数量,f代表cart树,fk代表第k棵决策树,w代表叶子的权重,f所有cart树的集合;xgboost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:…对于一个给定的样本,可以使用数中的决策规则将它分类到对应的叶子节点,并且将对应叶子节点的得分加起来作为最后的预测值,为了在模型中获得相应的函数簇,最小化下列正则化目标函数:其中,l为损失函数,用于描述模型模拟数据的程度;ω为正则化项,用于描述模型复杂程度;γ为复杂参数,λ为固定系数,t为树的叶子节点数量。s42:采用梯度树提升算法:用表示第t次迭代的第i个实例,并将ft添加到下列目标函数中:使用二阶近似优化上述目标函数,则:其中,为一阶偏导数,为二阶偏导数,则每个样本的一阶、二阶导数的值为:表2每个样本的一阶、二阶导数的值id1234567891011…748gi0.50.5-0.5-0.5-0.5-0.5-0.50.50.5-0.5-0.5…0.5hi0.250.250.250.250.250.250.250.250.250.250.250.250.25去除常数项,获得简化的目标函数为:其中ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重由此可以计算出对应的最优值:用贪婪算法,迭代添加枝干,:il、ir分别为分割点左边和右边的样本集,且i=il∪ir,则损失函数减少量如下所示:上式用来评价分割的候选节点;本发明使用xgboost包来训练模型,结合auc评分,选定模型最优参数,xgboost调参结果表如下所示:表3模型的优化参数s43:采用建立的目标函数评估变压器缺陷趋势:根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。设定变压器缺陷概率为p,则健康概率为(1-p),缺陷与健康的概率比odds=p/(1-p),从而定义评分卡的分割值为:score=a-blog(odds);假设odds=θ0时,对应的score值为p0;odds=2θ0时,score的变化值为δp,则:由上式可解得:a=p0+blog(θ0)。综合xgboost模型计算的结果和评分卡结合评价变压器的健康分值,根据历史巡检经验,我们将变压器健康的类别概率达70%以上。即设定θ0=0.7时,判定变压器为健康状态;分值为60(设定p0=60),当缺陷比上升一倍时,分值下降5分,即设定δp=5,将θ0=0.7、p0=60、δp=5代入score=a-blog(odds)计算健康分值,748条样本健康分值如下表4所示:表4样本的健康值分值区间数量[0,20)8[20,30)55[30,40)78[40,23)75[50,24)89[60,25)51[70,26)136[80,27)133[100,28)123本实施案例以xgboost算法为基础,对设备缺陷预测并输出健康分值,实现对设备运行状态的综合评价。本发明不局限于以上所述的具体实施方式,以上所述仅为本发明的较佳实施案例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1