1.一种基于大数据分析的变压器缺陷评估方法,其特征在于:包括以下步骤:
s1:采集数据:采集海量准实时数据服务平台、地理信息系统、气象数据、集控子站系统、视频监控系统、资产管理系统、集控管理主站的数据;
s2:数据预处理:对采集的数据进行去重处理、异常值处理、缺失值处理;
s3:对数据集进行挖掘,建立缺陷特征向量;
s4:构建基于xgboost算法的变电变压器缺陷趋势评估模型,根据所述缺陷特征对变压器运行健康度进行评价。
2.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤s2中对数据进行缺失值处理具体为:采用平均值代替缺失值数据并做平滑化处理。
3.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤s3中的缺陷特征包括绕组缺陷、铁芯缺陷、主绝缘缺陷、引线缺陷、分接缺陷和套管缺陷。
4.根据权利要求1所述的一种基于大数据分析的变压器缺陷评估方法,其特征在于:所述步骤s4具体包括以下步骤:
s41:正则化学习目标函数:
对于给定的m个特征、n个样本的训练集,d={(xi,yi)}(i=1,2,...,n,xi∈rm,yi∈r,|d|=n),树的集成模型为k个子函数相加获得的最终输出,如下式所示:
式中,f={f(x)=wq(x),}(q:rm→t,w∈rt);
其中,
xgboost算法在训练模式是:保留前一次t-1轮的预测不变,加入新的函数ft到模型中,则:
…
最小化下列正则化目标函数:
其中,l为损失函数,用于描述模型模拟数据的程度;ω为正则化项,用于描述模型复杂程度,γ为复杂参数,λ为固定系数,t为树的叶子节点数量;
s42:采用梯度树提升算法:
用
使用二阶近似优化上述目标函数,则:
其中,
其中ij={i|q(xi)=j},为叶子节点j的实例,对于一个固定的结构q(x),可以计算叶子节点j的最优权重
用贪婪算法,迭代添加枝干,:il、ir分别为分割点左边和右边的样本集,且i=il∪ir,则损失函数减少量如下所示:
上式用来评价分割的候选节点;
s43:采用建立的目标函数评估变压器缺陷趋势:
根据模型输出的变压器运行健康度的预测值,判断变压器状态,分值越高表示变压器越健康,分值按照健康度分为缺陷、健康两种。