基于无监督模型的输变电主设备负荷曲线的特征提取方法与流程

文档序号:12126099阅读:399来源:国知局
基于无监督模型的输变电主设备负荷曲线的特征提取方法与流程

本发明涉及电力系统大数据挖掘领域,特别是一种输变电主设备负荷曲线特征的分析方法。



背景技术:

随着电力系统信息化程度的不断提高和电力大数据量的迅速增长,研究适用于电力大数据挖掘的算法并建立有效的知识发现模型,对智能电网业务模式创新和发展具有重要意义。

电力系统中,在进行输变电主设备负荷异常数据辨识时,所得到的输变电主设备负荷曲线是没有经过训练的样本,即所有设备负荷数据的类型(正常、异常)都是未知的。这种情况下通过分析各类设备负荷之间的关系来找出离群对象,即负荷数据异常模式。整个过程属于无监督学习。在现有的设备负荷数据异常模式检测中,一般都是使用这种方法。设备负荷曲线通过特征提取、特征选择和维度归约得到的属性集反映的是各类设备负荷数据的特征模式,即该属性集没有包含各类设备负荷数据之间相互关系的信息。因此各类设备负荷数据的表征并不全面,分类器预测性能偏低。



技术实现要素:

本发明的目的是为了解决上述问题,设计了一种基于无监督模型的输变电主设备负荷曲线的特征提取方法。具体设计方案为:

一种基于无监督模型的输变电主设备负荷曲线的特征提取方法,提取步骤为:

步骤1.对原始负荷曲线进行特征提取与选择,获得物理特征集;

步骤2.对物理特征集进行扩展,获得扩展特征集;

步骤3.将物理特征集与扩展特征集进行叠加,获得属性特征集;

步骤4.对属性特征集进行分类。

步骤2中,对物理特征集的扩展方式包括LOF算法、复合线分析算法,所述复合线分析算法包括主成分分析算法,因子分析算法。

所述物理特征集的数量为多个,所述对属性特征集的分类方式包括决策树分类、贝叶斯分类、支持向量机分类。

所述LOF算法为基于欧氏距离得到的特征指标;

通过所述LOF算法获得的扩展特征集,反映了物理特征集中所有对象的分布情况,

通过所述LOF算法获得的扩展特征集,可直接引入所述物理特征集。

所述复合线分析算法包括主成分分析算法,因子分析算法。

复合线分析算法中的计算步骤为:

将所述物理特征集中的负荷曲线特征进行降维;

将降维后的曲线特征映射到二维平面上;

进行布局密度计算,得出布局密度ρi

计算出局部密度ρi到高局部密度点的距离δi

所述布局密度ρi的计算方式为:

ρi=Σχ(dij-dc)

其中,

dc为截断距离,截断距离dc为超参数;

所述高局部密度点的距离δi的计算方式为:

对于全局密度最大的点,令δi表示点i到大于其密度的点的最近距离。

所述布局密度ρi相对于距离点i的距离小所述截断距离dc的点的个数,所述ρi相反应了点i的密度情况,且所述ρi在计算过程中的相对值敏感度高于所述阶段距离dc

所述扩展特征集包括LOF扩展特征集、主成分扩展特征集、因子扩展特征集,

所述主成分扩展特征集为所述物理特征集通过主成分算法获得的扩展特征集;

所述因子扩展特征集为所述物理特征集通过因子分析算法获得的扩展特征集;

所述LOF扩展特征集为通过LOF算法获得的扩展特征集。

通过本发明的上述技术方案得到的基于无监督模型的输变电主设备负荷曲线的特征提取方法,其有益效果是:

在进行设备负荷异常数据辨识时,可以将无监督模型的输出作为有监督模型的输入,即在属性集中引入局部离群因子的相关信息,属性集包含各类设备负荷之间相互关系的信息,从而更加全面地表征各类设备负荷特征模式,进而提高分类器的预测性能。

附图说明

图1是本发明所述基于无监督模型的输变电主设备负荷曲线的特征提取方法中,所述主成分扩展特征集、属性特征集经过SVM支持向量机算法分类后的受试者工作特征曲线,也称感受性曲线;

图2是本发明所述基于无监督模型的输变电主设备负荷曲线的特征提取方法中,所述因子分析扩展特征集、属性特征集经过SVM支持向量机算法分类后的受试者工作特征曲线,也称感受性曲线;

图3是本发明所述基于无监督模型的输变电主设备负荷曲线的特征提取方法中,物理特征集、属性特征集经过SVM支持向量机算法分类后的曲线下面积值AUC的对照表。

图中,属性集a、主成分扩展特征集;属性集b、经过因子扩展特征集;属性集a+、所述主成分扩展特征集与物理特征集叠加获得的属性特征集;属性集b+、所述因子扩展特征集与物理特征集叠加获得的属性特征集。

具体实施方式

下面结合附图对本发明进行具体描述。

一种基于无监督模型的输变电主设备负荷曲线的特征提取方法,提取步骤为:

步骤1.对原始负荷曲线进行特征提取与选择,获得物理特征集;

步骤2.对物理特征集进行扩展,获得扩展特征集;

步骤3.将物理特征集与扩展特征集进行叠加,获得属性特征集;

步骤4.对属性特征集进行分类。

步骤2中,对物理特征集的扩展方式包括LOF算法、复合线分析算法,所述复合线分析算法包括主成分分析算法,因子分析算法。

所述物理特征集的数量为多个,所述对属性特征集的分类方式包括决策树分类、贝叶斯分类、支持向量机分类。

所述LOF算法为基于欧氏距离得到的特征指标;

通过所述LOF算法获得的扩展特征集,反映了物理特征集中所有对象的分布情况,

通过所述LOF算法获得的扩展特征集,可直接引入所述物理特征集。

所述复合线分析算法包括主成分分析算法,因子分析算法。

复合线分析算法中的计算步骤为:

将所述物理特征集中的负荷曲线特征进行降维;

将降维后的曲线特征映射到二维平面上;

进行布局密度计算,得出布局密度ρi

计算出局部密度ρi到高局部密度点的距离δi

所述布局密度ρi的计算方式为:

ρi=Σχ(dij-dc)

其中,

dc为截断距离,截断距离dc为超参数;

所述高局部密度点的距离δi的计算方式为:

对于全局密度最大的点,令δi表示点i到大于其密度的点的最近距离。

所述布局密度ρi相对于距离点i的距离小所述截断距离dc的点的个数,所述ρi相反应了点i的密度情况,且所述ρi在计算过程中的相对值敏感度高于所述阶段距离dc

所述扩展特征集包括LOF扩展特征集、主成分扩展特征集、因子扩展特征集,

所述主成分扩展特征集为所述物理特征集通过主成分算法获得的扩展特征集;

所述因子扩展特征集为所述物理特征集通过因子分析算法获得的扩展特征集;

所述LOF扩展特征集为通过LOF算法获得的扩展特征集。

实施例1

本实施例所用的数据集为6200个输变电主设备18个月的负荷数据,采样频率为30分钟。由于本文重点研究设备长期负荷数据的异常性,因此研究的时间单位取一个月,即对原始数据集进行处理,计算每个设备的月平均负荷以反映其数据特征模式,即30天。故本例中一共有111600条负荷曲线。6200个输变电设备负荷数据包含6123个正常情况和77个异常情况,异常比例为1.24%。模型的输入为原始数据集,输出为设备负荷数据异常度及疑似概率排序。

根据设备负荷曲线的物理含义,提取出14个物理特征集包括:下降趋势指标trb,前后1、3、6个月的平均负荷之差davg_1、davg_3、davg_6,所有月平均负荷序列的标准差sd,前、后6个月平均负荷序列的标准差bsd_6、esd_6,后3、6、9个月负荷均值与所有月负荷均值的比率rat3、rat6、rat9,平均负荷数据线性拟合的斜率slo,前后6个月傅里叶系数差值序列的模dfou_6,每个设备负荷序列与所有设备负荷中值序列的相关系数cor。除此之外,加入设备负荷数据历史评估等级记录,由高到低分别有A、B、C、D、E五个离散等级,记为V1-V14。

实施例2

在实施例1的基础上,

对物理特征集进行主成分分析和因子分析,获得与每个物理特征集相对应的14个属性集a、属性集b以及每个物理特征集行关联后相对应的局部密度ρi、高举不密度点距离δi

对属性集a、属性集b进行LOF计算,获得LOF值,

对属性集a、属性集b分别与物理特征集进行SVM支持向量机算法分类,获得属性集a+、属性集b+。

实施例3

在实施例2的基础上,对属性a、属性a+进行受试者工作特征计算,获得以特异性FPR为横坐标、以灵敏度FPR为纵坐标的ROC曲线,

图1是本发明所述基于无监督模型的输变电主设备负荷曲线的特征提取方法中,所述主成分扩展特征集、属性特征集经过SVM支持向量机算法分类后的受试者工作特征曲线,如图1所示,由计算结果可见,将无监督设备负荷异常数据辨识模型的输出作为有监督模型的输入,对原属性集进行扩展,可以有效提升分类器的性能。

实施例4

在实施例2的基础上,对属性b、属性b+进行受试者工作特征计算,获得以特异性FPR为横坐标、以灵敏度FPR为纵坐标的ROC曲线,

图2是本发明所述基于无监督模型的输变电主设备负荷曲线的特征提取方法中,所述因子分扩展特征集、属性特征集经过SVM支持向量机算法分类后的受试者工作特征曲线,如图2所示,由计算结果可见,将无监督设备负荷异常数据辨识模型的输出作为有监督模型的输入,对原属性集进行扩展,可以有效提升分类器的性能。

实施例5

在实施例3、4的基础上,计算ROC曲线与坐标轴围成的下部面积AUC,图3是本发明所述基于无监督模型的输变电主设备负荷曲线的特征提取方法中,物理特征集、属性特征集经过SVM支持向量机算法分类后的曲线下面积值AUC的对照表,如图3所示,由计算结果可见,将无监督设备负荷异常数据辨识模型的输出作为有监督模型的输入,对原属性集进行扩展,可以有效提升分类器的性能。

上述技术方案仅体现了本发明技术方案的优选技术方案,本技术领域的技术人员对其中某些部分所可能做出的一些变动均体现了本发明的原理,属于本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1