基于有监督和无监督算法结合的负荷曲线数据可视化方法与流程

文档序号:18869569发布日期:2019-10-14 19:12阅读:335来源:国知局
基于有监督和无监督算法结合的负荷曲线数据可视化方法与流程

本发明涉及智能电网用户侧负荷数据处理方法,尤其是涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。



背景技术:

随着电网用户侧对电能使用多方面要求的提升,社会逐渐暴露出资源短缺等问题。为应对能源短缺问题,国家在接入高比例可再生能源的同时,进一步开放售电市场,使得用户在用电选择上具有更多的自由性。由此带来的用户端的高自由度导致负荷曲线更加趋于多样化。用户用电行为在季节、时段等方面存在一定的潜在规律。采用聚类或分类技术对负荷曲线进行分析,是详细了解用户用电特征的重要手段。电力负荷曲线分类是需求侧管理、负荷建模等工作的重要基础,对电力系统的分析、运行、规划都具有重要意义。

电力负荷曲线分类方法主要有无监督、有监督,以及无监督和有监督结合等方法。负荷曲线无监督分类主要采用基于划分的k-means和模糊c均值聚类、层次聚类、自组织映射聚类等方法。面对当今智能电网大数据场景下电力负荷曲线数量繁多、形态差异显著等问题,较广泛应用的划分式聚类算法仅以单一的传统距离量度方式判断负荷曲线相似度难以有效区分形态差异较大的负荷曲线。负荷数据维数越高,平均距离这一测度的意义就越小。因此,考虑引入皮尔逊相关系数代替欧氏距离判据改善负荷形态聚类效果,但仅能识别出幅度不同形态相似的负荷曲线。还有学者提出一种以余弦相似度作为外层聚类判据,欧式距离作为内层聚类判据的双层聚类分析方法,一定程度上可以有效识别出负荷类型。但是,现有文献大多仅针对距离的相似性度量函数进行优化,并未综合考虑负荷曲线形态特征相似度,因此导致聚类效果并不理想。

负荷曲线有监督分类主要采用基于统计原理的最小距离分类、贝叶斯分类,以及基于人工神经网络的分类等方法。其中,人工神经网络因为其自主学习能力强,容错性能良好等特点应用更为广泛。采用kohonen神经网络对负荷动态特性进行聚类,验证该神经网络应用于负荷分类的优越性;采用bp神经网络学习负荷动态特性,但bp神经网络的解受训练样本影响较大,这个不足限制了bp神经网络的广泛应用。神经网络的在目前的研究中还存在着训练样本过大导致分类效率低下、训练过程中出现过拟合等问题。

鉴于无监督和有监督分类方法存在的问题,近年来有学者提出采用无监督与有监督相结合的负荷曲线分类方法。利用无监督算法获取标签数据,作为有监督分类算法的训练样本。将无监督算法的复杂度低、适用性强与有监督算法的效率高、描述复杂动态行为效果好等优势相结合。将模糊c均值聚类或k-means聚类与神经网络相结合,一定程度上能够提高海量数据处理效率。但是,现有文献在获取标签数据环节一般仅考虑距离相似度判据,获得的标签数据精准较低,对最终的分类结果会造成一定的影响。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。

本发明的目的可以通过以下技术方案来实现:

一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,该方法包括以下步骤:

步骤1:针对输入的用户用电负荷曲线数据通过误差平方和(sumofsquarederror,sse)确定最优聚类数;

步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;

步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;

步骤4:利用步骤2中的类别标签数据训练步骤3中的神经网络分类器,获取训练完成的神经网络分类器;

步骤5:将步骤1中的输入的用户用电负荷曲线数据通过训练完成的神经网络分类器进行有监督数据分类,获得经过有监督数据分类的用户用电负荷曲线数据;

步骤6:将经过有监督数据分类的用户用电负荷曲线数据传输至用于电力调配的可视化设备上并显示。

进一步地,所述步骤2包括以下分步骤:

步骤21:根据欧式距离公式判断输入的用户用电负荷曲线数据中的部分数据的距离相似度并建立距离相似性度量矩阵;

步骤22:根据相关性系数公式判断输入的用户用电负荷曲线数据中的部分数据的形态相似度并建立形态相似性度量矩阵;

步骤23:根据距离相似性度量矩阵和形态相似性度量矩阵建立双尺度相似性度量矩阵并对其进行谱聚类,获得类别标签数据。

进一步地,所述步骤21中的欧式距离公式为:

式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。

进一步地,所述步骤22中的相关性系数公式为:

式中,bij表示彼此i和j两条用户用电负荷曲线数据之间的相关距离,表示第i条用户用电负荷曲线数据平均值,表示第j条用户用电负荷曲线数据平均值。

进一步地,所述步骤23中的双尺度相似性度量矩阵为:

p=αa+βb,α+β=1

式中,p表示双尺度相似性度量矩阵,a表示距离相似性度量矩阵,b表示形态相似性度量矩阵,α和β分别为距离相似性度量矩阵和形态相似性度量矩阵的权重参数。

进一步地,所述步骤4包括以下分步骤:

步骤41:设置神经网络分类器的初步参数,所述初步参数包括训练学习率,稀疏参数、随机权值矩阵和随机偏移矩阵;

步骤42:设置神经网络分类器前向算法中的训练次数、迭代次数,并进一步得出神经网络分类器隐藏层神经元的平均激活量;

步骤43:对神经网络分类器输出层的每一个神经元经过稀疏代价函数处理后反向传播更新层间连接权值,至此神经网络分类器设置完毕;

步骤44:利用类别标签数据中的无标签用户负荷数据输入对设置完毕的神经网络分类器进行训练,同时执行前向算法并使用梯度下降算法微调网络参数以提升训练精度,最终获得训练完成的神经网络分类器。

进一步地,所述步骤42中的神经网络分类器隐藏层神经元的平均激活量为:

式中,ρj表示神经网络分类器隐藏层神经元的平均激活量,n表示神经元数量,aj(l)()表示第l层第i个神经元的激活值,x表示输入负荷曲线数据矩阵,l为自然数。

进一步地,所述步骤6中的可视化设备包括显示器、投影仪和电力监控仪。

与现有技术相比,本发明具有以下优点:

(1)本发明采用基于距离和曲线形态双尺度相似性度量的优化谱聚类算法,获得更精确的负荷曲线类别标签数据,引入稀疏自动编码器优化神经网络分类器实现更好效果的负荷曲线分类,数据处理精确度更高。

(2)本发明中双尺度相似性度量能够克服仅根据距离判断曲线相似性带来的局限,同时分析曲线波动特征从而保证数据聚类的准确性与有效性,提高标签数据的精度,对sae自编码算法内部参数进行优化,进一步提高神经网络对负荷数据的适应度。使用数据内在特征矩阵初始化svm支持向量机神经网络训练,使分类器经训练后具有较强的分类能力,sae自编码算法与svm支持向量机神经网络结合在数据分类适确性、轮廓系数以及有效性等指标上表现更佳,对于用户负荷曲线分类更加有效,计算效率一定程度上得到提升。

附图说明

图1为本发明的方法流程示意图;

图2为本发明方法的用户负荷数据特征学习与分类网络结构图;

图3为本发明方法确定稀疏自动编码器参数中神经元数量对聚类效果的影响效果图;

图4为本发明方法确定稀疏自动编码器参数中稀疏参数对聚类效果的影响效果图;

图5为本发明方法确定聚类数的误差平方和sse曲线图;

图6为本方法用户负荷曲线分类第一结果图;

图7为本方法用户负荷曲线分类第二结果图;

图8为本方法用户负荷曲线分类第三结果图;

图9为本方法用户负荷曲线分类第四结果图;

图10为本方法用户负荷曲线分类第五结果图;

图11为本方法用户负荷曲线分类第六结果图;

图12为本发明用户负荷曲线分类后获得的典型负荷曲线图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

实施例

如图1所示为本发明基于有监督和无监督算法结合的负荷曲线数据可视化方法的具体流程示意图,具体包括以下步骤:

1)通过误差平方和(sumofsquarederror,sse)确定最优聚类数k;

2)选取部分负荷曲线,通过双尺度谱聚类对其进行聚类,获得类别标签数据;

21)距离相似性度量:

采用欧氏距离判断曲线之间的距离相似性。欧氏距离指在m维空间中两点之间的真实距离。负荷曲线xi与yi之间的欧氏距离定义为:

式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。

22)形态相似性度量:

判断曲线之间形态特征的相似性。采取相关距离对曲线形态波动特征进行度量。负荷曲线xi与yi之间的相关性系数定义为:

相关距离定义为:

bij=1-b′ij

式中,bij表示彼此i和j两条用户用电负荷曲线数据之间的相关距离,表示第i条用户用电负荷曲线数据平均值,表示第j条用户用电负荷曲线数据平均值。

23)双尺度相似性度量:

综合考虑曲线距离与形态特征,在谱聚类中采用双尺度相似性度量矩阵。根据欧氏距离与形态相关距离获得的相似度矩阵,采用极值归一化方法分别对两个矩阵归一处理,得到相应的矩阵a与b,双尺度相似度矩阵定义为:

p=αa+βb,α+β=1

式中,p表示双尺度相似性度量矩阵,a表示距离相似性度量矩阵,b表示形态相似性度量矩阵,α和β分别为距离相似性度量矩阵和形态相似性度量矩阵的权重参数。

参数确定方法:首先设定计算步长为0.1,进行10次计算,找出聚类效果最优的权重参数,之后在该权重值两侧区间内设定计算步长为0.01,以此逐渐找出最优权重。

3)通过sae学习负荷曲线的内在特征简明表达并初始化神经网络;

4)采用标签数据训练神经网络分类器;

41)用无标签用户负荷数据训练稀疏自动编码器。首先,设置训练学习率、稀疏参数ρ等参数,权值矩阵w与偏移矩阵b初始值随机获得。随后,设置前向算法中的训练次数、迭代次数,通过前向算法计算隐藏层神经元的平均激活量ρj。

式中,ρj表示神经网络分类器隐藏层神经元的平均激活量,n表示神经元数量,aj(l)()表示第l层第i个神经元的激活值,x表示输入负荷曲线数据矩阵,l为自然数。

对输出层的每一个神经元计算稀疏代价函数并通过反向传播更新神经网络的层间连接权值,从而获得数据低维表达;

42)使用步骤41)中学习得到连接权值初始化网络,执行前向计算并使用梯度下降算法对网络参数进行微调以提升训练精度;

5)对重表达后的n条负荷曲线通过训练好的神经网络分类器进行分类,获得最终分类结果。

如图2为本发明方法的用户负荷数据特征学习与分类网络结构图,本发明采用的sae优化svm分类器的训练主要分为3个步骤。

1)用无标签用户负荷数据x1训练稀疏自动编码器。

首先,设置训练学习率、稀疏参数ρ等参数,权值矩阵w与偏移矩阵b初始值随机获得。随后,设置前向算法中的训练次数、迭代次数,通过前向算法计算隐藏层神经元的平均激活量ρj。对输出层的每一个神经元计算稀疏代价函数并通过反向传播更新神经网络的层间连接权值。

2)采用有标签数据(x2,y2)训练svm分类器。

使用步骤1)中学习得到的权值矩阵w和偏移矩阵b初始化网络,执行前向计算并使用梯度下降算法对网络参数进行微调以提升训练精度。使用优化标签数据对神经网络进行训练。

3)采用完成学习的神经网络实现对无标签用户负荷曲线的分类并与现有方法进行对比检验分类效果。

如图3、图4分别为本发明方法确定稀疏自动编码器参数(神经元数量与稀疏参数)对聚类效果的影响图;dbi指标表示类内距离平均值之和与类间距离之比的最大值,其值越小表示不同类相离越远,聚类效果越好。sc指数结合内聚度和分离度两种因素评价聚类效果。sc的取值范围为[-1,1],越接近边界值表示聚类效果越好。由此可以确定稀疏自动编码器神经元数量为30,稀疏参数为0.1。

如图5本发明方法确定聚类数的sse曲线图,根据sse曲线的拐点确定最优聚类数k=6。

如图6~图11为采用本发明方法用户负荷曲线分类多个结果图;如图12为本方法用户负荷曲线分类后获得的典型负荷曲线图。典型负荷曲线能够清楚展示六类负荷曲线的波动状况。负荷存在平峰、双峰及多峰的用电特性,典型负荷曲线表明本文的分类方法能够较为明了的将多种用电特性区分开来。本发明所提方法突破了仅基于距离相似性分类的局限,通过负荷波动特征实现了不同类别的有效区分,表示出各类负荷在某一时间段的典型用电特征,有利于提供更加精确的发电指导与用户用电方案,为负荷曲线精确建模提供良好的实践基础。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1