一种基于SparseAutoencoder的电力系统运行方式聚类方法与流程

文档序号:17590064发布日期:2019-05-03 21:42阅读:172来源:国知局
一种基于Sparse Autoencoder的电力系统运行方式聚类方法与流程

本发明属于电力系统安全校验、规划运行技术领域,具体涉及一种基于sparseautoencoder的电力系统运行方式聚类方法。



背景技术:

电力系统中使用典型运行方式对于电网的安全运行进行校验有着举足轻重的作用。在规划时期考虑到典型的运行方式并以此进行电力系统的运行校验,可以最大程度的防止电压越限、过负荷等事故的发生,保证电力系统对负荷和用户的持续供电能力。但是随着新能源的不断接入,电力系统的运行随机性大幅度提高,导致运行方式的特征也更加复杂,如何提取运行方式的特征向量生成典型场景变得尤为困难。然而利用传统的pca方法无法准确地提取特征向量,时间复杂度过高,实用性也大幅度降低。

因此,为保证可靠地提取出表征电力系统运行方式的特征向量以进行典型场景分析,选取合理的特征向量提取方式是亟需认真考虑的问题。

针对上述问题,本发明提出了一种利用sparseautoencoder技术提取表征电力系统运行方式的特征向量的方法。



技术实现要素:

本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于sparseautoencoder的电力系统运行方式聚类方法。

本发明采用以下技术方案:

一种基于sparseautoencoder的电力系统运行方式聚类方法,获取电力系统中的相关数据,然后设置训练参数,隐藏层层数和神经元个数,对相关数据进行autoencoder模型训练,同时提取出模型的拓扑结构和权值矩阵,进行聚类分析,得出典型场景数目,解码得出各场景中心的原始数据。

具体的,相关数据形成n行m列的输入矩阵n为向量,m为样本数量。

进一步的,相关数据包括电力系统内各个节点电压、电压幅值、各个节点的发电机有功功率和无功功率的数据以及电力系统在研究时间范围内的时序负荷数据。

具体的,设置训练参数,隐藏层层数和神经元个数如下:

设置相关参数为α,η与最大迭代次数为初始化训练参数,α是l2正则化方法的系数,η是稀疏正则化的系数;设置隐藏层层数为单层,即l=1;设置第l隐藏层神经元个数,即最终特征向量维数hl=2。

具体的,对相关数据进行autoencoder模型训练步骤具体如下:

s201、以相关数据形成n行m列的输入矩阵作为输入;

s202、输入可接受的误差e以及训练时间t进行可视化训练,观察误差和训练过程;

s203、提取最底层特征向量featuresl,并对featuresl进行聚类分析;

s204、找出k类场景中心,进行解码还原得出典型场景原始数据中心,同时还原出全部原始数据

s205、得出所需结果,循环结束。

进一步的,步骤s202中,若还原输入数据后与原始输入数据的欧氏距离大于e,增加迭代次数,重新训练模型;若训练模型时间大于t,即在迭代早期误差达到范围,减小迭代次数,重新训练模型。

进一步的,步骤s203中,选取k-means方法进行聚类,设聚类中心个数为k,设置初始值为k=1,计算轮廓值给k=k+1,计算轮廓值当k=h时,退出循环;得出最大的轮廓值得出典型场景个数k。

更进一步的,若最大轮廓值小于0.85,当hl<hl-1返回设置神经元个数,hl=hl+1,重新训练模型;否则,返回设置隐藏层层数,l=l+1,重新训练模型。

进一步的,步骤s204中,计算矩阵的欧氏距离φd,若φd≤ε则接受。

进一步的,步骤s204中,若φd>ε,若l>1,返回l=l-1,重新训练模型;否则,返回h=h-1,重新训练模型。

与现有技术相比,本发明至少具有以下有益效果:

本发明一种基于sparseautoencoder的电力系统运行方式聚类方法,将sparseautoencoder技术应用于电力系统特征向量的选取上,不需要复杂繁琐的人工标准化数据的过程,通过训练模型可以找到输入量之间的相关性,同时更重要的是可以降低特征向量的维数,确定聚类的初始场景数,同时大大减少了聚类时间上的复杂度。

进一步的,相关数据反应了电力系统运行的主要特征,将相关数据作为输入可以增加sparseautoencoder训练模型的速度和精度。

进一步的,根据不同电力系统模型聚类精度的要求,灵活设置初始的训练参数,隐藏层层数和神经元个数,便于针对不同的情况进行训练。

进一步的,通过进行autoencoder模型训练,可以提高该模型的精度,准确提取出特征向量,为聚类分析提供了良好的条件。

进一步的,通过对autoencoder模型训练得出的最底层特征向量features,得出场景聚类轮廓值,用于判断模型的优劣以及修改模型。

进一步的,将训练所得最底层特征向量features进行还原,与输入向量进行比较,判断模型的还原度和误差,若满足要求则该模型可用。

进一步的,将训练所得最底层特征向量features进行还原,与输入向量进行比较,若误差过大,则修改参数重新训练模型。

综上所述,本发明可以对表征电力系统运行方式的特征向量进行快速选取和降维,为电力系统运行方式特征向量的选取并生成典型运行场景提供一种新思路和方法。同时为神经网络在这一方面的应用开创了一个先例。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为sparseautoencoder的程序流程图;

图2为sparseautoencoder的算法简图。

具体实施方式

由于sparseautoencoder技术可以避免复杂的电力系统数据标准化,训练出的特征向量作聚类分析误差小并且可以在解码后较好地还原电力系统原始数据,具有及其优良的特性,因此选择该技术。

sparseautoencoder是一种无监督学习算法,它使用反向传播算法,并让目标值等于输入值,比如y(i)=x(i),该神经网络尝试学习一个hw,b(x)≈x的函数。此时,当减少神经元的个数会强迫该神经网络去学习输入数据的压缩表示,这就实现了数据的降维过程。同时,由于这一算法有利于发现输入数据中的相关性,就更适用于电力系统。

a、稀疏性的定义:

神经元的平均输出激活测度定义为:

表示隐藏神经元j的激活度,我们将使用来表示在给定输入为x情况下,自编码神经网络隐藏神经元j的激活度。同时为了增加模型的稀疏性,加入稀疏性约束:

其中,ρ是稀疏性参数,通常是一个接近于0的较小的值(比如ρ=0.03)。同时为了实现这一限制,我们将会在我们的优化目标函数中加入一个额外的惩罚因子,而这一惩罚因子将惩罚那些和ρ有显著不同的情况从而使得隐藏神经元的平均活跃度保持在较小范围内。惩罚因子的具体形式有很多种合理的选择,我们将会选择以下这一种:

s1是隐藏层中隐藏神经元的数量,而索引j依次代表隐藏层中的每一个神经元。

b、l2正则化方法:

正则化是机器学习中一个防止过拟合的重要手段,因为实际的模型可能并没有那么复杂,同时学习的模型拓扑以及学到的权值矩阵只是在训练数据上表现的结果可能会比较好。所用的特征过多,样本较少时就很容易陷入过拟合。那么我们就需要把它转化成为更为简单的模型。

本发明使用了l2正则化方法。

定义以下公式:

l是隐藏层的层数,n是观测值的数量,k是训练集中变量的个数。

c、成本函数:

α是l2正则化方法的系数,η是稀疏正则化的系数,可以通过l2weightregularization和sparsityregularization函数去分别修改。

本发明提供了一种基于sparseautoencoder的电力系统运行方式聚类方法,获取电力系统中的相关数据,如:电力系统中节点电压、电压幅值、节点负荷、发电机有功和无功出力等;然后设置训练参数,隐藏层层数和神经元个数,训练相关模型,同时提取出模型的拓扑结构和权值矩阵,然后进行聚类分析;最后得出典型场景数目,并解码得出各场景中心的原始数据。利用本发明方法可以对表征电力系统运行方式的特征向量进行快速选取和降维,为电力系统运行方式特征向量的选取并生成典型运行场景提供一种新思路和方法。。

请参阅图1和图2,本发明一种基于sparseautoencoder的电力系统运行方式聚类方法的步骤如下:

s1、数据简单初始化;

粗略进行电力系统运行的数据筛选,例如:获取该系统内各个节点电压、各个节点的发电机有功功率和无功功率的数据以及系统在研究时间范围内的时序负荷数据。这些数据构成n维,即n行向量。同时样本数量共有m个,即形成n行m列输入矩阵,记为

s2、对步骤s1得到的数据矩阵进行autoencoder模型训练,提取最底层特征向量进行聚类,确定典型场景个数,解码还原全部数据

设置相关参数α,η与最大迭代次数,α是l2正则化方法的系数,η是稀疏正则化的系数,即初始化训练参数;第l隐藏层神经元个数,即最终特征向量维数,记为hl=2;隐藏层层数,默认为单层,记为l=1;

s201、将作为输入,在matlab中进行autoencoder模型训练;

s202、可视化训练过程,观察误差和训练过程,输入可接受的误差e以及训练时间t进行可视化训练,若还原输入数据后与原始输入数据的欧氏距离大于e,增加迭代次数,重新训练模型;若训练模型时间大于t,即在迭代早期误差可达到范围,减小迭代次数,重新训练模型;

s203、提取最底层特征向量,记为featuresl,并对featuresl进行聚类分析;

选取k-means方法进行聚类,聚类中心个数设为k,初始值设置为k=1,计算轮廓值大小,记作不断给k=k+1,计算轮廓值大小,记作当k=h时,退出循环;得出最大的轮廓值得出k值,即为典型场景个数;若认为最大轮廓值小于0.85,当hl<hl-1返回设置神经元个数,hl=hl+1,重新训练模型;否则,返回设置隐藏层层数,l=l+1,重新训练模型;

s204、找出k类场景中心,进行解码还原得出典型场景原始数据中心;同时还原出全部原始数据,记为

计算矩阵的欧氏距离,记为φd,若φd≤ε则接受上述模型和结果;

若φd>ε:

若l>1,返回l=l-1,重新训练模型;

否则,返回h=h-1,重新训练模型;

s205、得出所需结果,循环结束。

s3、提取出模型拓扑以及学到的权值矩阵,根据需要分析变量的相关性。

提取s2中的最佳k值,即为典型场景个数,并提取出对应的场景中心原始数。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合附图和运用ieee-14节点系统例对本发明做详细说明。

初步选取的输入量如表1,共有30000个样本数据,各具有53个特征向量记为

表一输入数据

1、a,b和c组分别代表ieee14节点系统三种不同负荷水平所得到的数据作为输入集合。将作为输入,进行2)中操作;

2、进行模型训练:设置最大迭代次数为1000,α=0.01,η=4;设置初始h1=2以及l=1等按照2)中方法不断进行循环找出最佳结果;

3、提取出模型拓扑以及学到的权值矩阵,根据需要分析变量的相关性。提取2)中的最佳k值,即为典型场景个数,并提取出对应的场景中心原始数据。

将计算所得轮廓值展示如下表:

表二轮廓值计算值

由表2可知当典型场景数目为三类时,计算所得的轮廓值最大为0.96左右,得出在该输入数据进行训练的情况下,最佳的聚类水平应该分为三类。其聚类结果符合预期随着负荷水平分类的三种情况,具有极显著的特性。

同时在训练的场景数目不变的情况下,聚类的时间和参与聚类的特征向量的维数几乎成线性关系,即特征向量维数越高,聚类的时间越长。体现了使用sparseautoencoder对于典型场景的分类,在聚类效果几乎不变的情况下,当对特征向量进行降维时,其极大减少消耗的时间,这满足了电力系统在计算时的快速性。同时由结果可见,若电网的规模更大即节点数,特征向量维数更高,通过sparseautoencoder降低特征向量维数将对于聚类效果的提升有着更加显著的效果,对实际计算有着极大的帮助。

以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1