一种基于级联深度森林的电力系统暂态稳定评估方法与流程

文档序号:20113879发布日期:2020-03-17 19:33阅读:149来源:国知局
一种基于级联深度森林的电力系统暂态稳定评估方法与流程

本发明属于电力系统安全稳定分析领域,尤其涉及一种基于级联深度森林的电力系统暂态稳定评估方法。

技术背景

现代电力系统的规模不断增大,网架结构日益复杂,对系统的安全稳定分析技术提出了更高的要求,暂态稳定评估即是其中的一个重要环节。如何在故障后快速准确地实现暂态稳定判别已成为电力系统近年来的研究热点。

目前,电力系统暂态稳定分析手段主要包括时域仿真法、直接法和人工智能方法。时域仿真法数学模型直观且计算结果准确,但计算速度较慢,难以满足在线评估需求,因此被广泛用于离线分析与校核。直接法基于能量观点进行暂态稳定计算,物理意义明确,但计算结果比较保守,并且往往难以找到合适的能量函数。而电力系统中广域测量信息的不断丰富完善,则为人工智能、数据挖掘技术在暂态稳定研究中应用提供了广阔的前景。

作为人工智能的核心技术,机器学习为实现暂态稳定评估提供了新的思路。从机器学习的角度来看,暂态稳定评估通常是一个二分类问题,即判断系统是否稳定。解决这一问题的关键在于,分类器通过离线训练从样本中学习特征量与系统暂态稳定状态之间的映射关系,在线应用时即可利用实时运行数据快速预测系统的暂态稳定性。人工神经网络、支持向量机、决策树等经典机器学习算法都已被应用于暂态稳定评估。然而这些模型大多都属于浅层模型,拟合能力有限,无法保证对复杂分类问题的泛化性能。近年来,迅速发展的深度学习技术在图像识别、自然语言处理和欺诈检测等任务上表现出了优于浅层模型的效果。包括卷积神经网络、深度置信网络和自动编码器在内的多种深度学习算法也已被引入电力系统暂态稳定分析领域,显著提升了评估准确率。这些模型在本质上都属于深度神经网络(deepneuralnetworks,dnn),训练速度较慢,需要人为设置的参数众多,并且模型的泛化能力受参数影响程度较大,因此确定参数的过程将花费大量的时间。同时,dnn要大量的样本来避免过拟合,但实际的电力系统运行数据不一定能提供足够的标注样本供其训练。以上问题都对将深度学习技术用于电力系统暂态稳定评估造成了一定的阻碍。

为了解决以上问题,本发明提出一种基于级联深度森林的电力系统暂态稳定评估方法。将故障切除时刻的有功、无功、电压幅值、相角等物理量作为输入特征;把随机森林用其改进形式极限随机树进行替换,提高泛化性能的同时加快了训练速度,然后以“特征拼接”的方式进行级联;采用“早停止”策略自动决定模型的深度,从而避免了人为设计模型结构带来的困难,并使模型能适应不同规模的训练集。作为一种深度学习模型,深度森林拥有比浅层模型更好的泛化能力,同时能弥补深度神经网络训练速度慢、调参难度高和样本需求量大的不足。



技术实现要素:

本发明的目的在于,提供一种基于级联深度森林的电力系统暂态稳定评估方法,克服现有技术手段存在的缺陷。

本发明的技术方案为一种基于级联深度森林的电力系统暂态稳定评估方法,具体包括以下步骤:

步骤1,构建仿真模型,并利用电力系统分析软件进行时域仿真得到样本集;

步骤2,随机选择步骤1中样本集中的50%作为训练集dtr,其余50%构成测试集dtt;

步骤3,根据训练集训练级联深度森林模型,实现暂态稳定评估;

作为优选,步骤1中所述构建仿真模型具体为:

发电机采用六阶模型,负荷采用恒阻抗模型,故障类型设置为三相短路接地,单次仿真时长设置为20秒;

每次仿真采用不同的运行方式及故障条件,即设置不同的负荷水平、发电机出力水平、故障位置和故障持续时间;

步骤1中所述利用电力系统分析软件进行时域仿真得到样本集为:

每次仿真生成一个包含一组输入特征和对应标注的样本:

(xi,yi)

其中,w代表仿真次数,那么i∈[1,w],第i个样本的输入特征为:

xi={pgi,qgi,plii,qlii,pldi,qldi,vi,δbi}

同时记录仿真结束时刻各发电机之间的功角差δgi作为标注样本的依据;

pgi为第i个样本中故障切除时刻所有发电机有功功率,qgi为第i个样本中故障切除时刻所有发电机无功功率,plii为第i个样本中故障切除时刻所有线路有功功率,qlii为第i个样本中故障切除时刻所有线路无功功率,pldi为第i个样本中故障切除时刻所有负荷有功功率,qldi为第i个样本中故障切除时刻所有负荷无功功率,vi为第i个样本中故障切除时刻所有母线电压幅值,δbi为第i个样本中故障切除时刻所有母线电压相角,其中每一类输入特征都是一个集合,包含的具体特征数目与实际系统的拓扑结构有关,每个样本包含的特征总数可用n表示;

yi表示第i个样本中标注类型,若该次仿真结束时刻任意两发电机之间的功角差δgi均小于360度,就将该样本标注为0,即系统可以保持暂态过程的同步稳定稳定,否则将该样本标注为1,即失去暂态稳定;

经过w次仿真可以得到包含与仿真次数相同个数样本的数据集,即步骤1中所述样本集为:

d={(x1,y1),(x2,y2),…,(xw,yw)};

作为优选,步骤3中所述根据训练集训练级联深度森林模型,具体步骤如下:

步骤3.1,对深度森林采用的随机森林模型用极限随机树进行替换,具体如下:

随机森林由n棵决策树{h(x,θk,k=1,...n)}组成;

其中,θk是一个随机向量,表示一棵决策树的参数,所有的θk,k=1,...,n均独立同分布;对于任意一个待预测样本(xi,yi),每一棵决策树都对其进行投票分类,获得总票数最高的类别即被认为是该样本所属类别,即:

其中,h(xi)表示集成的随机森林,hk是第k棵决策树,yi代表该待测样本的真实类别,i(·)为指示函数,在·为真时取1,在·为假时取0;

随机森林采用bootstrap方法对训练集即dtr即进行采样,即对于每一棵决策树hk,都从包含m个样本的dtr中进行m次有放回的抽样,从而得到n个不同的含m个样本的采样子集即dk(k=1,…,n),因此在随机森林的一个采样子集即dk(k=1,…,n)中,有部分原始样本会被采样多次,也有部分原始样本从未被选中,每一棵决策树都使用不同的采样子集进行训练;

在训练决策树时,包含随机的特征选择过程;

对于一棵决策树,当前结点包含的样本集s的纯度可用基尼值描述:

其中,pk是当前结点样本集s中第k类样本所占比例,由于样本共有0或1两类,因此k=0或1,由定义可知,gini(s)反映了样本集s中任意两个样本属于不同类别的概率,因此gini(s)越小,s的纯度越高;

对于特征取值连续的情况,基于一个分割阈值t将s划分为特征a取值大于t的样本集s+和特征a取值小于t的样本集s-,定义基尼指数:

使得基尼指数最小的特征a*即是最优划分特征;

一般的决策树会在当前结点包含的所有d个特征中进行比较得到最优划分特征,然后不断分裂出子结点,并得到最终分类结果,随机森林则是先从结点的特征集合中随机抽取出一个包含d'个特征的子集,再从该特征子集中筛选出最优划分特征;

极限随机树与随机森林的原理十分相似,是后者的一种改进形式;

它的两个不同之处在于,它没有经过bootstrap,而是将全部训练集样本用于每一棵决策树的训练;另一方面,对于取值连续的数值型特征,极限随机树会随机选择特征分割阈值,从而进一步增加模型的随机程度,虽然构建所有决策树时使用的样本相同,但由于分裂结点时的特征划分是随机的,得到的决策树依然会有明显的差异;

步骤3.2,以特征拼接方式对极限随机树进行级联以构建级联深度森林暂态稳定评估模型:

一个n维输入样本x[x1,x2,…,xn]经过一层极限随机树会得到一个二维类向量预测结果[c1,c2],将该结果与原n维样本拼接,作为下一层极限随机树的输入,以这种方式经过多层极限随机树的级联后,将最后一层极限随机树的预测结果中最大值对应的类别作为最终的暂态稳定预测类别;

步骤3.3,采用“早停止”策略自动决定模型的深度:每生成一层新的随机森林,都使用测试集dtt交叉检验模型的准确率是否提升,如果没有则停止生成下一层森林,并以当前结构作为模型最终结构。

本发明具有准确率高、调参过程简单、参数鲁棒性好、训练速度快和小样本学习能力强等特点。

附图说明

图1:是ieee39节点系统结构图;

图2:是随机森林算法结构图;

图3:是级联深度森林结构图;

图4:是本发明方法流程图;

图5:是不同训练集规模下的深度学习模型准确率。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在电力系统时域仿真软件中搭建ieee39节点系统,共设置70%、75%、80%、85%、90%、95%、100%、105%、110%、115%和120%等十一种负荷水平,发电机出力也相应进行调节;故障类型设置为三相短路接地,故障地点分别位于各母线及各线路20%、40%、60%、80%处,持续时间为0.1秒、0.2秒或0.3秒;单次仿真时长设置为20秒。

本发明具体实施方式的技术方案为一种基于级联深度森林的电力系统暂态稳定评估方法,具体包括以下步骤:

步骤1,构建仿真模型,并利用电力系统分析软件进行时域仿真得到样本集;

步骤1中所述构建仿真模型具体为:

发电机采用六阶模型,负荷采用恒阻抗模型,故障类型设置为三相短路接地,单次仿真时长设置为20秒;

每次仿真采用不同的运行方式及故障条件,即设置不同的负荷水平、发电机出力水平、故障位置和故障持续时间;

步骤1中所述利用电力系统分析软件进行时域仿真得到样本集为:

每次仿真生成一个包含一组输入特征和对应标注的样本:

(xi,yi)

其中,w代表仿真次数,那么i∈[1,w],第i个样本的输入特征为:

xi={pgi,qgi,plii,qlii,pldi,qldi,vi,δbi}

同时记录仿真结束时刻各发电机之间的功角差δgi作为标注样本的依据;

pgi为第i个样本中故障切除时刻所有发电机有功功率,qgi为第i个样本中故障切除时刻所有发电机无功功率,plii为第i个样本中故障切除时刻所有线路有功功率,qlii为第i个样本中故障切除时刻所有线路无功功率,pldi为第i个样本中故障切除时刻所有负荷有功功率,qldi为第i个样本中故障切除时刻所有负荷无功功率,vi为第i个样本中故障切除时刻所有母线电压幅值,δbi为第i个样本中故障切除时刻所有母线电压相角,其中每一类输入特征都是一个集合,包含的具体特征数目与实际系统的拓扑结构有关,每个样本包含的特征总数可用n表示;

yi表示第i个样本中标注类型,若该次仿真结束时刻任意两发电机之间的功角差δgi均小于360度,就将该样本标注为0,即系统可以保持暂态过程的同步稳定稳定,否则将该样本标注为1,即失去暂态稳定;

经过w=5775次仿真可以得到包含与仿真次数相同个数样本的数据集,即步骤1中所述样本集为:

d={(x1,y1),(x2,y2),…,(xw,yw)};

步骤2,随机选择步骤1中样本集中的50%作为训练集dtr,其余50%构成测试集dtt;

步骤3,根据训练集训练级联深度森林模型,实现暂态稳定评估;

步骤3中所述根据训练集训练级联深度森林模型,具体步骤如下:

步骤3.1,对深度森林采用的随机森林模型用极限随机树进行替换,具体如下:

随机森林由n棵决策树{h(x,θk,k=1,...n)}组成;

其中,θk是一个随机向量,表示一棵决策树的参数,所有的θk,k=1,...,n均独立同分布;对于任意一个待预测样本(xi,yi),每一棵决策树都对其进行投票分类,获得总票数最高的类别即被认为是该样本所属类别,即:

其中,h(xi)表示集成的随机森林,hk是第k棵决策树,yi代表该待测样本的真实类别,i(·)为指示函数,在·为真时取1,在·为假时取0;

随机森林采用bootstrap方法对训练集dtr即进行采样,即对于每一棵决策树hk,都从包含m个样本的dtr中进行m次有放回的抽样,从而得到n个不同的含m个样本的采样子集dk(k=1,…,n),因此在随机森林的一个采样子集dk(k=1,…,n)中,有部分原始样本会被采样多次,也有部分原始样本从未被选中,每一棵决策树都使用不同的采样子集进行训练;

在训练决策树时,包含随机的特征选择过程;

对于一棵决策树,当前结点包含的样本集s的纯度可用基尼值描述:

其中,pk是当前结点样本集s中第k类样本所占比例,由于样本共有0或1两类,因此k=0或1,由定义可知,gini(s)反映了样本集s中任意两个样本属于不同类别的概率,因此gini(s)越小,s的纯度越高;

对于特征取值连续的情况,基于一个分割阈值t将s划分为特征a取值大于t的样本集s+和特征a取值小于t的样本集s-,定义基尼指数:

使得基尼指数最小的特征a*即是最优划分特征;

一般的决策树会在当前结点包含的所有d个特征中进行比较得到最优划分特征,然后不断分裂出子结点,并得到最终分类结果,随机森林则是先从结点的特征集合中随机抽取出一个包含d'个特征的子集,再从该特征子集中筛选出最优划分特征;

极限随机树与随机森林的原理十分相似,是后者的一种改进形式;

它的两个不同之处在于,它没有经过bootstrap,而是将全部训练集样本用于每一棵决策树的训练;另一方面,对于取值连续的数值型特征,极限随机树会随机选择特征分割阈值,从而进一步增加模型的随机程度,虽然构建所有决策树时使用的样本相同,但由于分裂结点时的特征划分是随机的,得到的决策树依然会有明显的差异;

步骤3.2,以特征拼接方式对极限随机树进行级联以构建级联深度森林暂态稳定评估模型:

一个n维输入样本x[x1,x2,…,xn]经过一层极限随机树会得到一个二维类向量预测结果[c1,c2],将该结果与原n维样本拼接,作为下一层极限随机树的输入,以这种方式经过多层极限随机树的级联后,将最后一层极限随机树的预测结果中最大值对应的类别作为最终的暂态稳定预测类别;

步骤3.3,采用“早停止”策略自动决定模型的深度:每生成一层新的随机森林,都使用测试集dtt交叉检验模型的准确率是否提升,如果没有则停止生成下一层森林,并以当前结构作为模型最终结构。

以分类正确率为指标,使用测试集对模型性能进行评估。

在线应用时,通过广域测量系统获取发明内容步骤1所述输入特征对应的实时数据,将这些数据输入训练好的级联深度森林模型,即可得到暂态稳定在线评估结果。

表1不同暂态稳定评估模型的准确率

表1中,决策树是深度森林对应的浅层模型,单隐层的人工神经网络(artificialneuralnetworks,ann)则是深度神经网络对应的浅层模型。其中dnn是含有10个隐层的深度神经网络,df(rfbased)和df(etbased)分别代表基于随机森林和极限随机树的深度森林。可以发现,与对应的浅层模型相比,深度学习方法虽然训练时间相对较长,但在准确率上均有较大的提升。而两种深度森林不仅具有比dnn更高的准确率,在训练时间上也明显快于dnn。其中,基于et的深度森林比基于rf的深度森林计算速度更快,并且泛化效果更好。

基于神经网络的深度学习模型在小样本集的条件下容易出现过拟合,因此往往需要较大的样本数量。为了分析样本数量对深度学习方法的影响,随机选择原有5775个样本中的20%(即1155个样本)作为测试集,训练集则分别设置为样本总量的80%(4620个样本),60%(3465个样本),40%(2310个样本)和20%,确保训练集和测试集不存在交叉,评估结果如图5所示。可以发现,在训练集样本数量变化的过程中,两种深度森林模型始终具有比dnn更高的准确率,其中基于极限随机树的模型比基于随机森林的模型性能略好。训练样本占样本总量80%时,dnn也可以达到98%以上的准确率。但当训练样本减少到2000个甚至1000个时,dnn的准确率就会下降到96%左右,而两种深度森林模型则依然保持在98%以上。说明深度森林可以有效弥补dnn不适用于小训练样本集的问题。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1