基于自适应动态规划的单区域电力系统频率复合控制方法与流程

文档序号:12131358阅读:320来源:国知局
基于自适应动态规划的单区域电力系统频率复合控制方法与流程

本发明涉及电力系统频率控制技术领域,尤其是涉及一种基于自适应动态规划的单区域电力系统频率复合控制方法。



背景技术:

大型电力系统通常由多个区域组成,每个区域通过联络线与相邻区域相互连接。随着电能需求的增长和可再生能源发电技术的日益成熟,现代电力系统逐步发展为融入分布式发电和随机负荷的智能电网,负荷需求和发电量变得越来越随机,电气元件也越来越丰富。

当电力系统规模较小时,可以将整个电力系统看作一个区域,即单区域电力系统。单区域电力系统遇到多个随机负荷变化时,系统的频率可能会发生严重振荡,这时采用有效的电力系统频率控制方法,维持电力系统频率稳定变得尤其重要。结合单区域电力系统的特点,一些控制方法逐渐引起了人们的关注。例如,围绕比例积分微分(Proportion-integration-differentiation,PID)控制、内模控制、滑模控制、模糊逻辑控制等方法,已经开展了一些电力系统负荷频率控制的研究。这些方法的应用,从不同程度上提高了电力系统频率控制的性能,但仍然可以提高,因为这些方法缺乏在线学习和自适应能力。

因此,在随机负荷变化情况下,保证电力系统的安全和频率稳定,已经成为智能电网发展的一个主要挑战。



技术实现要素:

为了解决现有技术中的上述问题,即为了解决单区域电力系统在随机负荷变化情况下,系统实际频率偏离标称值的技术问题而提供一种基于自适应动态规划的单区域电力系统频率复合控制方法。

为了实现上述目的,提供了以下技术方案:

一种基于自适应动态规划的单区域电力系统频率复合控制方法,所述方法包括:

获取如下测量信号:单区域电力系统调速器时间常数、发电机时间常数、区域负荷时间常数、区域负荷增益、单区域电力系统频率偏差;

利用比例积分控制器和自适应动态规划控制器,根据所述测量信号生成比例积分控制信号和自适应动态规划控制信号,并将二者叠加,得到复合控制信号;

将所述复合控制信号应用到所述单区域电力系统中,进行频率控制。

优选地,所述生成比例积分控制信号具体包括:

根据下式分别确定调速器等效模型、发电机等效模型和当地负荷等效模型的传递函数模型:

其中,所述Gg(s)表示所述调速器等效模型的所述传递函数模型;所述s表示拉普拉斯变换中的复数变量;所述Tg表示调速器时间常数;所述Gt(s)表示所述发电机等效模型的所述传递函数模型;所述Tt表示发电机时间常数;所述Gp(s)表示所述当地负荷等效模型的所述传递函数模型;所述kp表示区域负荷增益;所述Tp表示区域负荷时间常数;

基于所述调速器、所述发电机和所述当地负荷的所述等效模型,建立单区域电力系统仿真模型;

根据所述单区域电力系统仿真模型,使用凑试法获得比例积分控制器的参数;

基于所述单区域电力系统仿真模型及所述比例积分控制器的参数,以所述单区域电力系统频率偏差为调节变量,根据下式计算所述比例积分控制信号:

其中,所述u1(t)表示所述比例积分控制信号;所述Kp表示比例系数;所述Δf(t)表示所述单区域电力系统频率偏差;所述Ki表示积分系数;所述τ表示积分变量;所述t表示时间变量。

优选地,所述自适应动态规划控制信号具体包括:

根据下式确定行为网络的输入信号:

mf=max{|Δf(t)|,|Δf(t-Δt)|}

其中,所述xa(t)表示所述行为网络的输入信号;所述t表示当前时刻;所述t-Δt表示当前时刻的一步延迟;所述mf表示归一化系数;所述|Δf(t)|表示所述Δf(t)的绝对值;所述Δf(t)表示t时刻对应的单区域电力系统频率偏差;所述|Δf(t-Δt)|表示所述Δf(t-Δt)的绝对值;所述Δf(t-Δt)表示所述t-Δt时刻对应的单区域电力系统频率偏差;

根据下式计算得到所述自适应动态规划控制信号:

其中,paj(t)表示行为网络第j个隐层神经元的输入;xai(t)表示行为网络第i个输入神经元的输入,wa1,ij(t)表示行为网络第i个输入神经元到第j个隐层神经元的权值,表示隐层神经元数目;表示行为网络输入层神经元数目;qaj(t)表示行为网络第j个隐层神经元的输出;σa表示行为网络的激活函数;vak(t)表示行为网络第k个输出神经元的输入,表示输出层神经元数目;wa2,jk(t)表示行为网络第j个隐层神经元到第k个输出神经元的权值;u2k(t)表示行为网络第k个输出神经元的输出。

优选地,所述自适应动态规划控制信号具体还包括:

采用评价网络确定所述自适应动态规划控制器的最小代价;

更新所述行为网络的权值;

更新所述评价网络的权值。

优选地,所述采用评价网络确定所述自适应动态规划控制器的最小代价,具体包括:

根据下式确定所述评价网络的输入信号:

其中,所述ci(t)表示所述评价网络的所述输入信号;所述表示所述行为网络输入信号的转置;所述表示所述自适应动态规划控制信号的转置;

根据所述评价网络的输入信号计算所述最小代价:

其中,所述pcj(t)表示所述评价网络第j个隐层神经元的输入,所述所述表示隐层神经元数目;所述xai(t)表示所述行为网络第i个输入神经元的输入,所述所述表示评判网络输入层神经元数目,所述wc1,ij(t)表示所述评价网络第i个输入神经元到第j个隐层神经元的权值;所述qcj(t)表示所述评价网络第j个隐层神经元的输出;所述σc表示所述评价网络的激活函数;所述表示t时刻的最小代价;所述wc2,j(t)表示所述评价网络第j个隐层神经元到输出神经元的权值。

优选地,所述更新所述行为网络的权值具体包括:

根据下式确定行为网络误差:

其中,所述Eat(l)表示所述行为网络误差;所述l表示所述行为网络权值在t时刻的内部迭代次数;所述表示t时刻的最小代价;

设置权值训练许可误差和最大迭代次数,并根据下式进行内部迭代,更新所述行为网络权值:

其中,所述所述所述和所述分别表示t时刻行为网络隐层神经元和输入层神经元第l次迭代的权值梯度;所述和所述分别表示t时刻行为网络隐层神经元和输入层神经元第l+1次迭代的权值;λa表示行为网络的学习率;

当所述行为网络误差满足第一误差阈值或所述行为网络内部迭代次数达到第一次数阈值时,停止所述行为网络内部迭代,得到行为网络隐层神经元和输入层神经元权值。

优选地,所述更新所述评价网络的权值具体包括:

根据下式计算效用函数:

其中,所述R(t)表示所述效用函数;所述Q=diag(1,0.5);所述xa(t)表示所述行为网络的所述输入信号;表示所述行为网络输入信号的转置;

基于所述效用函数,设置评价网络权值训练许可误差和最大迭代次数,根据下式确定评价网络误差:

其中,所述表示对第次迭代的评价网络误差;所述表示所述评价网络权值在t时刻的内部迭代次数;所述表示t时刻的最小代价;所述表示t-Δt时刻的最小代价;所述γ表示折扣因子;所述Δt表示采样时间;

采用梯度下降法,根据下式进行内部迭代,更新所述评价网络权值:

其中,所述所述所述和所述分别表示t时刻评价网络隐层神经元和输入层神经元第次迭代的权值梯度;所述和所述表示t时刻评价网络隐层神经元和输入层神经元第次迭代的权值;所述λc表示评价网络的学习率;

当所述评价网络误差满足第二误差阈值或评价网络内部迭代次数达到第二次数阈值时,停止所述评价网络内部迭代,得到评价网络隐层神经元和输入层神经元权值。

优选地,所述将所述复合控制信号应用到所述单区域电力系统中,进行频率控制,具体包括:

步骤1:在初始时刻t0,单区域电力系统管理和控制单元SMMC收到频率偏差Δf(t0),计算出所述t0时刻的所述比例积分控制信号,并确定出行为网络的输入其中,所述mf=1.2|Δf(t0)|,计算出所述t0时刻的所述自适应动态规划控制信号,再将所述比例积分控制信号和所述自适应动态规划控制信号发送至所述单区域电力系统中的各参与单元;

步骤2:在[0,1]区间上随机初始化行为网络权值wa2,jk(t0)和wa1,ij(t0)以及评价网络权值wc2,jk(t0)和wc1,ij(t0);

步骤3:初始化自适应动态规划参数:代价函数目标值,行为网络的输入层神经元数目、隐层神经元数目、输出层神经元数目,评判网络的输入层神经元数目、隐层神经元数目、输出层神经元数目,行为网络学习率,评判网络学习率,行为网络权值训练许可误差,权值训练最大迭代次数,评判网络权值训练许可误差及最大迭代次数;

步骤4:在时刻t,所述SMMC收到所述频率偏差Δf(t),计算出所述比例积分控制信号;经过数据预处理后,得到所述行为网络的输入xa(t),使用所述行为网络权值wa2,jk(t)和wa1,ij(t),计算得到所述自适应动态规划控制信号;使用所述评价网络权值wc2,jk(t)和wc1,ij(t)输出最小代价;

步骤5:计算行为网络误差、效用函数和评价网络误差,分别更新所述行为网络权值wa2,jk(t+Δt)和wa1,ij(t+Δt)以及所述评价网络权值wc2,jk(t+Δt)和wc1,ij(t+Δt),并在下一个时间步长时使用新的权值;

步骤6:将所述比例积分控制信号和所述自适应动态规划控制信号进行叠加,得到复合控制信号并由所述SMMC发送给所述单区域电力系统中的所述各参与单元,并进入下一个时间步长t+Δt,重复步骤4至步骤6。

本发明所构思的技术方案与现有技术相比,具有以下有益效果:

本发明提供一种基于自适应动态规划的单区域电力系统频率复合控制方法。其中,该方法包括:获取如下测量信号:单区域电力系统调速器时间常数、发电机时间常数、区域负荷时间常数、区域负荷增益、单区域电力系统频率偏差;利用比例积分控制器和自适应动态规划控制器,然后,根据测量信号生成比例积分控制信号和自适应动态规划控制信号,并将二者叠加,得到复合控制信号;再将复合控制信号应用到单区域电力系统中,进行频率控制。本发明通过将PI控制量与自适应动态规划控制量相加,构成复合控制量,解决了包含调速器、发电机和当地负荷的单区域电力系统在随机负荷变化情况下,系统实际频率偏离标称值的技术问题,实现了快速有效的单区域电力系统频率调节,实现了自适应频率控制,消除了频率偏差(频率波动),是符合智能电网技术的应用需求和发展趋势的。

附图说明

图1是根据本发明实施例的基于自适应动态规划的单区域电力系统频率复合控制方法的流程示意图;

图2是根据本发明实施例的单区域电力系统等效模型的结构和信号传输示意图;

图3是根据本发明实施例的自适应动态规划控制器原理示意图;

图4是根据本发明实施例的将基于自适应动态规划的单区域电力系统频率复合控制方法应用于单区域电力系统中进行频率控制的示意图;

图5是根据本发明实施例的单区域电力系统的随机负荷变化信号示意图;

图6是根据本发明实施例的单区域电力系统在随机负荷变化下,采用比例积分控制器和本发明实施例所提的复合控制器的频率偏差的控制效果比较示意图;

图7是根据本发明实施例的单区域电力系统在随机负荷变化下频率偏差的复合控制量和PI控制量比较示意图;

图8是根据本发明实施例的在10s、30s、50s、70s时的随机负荷干扰下,复合控制器中的自适应动态规划控制量的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,下面参照附图来描述本发明的优选实施方式。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

随着智能控制技术的出现,自适应动态规划(Adaptive dynamic programming,ADP)方法已经在多个工业领域得以应用,如机器人、飞行器、化工过程和智能电网。这种方法的主要的优点是它的在线学习能力,使被控对象在受扰情况下具有自适应能力。将这种自适应控制技术应用于电力系统的负荷频率控制(Load frequency control,LFC)中,解决现代电网随机负荷变化等问题,具有十分重要的意义。

本发明实施例的基本思想是基于单区域电力系统频率控制问题,以比例积分控制器为基础控制器,对于多个随机负荷变化,保持PI控制器参数不变,以自适应动态规划控制器为上层控制器的复合控制策略,对于多个随机负荷变化,根据电力系统当前频率偏差进行在线自适应调整,在线进行自适应动态规划控制器权值更新,获得相应的自适应动态规划控制量,使电力系统频率回到规定值。

为此,本发明实施例提供一种基于自适应动态规划的单区域电力系统频率复合控制方法。如图1所示,该方法可以通过步骤S100至步骤S120来实现。其中:

S100:获取如下测量信号:单区域电力系统调速器时间常数、发电机时间常数、区域负荷时间常数、区域负荷增益、单区域电力系统频率偏差。

本步骤可以通过分布式传感器来测量单区域电力系统的所有信号,再由通信信道传输到微电网管理和控制系统(Smart Micro-Grid Management and Control,SMMC)。然后,由SMMC处理,产生控制信号,再通过通信信道送至单区域电力系统中每个参与单元中。

单区域电力系统包括发电机、调速器和单区域当地负荷。其中,发电机提供电能供给;调速器控制发电机的速度,防止发电机损坏;当地负荷是该电力系统的需求侧,消耗电能。

S110:利用比例积分控制器和自适应动态规划控制器,根据上述测量信号生成比例积分控制信号和自适应动态规划控制信号,并将二者叠加,得到复合控制信号。

本步骤以比例积分控制器(PI控制器)为基础控制器,以自适应动态规划控制器为上层控制器。

其中,生成PI(比例积分)控制信号的步骤具体可以包括:

S111:根据下式分别确定调速器、发电机和当地负荷等效模型的传递函数模型:

其中,Gg(s)表示调速器等效模型的传递函数模型;s表示拉普拉斯变换中的复数变量;Tg表示调速器时间常数;Gt(s)表示发电机等效模型的传递函数模型;Tt表示发电机时间常数;Gp(s)表示当地负荷等效模型的传递函数模型;kp表示区域负荷增益;Tp表示区域负荷时间常数。

S112:基于调速器、发电机和当地负荷的等效模型,建立单区域电力系统仿真模型。

具体地,本步骤进一步可以包括:

SA1:根据单区域电力系统频率偏差及其积分参数,确定状态向量。

作为示例,单区域电力系统的状态向量x=[Δf(t),ΔPt(t),ΔXg(t),ΔE(t)]T

SA2:基于状态向量,根据下式建立单区域电力系统仿真模型:

其中,表示Δf(t)对时间的一阶微分,即表示单区域电力系统频率偏差;Δd(t)表示单区域电力系统随机负荷变化产生的负荷干扰;ΔPt(t)表示单区域电力系统发电机输出功率变化量;表示ΔPt(t)对时间的一阶微分,即ΔXg(t)表示单区域电力系统调节器位置偏差值;表示ΔXg(t)对时间的一阶微分,即r表示单区域电力系统的等效阻抗;ΔE(t)表示区域控制偏差,即单区域电力系统频率偏差的积分,表示ΔE(t)对时间的一阶微分,即u(t)表示控制信号;ke表示积分增益系数。

其中,当Δd(t)>0时相当于消耗电能增加;当Δd(t)<0时相当于向电网输入电能。

图2示例性地示出了单区域电力系统等效模型的结构和信号传输图。

S113:根据单区域电力系统仿真模型,使用凑试法获得比例积分控制器的参数。

具体地,本步骤可以包括:

步骤a1:确定调节器的比例系数和积分系数的值。

步骤a2:通过改变给定值对系统加一个扰动,观察曲线形状。

步骤a3:通过改变比例系数或积分系数的值,反复凑试直到被控量符合动态过程品质要求为止。

步骤a4:保留步骤a3最终得到的比例系数和积分系数为PI控制器的参数。

S114:基于单区域电力系统仿真模型及比例积分控制器的参数,以单区域电力系统频率偏差为调节变量,根据下式计算比例积分控制信号:

其中,u1(t)表示比例积分控制信号;Kp表示比例系数;Δf(t)表示单区域电力系统频率偏差;Ki表示积分系数;τ表示积分变量;t表示时间变量,例如时刻。

其中,生成自适应动态规划控制信号的步骤具体可以包括:

S115:根据下式确定行为网络的输入信号:

其中,xa(t)表示行为网络的输入信号;t表示当前时刻;t-Δt表示当前时刻的一步延迟;mf表示归一化系数,mf=max{|Δf(t)|,|Δf(t-Δt)|};|Δf(t)|表示Δf(t)的绝对值;Δf(t)表示t时刻对应的单区域电力系统频率偏差;|Δf(t-Δt)|表示Δf(t-Δt)的绝对值;Δf(t-Δt)表示t-Δt时刻对应的单区域电力系统频率偏差。

优选地,行为网络采用多层感知机神经网络来实现。

可以对行为网络的参数进行如下初始:设置为代价函数目标值UC=0、行为网络输入层神经元数目、隐层神经元数目、输出层神经元数目、行为网络学习率、行为网络权值训练许可误差及权值训练最大迭代次数。

S116:根据下式计算得到自适应动态规划控制信号:

其中,paj(t)表示行为网络第j个隐层神经元的输入;xai(t)表示行为网络第i个输入神经元的输入,wa1,ij(t)表示行为网络第i个输入神经元到第j个隐层神经元的权值,表示隐层神经元数目;表示行为网络输入层神经元数目;qaj(t)表示行为网络第j个隐层神经元的输出;σa表示行为网络的激活函数;vak(t)表示行为网络第k个输出神经元的输入,表示输出层神经元数目;wa2,jk(t)表示行为网络第j个隐层神经元到第k个输出神经元的权值;u2k(t)表示行为网络第k个输出神经元的输出。

由于单区域电力系统的自适应动态规划控制器输出是一维的,即行为网络输出神经元数目为1,即k=1。因此,自适应动态规划控制信号u2(t)=u21(t)。采用行为网络输出自适应动态规划控制信号。

在上述实施例的基础上,本发明实施例提供的方法还可以包括:

S117:采用评价网络确定自适应动态规划控制器的最小代价。

优选地,评价网络采用多层感知机神经网络来实现。

图3示例性地示出了自适应动态规划控制器原理图。

可以对评价网络进行如下初始化:设置评判网络输入层神经元数目、隐层神经元数目、输出层神经元数目、评判网络学习率、评判网络权值训练许可误差和最大迭代次数。

具体地,本步骤可以包括:

SB1:根据下式确定评价网络的输入信号:

其中,ci(t)表示评价网络的输入信号;表示行为网络输入信号的转置;表示自适应动态规划控制信号的转置。

上述评价网络的输入为和组成的向量。

SB2:根据评价网络的输入信号计算最小代价:

其中,pcj(t)表示评价网络第j个隐层神经元的输入,表示隐层神经元数目;xai(t)表示行为网络第i个输入神经元的输入,表示评判网络输入层神经元数目,wc1,ij(t)表示评价网络第i个输入神经元到第j个隐层神经元的权值;qcj(t)表示评价网络第j个隐层神经元的输出;σc表示评价网络的激活函数;表示t时刻的最小代价,该最小代价可以为评价网络在t时刻的输出值;wc2,j(t)表示评价网络第j个隐层神经元到输出神经元的权值。

对于多个随机负荷变化,保持PI控制器参数不变。以自适应动态规划控制器为上层控制器,对于多个随机负荷变化,根据系统频率偏差,在线进行自适应动态规划控制器权值更新,获得相应的自适应动态规划控制量。

S118:更新行为网络的权值wa1,ij(t)和wa2,jk(t)。

步骤b1:根据下式确定行为网络误差:

其中,Eat(l)表示行为网络误差;l表示行为网络权值在t时刻的内部迭代次数;表示t时刻的最小代价。

步骤b2:设置权值训练许可误差和最大迭代次数,并根据下式进行内部迭代,更新行为网络权值:

其中,和分别表示t时刻行为网络隐层神经元和输入层神经元第l次迭代的权值梯度;和分别表示t时刻行为网络隐层神经元和输入层神经元第l+1次迭代的权值;λa表示行为网络的学习率,优选地,λa>0。

其中,和也表示进行内部迭代的行为网络权值wa1,ij(t)和wa2,jk(t)。

步骤b3:当行为网络误差满足第一误差阈值或行为网络内部迭代次数达到第一次数阈值时,停止行为网络内部迭代,得到行为网络隐层神经元和输入层神经元权值。

举例来说,当获得的权值和使行为网络误差Eat(l)满足Eat(l)≤εa时,停止行为网络内部迭代,输出权值和为t+1时刻行为网络隐层神经元和输入层神经元权值,即:

或者当获得的权值和使行为网络内部迭代次数l满足l=Ma时,停止行为网络内部迭代,输出权值和为t+1时刻行为网络隐层神经元和输入层神经元权值,同样地,有和

S119:更新评价网络的权值。

具体地,本步骤可以包括:

步骤c1:根据下式计算效用函数:

其中,R(t)表示效用函数;Q=diag(1,0.5);xa(t)表示行为网络的输入信号;表示行为网络输入信号的转置。

步骤c2:基于效用函数,设置评价网络权值训练许可误差和最大迭代次数,根据下式确定评价网络误差:

其中,表示对第次迭代的评价网络误差;表示评价网络权值在t时刻的内部迭代次数;表示t时刻的最小代价;表示t-Δt时刻的最小代价;γ表示折扣因子,优选地,0<γ<1;t表示时刻;Δt表示采样时间。

步骤c3:采用梯度下降法,根据下式进行内部迭代,更新评价网络权值:

其中,和分别表示t时刻评价网络隐层神经元和输入层神经元第次迭代的权值梯度;和表示t时刻评价网络隐层神经元和输入层神经元第次迭代的权值;λc表示评价网络的学习率,优选地,λc>0。

和也分别表示进行内部迭代的评价网络权值wc1,ij(t)和wc2,j(t)。

步骤c4:当评价网络误差满足第二误差阈值或评价网络内部迭代次数达到第二次数阈值时,停止评价网络内部迭代,得到评价网络隐层神经元和输入层神经元权值。

举例来说,当获得的权值和使评价网络误差满足时,停止评价网络内部迭代,输出权值和为t+1时刻评价网络隐层神经元和输入层神经元权值,即:

或者,当获得的和使评价网络内部迭代次数满足时,停止评价网络内部迭代,输出权值和为t+1时刻评价网络隐层神经元和输入层神经元权值,同样地,有和

S120:将上述复合控制信号应用到单区域电力系统中,进行频率控制。

图4示例性地示出了将本发明实施例提供的方法应用于单区域电力系统中进行频率控制的示意图。

下面结合图4以一优选实施例来对将复合控制信号应用到单区域电力系统中,进行频率控制的步骤进行详细说明。其中,该步骤可以包括:

S121:在初始时刻t0,单区域电力系统管理和控制单元SMMC收到频率偏差Δf(t0),计算出t0时刻的比例积分控制信号,并确定出行为网络的输入其中,mf=1.2|Δf(t0)|,计算出t0时刻的自适应动态规划控制信号,再将比例积分控制信号和自适应动态规划控制信号发送至单区域电力系统中的各参与单元。

S122:在[0,1]区间上随机初始化行为网络权值wa2,jk(t0)和wa1,ij(t0),以及评价网络权值wc2,jk(t0)和wc1,ij(t0)。

S123:初始化自适应动态规划参数:代价函数目标值UC=0,行为网络的输入层神经元数目隐层神经元数目输出层神经元数目评判网络的输入层神经元数目隐层神经元数目输出层神经元数目行为网络学习率λa,评判网络学习率λc,行为网络权值训练许可误差εa,权值训练最大迭代次数Ma,评判网络权值训练许可误差εc及最大迭代次数Mc

S124:在时刻t,SMMC收到频率偏差Δf(t),计算出u1(t);经过数据预处理后,得到行为网络的输入xa(t),使用行为网络权值wa2,jk(t)和wa1,ij(t),计算得到自适应动态规划控制信号u2(t);使用评价网络权值wc2,jk(t)和wc1,ij(t)输出最小代价

S125:计算行为网络误差Eat(l)、效用函数R(t)和评价网络误差分别更新行为网络权值wa2,jk(t+Δt)和wa1,ij(t+Δt)以及评价网络权值wc2,jk(t+Δt)和wc1,ij(t+Δt),并在下一个时间步长时使用新的权值。

S126:将比例积分控制信号和自适应动态规划控制信号进行叠加,得到复合控制信号并由SMMC发送给单区域电力系统中的各参与单元,并进入下一个时间步长t+Δt,重复步骤S204至步骤S206。

为使本领域技术人员更好地理解本发明,下面再结合具体实施例,对单区域电力系统频率复合控制方法进行详细说明。

S301:针对单区域电力系统,进行如下设置:调速器时间常数Tg=0.1、发电机时间常数Tt=0.3、区域负荷的时间常数Tp=10、区域负荷增益kp=1、电路阻抗r=0.05、积分增益系数ke=0.4。

S302:针对单区域电力系统,分别在10s、30s、50s、70s时加入幅值为+0.15、-0.3、+0.25、-0.1的随机阶跃信号作为随机负荷变化信号。

本步骤也就是在10s、30s、50s、70s时的随机负荷干扰分别是Δd=0.15、Δd=-0.15、Δd=0.1、Δd=0。

图5示例性地示出了单区域电力系统的随机负荷变化信号图。

S303:使用的比例系数Kp=10和积分系数Ki=50设计自适应动态规划控制器。

S304:随机初始化行为网络权值wa2,jk(0)和wa1,ij(0)以及评价网络权值wc2,j(0)和wc1,ij(0),t0=0。

S305:设置自适应动态规划控制器的参数:采样时间Δt=0.05s,代价函数目标值UC=0、行为网络输入层神经元数目隐层神经元数目输出层神经元数目评判网络输入层神经元数目评判网络隐层神经元数目评判网络输出层神经元数目行为网络学习率λa=0.05、评判网络学习率λc=0.05、行为网络权值训练许可误差εa=10-6、权值训练最大迭代次数Ma=80、评判网络权值训练许可误差εc=10-7及最大迭代次数Mc=50。

图6示例性地示出了单区域电力系统在随机负荷变化下,采用比例积分控制器和本发明实施例所提的复合控制器(比例积分控制器和自适应动态规划控制器)的频率偏差的控制效果比较示意图。其中虚线是采用比例积分控制器的频率偏差的控制效果;实线是采用复合控制器的频率偏差的控制效果。可见,采用复合控制器,频率偏差调节具有更小的超调,频率偏差到0的速度也更快。

图7示例性地示出了单区域电力系统在随机负荷变化下频率偏差的复合控制量(PI控制信号和自适应动态规划控制信号)和PI控制量比较示意图。该图说明了复合控制器相比于PI控制器,能够提供更好的控制性能。当频率偏差发生时,在复合控制器的作用下,频率偏差减小较快,超调也较小。

图8示例性地示出了在10s、30s、50s、70s时的随机负荷干扰下,复合控制器中的自适应动态规划控制量的示意图。该控制量依据频率偏差的变化,自适应地给出控制量,使得复合控制器具有更好的控制性能。

S306:分别确定调速器、发电机和当地负荷等效模型的传递函数模型。

S307:基于调速器、发电机和当地负荷的等效模型,建立单区域电力系统仿真模型。

S308:根据单区域电力系统仿真模型,使用凑试法获得PI控制器的参数。

S309:基于单区域电力系统仿真模型及PI控制器的参数,以单区域电力系统频率偏差为调节变量,生成PI控制信号。

S310:确定行为网络的输入信号。

S311:计算出自适应动态规划控制信号。

S312:采用评价网络确定自适应动态规划控制器的最小代。

S313:更新行为网络的权值。

S314:更新评价网络的权值。

S315:采用行为网络输出自适应动态规划控制信号。

S316:将PI控制信号和自适应动态规划控制信号,并将二者叠加,得到复合控制信号。

S317:将复合控制信号应用到单区域电力系统中,进行频率控制。

单区域电力系统的随机负荷变化,导致负荷干扰Δd(t)的出现,从而使得系统频率出现偏差Δf(t)。由于负荷干扰Δd(t)的不确定性,本发明实施例使用PI控制器为基础控制器,使用自适应动态规划控制器作为上层控制器,生成自适应动态规划控制信号u2(t)和PI控制信号u1(t),并将二者在单区域电力系统管理和控制单元SMMC中相加产生控制信号,再通过通信信道将该控制信号送至单区域电力系统中每个参与单元中。解决了包含调速器、发电机和当地负荷的单区域电力系统在随机负荷变化情况下,系统实际频率偏离标称值的技术问题,实现快速有效的单区域电力系统频率调节,实现了自适应频率控制,消除了频率偏差,保证了电力系统的安全,是符合智能电网技术的应用需求和发展趋势的。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间可以不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1