一种agc功率多目标随机优化分配方法

文档序号:7385185阅读:216来源:国知局
一种agc功率多目标随机优化分配方法
【专利摘要】本发明公开了一种基于改进TOPSIS-Q的AGC功率多目标随机优化分配方法,其步骤为:(1)确定状态离散集和动作离散集;(2)对各个状态-动作值函数以及状态-动作概率矩阵进行初始化;(3)采集当前控制周期区域电网各机组的实时输出有功功率;(4)获得各个优化目标的立即奖励值;(5)更新各优化目标的状态-动作值函数;(6)采用极差变换法对状态-动作值矩阵进行归一化处理,求解出各个最优权重系数;(7)求解出当前状态下的贪婪动作,更新状态-动作概率矩阵;(8)根据当前的状态-动作概率矩阵选择动作,并在下一个控制周期到来时,返回步骤(3)。本发明多目标优化方法结合了改进TOPSIS多目标决策方法,能满足实时性要求很高的AGC闭环控制系统的动态多目标随机优化需求。
【专利说明】—种AGC功率多目标随机优化分配方法
【技术领域】
[0001]本发明涉及电力系统自动发电控制【技术领域】,特别涉及基于改进TOPSIS-Q的AGC功率多目标随机优化分配方法,该方法适用于AGC功率的动态多目标随机优化分配。
【背景技术】
[0002]AGC (Automatic Generat1n Control)控制器为电网调度中心的重要控制系统之一,其主要任务是通过实时调整AGC机组的发电功率来应对随机的负荷扰动,使得互联电网频率和联络线交换功率保持在额定值。当AGC控制器根据电网负荷扰动得到一个总发电功率指令后,如何将总发电功率指令实时最优分配到各台AGC机组就成为一个研究难点。
[0003]目前,国内外关于AGC机组功率指令分配的研究还较少。在工程应用上,调度人员往往根据工作经验或机组的可调容量、调节速率等某一特性来进行AGC功率分配,并没有考虑到各机组间的其它非线性约束,难以满足复杂工况下的CPS(Contix)I PerformanceStandard)性能要求。刘斌,王克英,余涛,等在《PS0算法在互联电网CPS功率调节中的应用研究》(电力系统保护与控制)中采用了 PSO算法进行AGC功率分配,有效解决了 CPS指令的最优分配问题。针对AGC功率最优分配的几个难点,余涛等学者采用了具有很好随机优化能力的强化学习Q方法开展了系列研究。在Q算法迭代更新中引入了资格迹,有效解决了火电机组大时延问题,还对AGC机组进行聚类分层,有效避免了功率分配的维数灾难问题。然而,上述方法都只是针对某一个控制目标,或在Q算法的奖励函数采用线性加权的方式进行多目标优化,并没有考虑各个目标之间量纲的差异,同时采用了较为主观的固定目标权重系数,从而难以满足AGC机组功率分配的多目标动态随机优化需要。
[0004]在进行多目标决策时,常用的方法有线性加权和法、TOPSIS法、目标规划法、交互式法等,这些方法都需要确定各目标的权重系数,一般采用主观赋权法或客观赋权法。相比主观赋权法,客观赋权法得到的权值系数更加恰当、合理,但其计算方法大多比较繁琐,难以满足快速多目标决策的需求,尤其是在秒级时间尺度的AGC系统应用中。
[0005]改进TOPSIS法是一种简便快速的多目标决策方法,能够利用决策矩阵的?目息,客观地赋以各目标的权重系数,并以各方案到理想点距离的加权平均和作为综合评价标准。为更好解决Q学习算法的快速多目标决策问题,本发明方法以不同的Q值矩阵代表各个优化目标,然后利用改进TOPSIS法进行多目标决策,更好满足了实时性要求很高的AGC闭环控制系统的动态多目标优化需求。

【发明内容】

[0006]本发明的目的在于克服现有技术的缺点与不足,提供一种基于改进TOPSIS-Q的AGC功率多目标随机优化分配方法,该方法以不同的Q值矩阵代表各个优化目标,然后利用改进TOPSIS法进行多目标决策,能更好的适应AGC功率指令动态实时多目标分配,具有更好的优化结果。
[0007] 本发明的目的通过下述技术方案实现:基于改进TOPSIS-Q的AGC功率多目标随机优化分配方法,包括以下步骤:
[0008](I)确定状态离散集S和动作离散集A ;
[0009](2)对各个优化目标的状态-动作值函数以及状态-动作概率矩阵进行初始化;
[0010](3)采集当前控制周期区域电网的实时运行数据,包括各机组的实时输出有功功率,并计算出各机组的功率偏差值;
[0011](4)由当前状态sk,获得各个优化目标的立即奖励值Rm(sk,sk+1,ak);
[0012](5)根据当前控制周期各个优化目标的立即奖励值更新当前控制周期下各目标的状态-动作值函数;
[0013](6)采用极差变换法对当前状态下各个目标的状态-动作值矩阵进行归一化处理,求解出各个优化目标到理想点的最优权重系数;
[0014](7)求解出当前状态下的贪婪动作,更新状态-动作概率矩阵;
[0015](8)根据当前的状态-动作概率矩阵选择算法动作,根据选择的动作得到各个机组的功率调节因子,并在下一个控制周期到来时,返回步骤(3)。
[0016]本发明的步骤(I)中,离散集S为功率物理量,其为事先确定,不需要采集;离散集A为调节因子(调节比例)物理量,其为事先确定,不需要采集。
[0017]本发明的步骤(2)中,初始化时,所有状态动作概率相等,均为I/η,其中η为动作个数。
[0018]本发明的步骤(3)中,实时运行数据包括各机组的实时输出有功功率。
[0019]本发明的步骤(4)中,立即奖励值是算法中的一个环节,其物理意义是对上次状态Sk执行动作ak的评价,动作如果较优,奖励值就越高。
[0020]本发明的步骤(7)中,贪婪动作的物理意义就是当前状态下对应值函数最大的动作,即当前状态最优解。
[0021]本发明的步骤(8)中,算法动作就是优化的变量,即各调节因子组合;各个机组的功率调节因子,就相当于各个机组承担的负荷扰动比重,用来将AGC得到的总功率分配到各个机组的。
[0022]根据本发明另一【具体实施方式】,步骤(I)中的状态离散集S是根据自动发电控制总功率指令进行范围划分确定的。
[0023]根据本发明另一【具体实施方式】,步骤(I)中的动作离散集A是由若干个调节因子组合构成的。
[0024]根据本发明另一【具体实施方式】,步骤(2)中的各个优化目标的状态-动作值函数初始化为零。
[0025]根据本发明另一【具体实施方式】,步骤(2)中的状态-动作概率矩阵初始化时各状态下的每个动作概率相等。
[0026]根据本发明另一【具体实施方式】,步骤(3)中的各机组当前控制周期下的功率偏差
值 Δ Perror-1 ⑵为:
[0027]Δ Perror-1 (k) = Δ PGi (k) - Δ Porder_i (k-1), i = I, 2,..., η ;
[0028]其中APei(k)为当前控制周期k下的实时输出有功功率值,APordert (k-Ι)为上一控制周期下机组i的有功指令值,η为机组的总数。
[0029]根据本发明另一【具体实施方式】,步骤(4)中的立即奖励值Rm(sk,sk+1,ak)是根据第m个优化目标进行设计的。
[0030]根据本发明另一【具体实施方式】,步骤(5)中的各目标的状态-动作值函数0:的迭代更新公式为:
【权利要求】
1.一种AGC功率多目标随机优化分配方法,其特征在于,包括以下步骤: (1)确定状态离散集S和动作离散集A,其中状态离散集S为功率,动作离散集A为调节因子; (2)对各个优化目标的状态-动作值函数以及状态-动作概率矩阵进行初始化; (3)采集当前控制周期区域电网的实时运行数据,包括各机组的实时输出有功功率,并计算出各机组的功率偏差值; (4)由当前状态sk,获得各个优化目标的立即奖励值Rm(sk,sk+1,ak); (5)根据当前控制周期各个优化目标的立即奖励值更新当前控制周期下各目标的状态_动作值函数; (6)采用极差变换法对当前状态下各个目标的状态-动作值矩阵进行归一化处理,求解出各个优化目标到理想点的最优权重系数; (7)求解出当前状态下的贪婪动作,更新状态-动作概率矩阵; (8)根据当前的状态-动作概率矩阵选择算法动作,根据选择的动作得到各个机组的功率调节因子,并在下一个控制周期到来时,返回步骤(3)。
2.根据权利要求1所述的AGC功率多目标随机优化分配方法,其特征在于,所述步骤(I)中确定的状态离散集S是根据自动发电控制总功率指令进行范围划分确定的。
3.根据权利要求1所述的AGC功率多目标随机优化分配方法,其特征在于,所述步骤(1)中确定的动作离散集A是由若干个调节因子组合构成的。
4.根据权利要求1所述的AGC功率多目标随机优化分配方法,其特征在于,所述步骤(2)中状态-动作概率矩阵初始化时各状态下的每个动作概率相等。
5.根据权利要求1所述的AGC功率多目标随机优化分配方法,其特征在于,所述步骤(4)中立即奖励值Rm(sk,sk+1,ak)是根据第m个优化目标进行设计的。
【文档编号】H02J3/00GK104037761SQ201410295167
【公开日】2014年9月10日 申请日期:2014年6月25日 优先权日:2014年6月25日
【发明者】吴争荣, 许爱东, 郭晓斌, 杨航, 陈华军, 吴清, 黄松, 余涛, 张孝顺 申请人:南方电网科学研究院有限责任公司, 海南电网公司, 华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1