一种蒸汽发生器水位控制的强化学习调度方法及系统与流程

文档序号:37353321发布日期:2024-03-18 18:35阅读:35来源:国知局
一种蒸汽发生器水位控制的强化学习调度方法及系统与流程

本发明属于控制系统领域,具体涉及一种蒸汽发生器水位控制的强化学习调度方法及系统。


背景技术:

1、压水堆核电站是利用原子核裂变过程中释放的核能来发电的。压水堆核电站主要由核反应堆、一回路系统(primary circuit)、二回路系统(secondary circuit)及其他辅助系统所组成,蒸汽发生器是核动力装置中非常重要的热交换设备,蒸汽发生器水位的高低直接影响出口蒸汽的品质和蒸汽发生器的安全。因此,将蒸汽发生器水位控制在一定的安全范围内是非常重要和必要的。


技术实现思路

1、针对现有技术的以上缺陷或改进需求中的一种或者多种,本发明提供了一种蒸汽发生器水位控制的强化学习调度方法,其特征在于,上述方法包括如下步骤:

2、s1:获取蒸汽排放系统的蒸汽排放阀的第一蒸汽排放开度值;依据第一蒸汽排放开度值生成一蒸汽排放阀的控制指令;

3、s2:获取给水调节阀的第一给水开度值;依据第一给水开度值生成一给水调节阀的控制指令;

4、s3:以上述蒸汽排放阀的控制指令及上述给水调节阀的控制指令实现蒸汽发生器的水位控制。

5、进一步地,所述步骤s1具体为:

6、s11:采集一回路平均温度值,及主汽母管压力值输入至至少一强化学习模型中进行学习获得输出,依据输出获得多个蒸汽排放开度值;

7、s12:以模型的输出结果,选择其中信号最大的一个值计算获取第一蒸汽排放开度值,并将上述的第一蒸汽排放开度值转化为蒸汽排放阀的控制指令。

8、进一步地,所述多个蒸汽排放开度值的获取为:基于一回路平均温度值,和主汽母管压力值之间的比较关系计算获取蒸汽排放开度值。

9、进一步地,

10、所述步骤s2具体为:

11、s21:获取一蒸汽流量信号输入,获取一给水流量信号输入,将上述两路信号的差值经过一比例k;

12、s22:获取一当前实际蒸汽发生器水位量信号,获取一给定水位量信号,获得上述两路信号的差值;

13、s23:将上述经过比例k之后的信号,与上述步骤s22获得的差值信号进行进一步的求和,之后输入至至少一强化学习模型中获取第一给水开度值,并将上述的第一给水开度值转化为给水调节阀的控制指令。

14、本发明还公开了一种蒸汽发生器水位控制的强化学习调度系统,其特征在于,该系统包括:

15、蒸汽排放系统,具有至少一蒸汽排放阀,所述蒸汽排放阀接受一蒸汽排放阀的控制指令的控制排放设定的蒸汽流量;

16、给水系统,具有至少一给水调节阀,所述给水调节阀接受一给水调节阀的控制指令调节设定的水位量;

17、至少一第一采集处理装置,生成所述蒸汽排放阀的控制指令,具体为:

18、至少一采集处理装置,用于采集一回路平均温度值,及主汽母管压力值输入至至少一强化学习模型中进行学习获得输出,依据输出获得多个蒸汽排放开度值;以模型的输出结果,选择其中信号最大的一个值计算获取第一蒸汽排放开度值,并将上述的第一蒸汽排放开度值转化为蒸汽排放阀的控制指令;

19、至少一第二采集处理装置,生成所述给水调节阀的控制指令,具体为:

20、采集获取一蒸汽流量信号输入,采集获取一给水流量信号输入,将上述两路信号的差值经过一比例k;采集获取一当前实际蒸汽发生器水位量信号,采集获取一给定水位量信号,获得上述两路信号的差值;将上述经过比例k之后的信号,与上述获得的差值信号进行进一步的求和,之后输入至至少一强化学习模型中获取第一给水开度值,并将上述的第一给水开度值转化为给水调节阀的控制指令。

21、进一步地,所述多个蒸汽排放开度值的获取为:基于一回路平均温度值,和主汽母管压力值之间的比较关系计算获取蒸汽排放开度值。

22、进一步地,所述强化学习模型为基于控制屏函数的强化学习模型。

23、进一步地,所述第一采集处理装置先执行生成蒸汽排放阀的控制指令获得蒸汽流量,所述第二采集处理装置获取上述蒸汽流量执行给水调节的强化学习。

24、上述改进技术特征只要彼此之间未构成冲突就可以相互组合。

25、总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有的有益效果包括:

26、按照本发明中的第一发明构思,首先提出在蒸汽发生器水位控制系统中引入人工智能的学习方法,在重要的参数部分建立学习监控模型,以最大化长期的奖赏总和为目标,通过自主地探索核动力系统运行机理与规律、感知核动力系统运行状态、采用动作影响核动力系统并且得到奖赏,最终在这个交互过程中不断学习得到最优运行控制策略。

27、本发明中的基于强化学习的调度方法,区别以往的自适应控制等方法,由于构建采集整合了影响系统运行的关键参数,该方法可以自学习,自适应能力更强,可以模拟人的智能决策,实现越用越聪明。不依赖于精确的系统模型,具有较强的鲁棒性,使设计的控制方法可以直接有效地应用于实际的系统当中。



技术特征:

1.一种蒸汽发生器水位控制的强化学习调度方法,其特征在于,上述方法包括如下步骤:

2.如权利要求1中所述的蒸汽发生器水位控制的强化学习调度方法,其特征在于,所述步骤s1具体为:

3.如权利要求2中所述的蒸汽发生器水位控制的强化学习调度方法,其特征在于,所述多个蒸汽排放开度值的获取为:基于一回路平均温度值,和主汽母管压力值之间的比较关系计算获取蒸汽排放开度值。

4.如权利要求1中所述的蒸汽发生器水位控制的强化学习调度方法,其特征在于,

5.一种蒸汽发生器水位控制的强化学习调度系统,其特征在于,该系统包括:

6.如权利要求5中的蒸汽发生器水位控制的强化学习调度系统,其特征在于,所述多个蒸汽排放开度值的获取为:基于一回路平均温度值,和主汽母管压力值之间的比较关系计算获取蒸汽排放开度值。

7.如权利要求5中所述的蒸汽发生器水位控制的强化学习调度系统,其特征在于,所述强化学习模型为基于控制屏函数的强化学习模型。

8.如权利要求5中所述的蒸汽发生器水位控制的强化学习调度系统,其特征在于,所述第一采集处理装置先执行生成蒸汽排放阀的控制指令获得蒸汽流量,所述第二采集处理装置获取上述蒸汽流量执行给水调节的强化学习。


技术总结
本发明公开了一种蒸汽发生器水位控制的强化学习调度方法及系统,主要包括获取蒸汽排放系统的蒸汽排放阀的第一蒸汽排放开度值;依据第一蒸汽排放开度值生成一蒸汽排放阀的控制指令;获取给水调节阀的第一给水开度值;依据第一给水开度值生成一给水调节阀的控制指令;以上述蒸汽排放阀的控制指令及上述给水调节阀的控制指令实现蒸汽发生器的水位控制,按照本发明实现的调度方法及系统,能够自主地探索核动力系统运行机理与规律、感知核动力系统运行状态、采用动作影响核动力系统并且得到奖赏,最终在这个交互过程中不断学习得到最优运行控制策略。

技术研发人员:陶模,孙衢骎,冯毅,何金亮,方靖荃,王晨阳,郑伟,陈凯,曹光明,汪功庆,黄崇海,邱志强,柯志武,赵振兴,吴牧云
受保护的技术使用者:中国船舶集团有限公司第七一九研究所
技术研发日:
技术公布日:2024/3/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1