本发明涉及光伏发电领域,具体而言,涉及一种基于强化学习的光伏发电储能系统灵活控制方法及装置。
背景技术:
1、传统的光伏发电储能系统控制是基于特定的物理模型,让其功率始终高于目标值,利用率不高。现有技术则是使用逼近技术将其建模,但其决策效率低、灵活性不足、决策明显滞后等问题较为明显。另外现有技术中发电端与储能端相互调控机制不足。
技术实现思路
1、本发明实施例提供了一种基于强化学习的光伏发电储能系统灵活控制方法及装置,以有效减缓储能系统功率在最大功率点处的波动。
2、根据本发明的一实施例,提供了一种基于强化学习的光伏发电储能系统灵活控制方法,包括以下步骤:
3、s101:实时获取光伏发电储能系统的状态信息,对其进行最大功率点跟踪,通过占空比调整全局最优电压值;
4、s102:利用强化学习进行建模与模型训练,对光伏发电储能系统的充电电压阈值进行智能调控。
5、进一步地,步骤s101包括:
6、实时获取光伏发电储能系统内光伏电池的输出电流与输出电压,进行复合型的最大功率点跟踪mppt,并通过pwm占空比调整输出全局最优电压值。
7、进一步地,步骤s102包括:
8、获取时段最大功率,通过强化学习马尔科夫决策过程的建模与模型训练,以充电效率、温度、能量利用率为激励因素,对光伏发电储能系统的充电电压阈值进行智能调控。
9、进一步地,方法还包括:
10、s100:构建光伏发电储能系统,其中光伏发电储能系统为集中式发电或分布式发电,其内的光伏板光伏电池输出不稳定、波动大的电压电流。
11、进一步地,方法还包括:
12、s103:光伏发电储能系统中,每一个储能单元在评价网络中除了输入自己的状态信息、动作信息之外,还获取光伏单元的状态信息与动作信息。
13、进一步地,储能单元自己的状态信息包括电压、电流、温度信息。
14、根据本发明的另一实施例,提供了一种基于强化学习的光伏发电储能系统灵活控制装置,包括:
15、电压控制模型,用于实时获取光伏发电储能系统的状态信息,对其进行最大功率点跟踪,通过占空比调整全局最优电压值;
16、智能调控模块,用于利用强化学习进行建模与模型训练,对光伏发电储能系统的充电电压阈值进行智能调控。
17、进一步地,装置还包括:
18、评价网络模块,用于在光伏发电储能系统中,每一个储能单元在评价网络中除了输入自己的状态信息、动作信息之外,还获取光伏单元的状态信息与动作信息。
19、一种存储介质,存储介质存储有能够实现上述任意一项基于强化学习的光伏发电储能系统灵活控制方法的程序文件。
20、一种处理器,处理器用于运行程序,其中,程序运行时执行上述任意一项的基于强化学习的光伏发电储能系统灵活控制方法。
21、本发明实施例中的基于强化学习的光伏发电储能系统灵活控制方法及装置,实时获取光伏发电储能系统的状态信息,对其进行最大功率点跟踪,通过占空比调整全局最优电压值;利用强化学习进行建模与模型训练,对光伏发电储能系统的充电电压阈值进行智能调控,有效减缓储能系统功率在最大功率点处的波动。
1.一种基于强化学习的光伏发电储能系统灵活控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的光伏发电储能系统灵活控制方法,其特征在于,步骤s101包括:
3.根据权利要求1所述的基于强化学习的光伏发电储能系统灵活控制方法,其特征在于,步骤s102包括:
4.根据权利要求1所述的基于强化学习的光伏发电储能系统灵活控制方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的基于强化学习的光伏发电储能系统灵活控制方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的基于强化学习的光伏发电储能系统灵活控制方法,其特征在于,储能单元自己的状态信息包括电压、电流、温度信息。
7.一种基于强化学习的光伏发电储能系统灵活控制装置,其特征在于,包括:
8.根据权利要求7所述的基于强化学习的光伏发电储能系统灵活控制装置,其特征在于,所述装置还包括:
9.一种存储介质,其特征在于,所述存储介质存储有能够实现权利要求1至7中任意一项所述基于强化学习的光伏发电储能系统灵活控制方法的程序文件。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的基于强化学习的光伏发电储能系统灵活控制方法。