本发明涉及电池能量调控,尤其涉及一种电动车光伏共享电池能量调控优化方法及系统。
背景技术:
1、近年来新能源汽车市场占有率逐步提高,采用共享电池模式的电动车也逐步普及。
2、通过传统电网分配方式,提供电力供应给相应的电动车电池充电。但由于电池使用量的频繁和增多,导致电池各方面参数数值可能会随之下降,且电动车光伏共享电池能量调控涉及到多个组件和系统之间的协调与管理,无疑给系统的复杂性增加了设计和运行挑战。
技术实现思路
1、本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
2、鉴于上述现有存在的问题,提出了本发明。因此,本发明提供了一种电动车光伏共享电池能量调控优化方法,用来解决实际问题中,过度依赖传统电网和电池能量调控设计复杂的问题。
3、为解决上述技术问题,本发明提供如下技术方案,一种电动车光伏共享电池能量调控优化方法,包括:
4、采集电动车光伏共享电池状态,构建电动车光伏共享电池能量调控优策略网络;
5、通过所述策略网络,更新电动车光伏共享电池能量调控优策略网络参数。
6、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:所述采集电动车光伏共享电池状态s_i,包括:
7、s_i=[soc_i,dsoc_i_dt,t_i,p_charge_i]
8、其中,soc_i表示为电动车光伏共享电池i的电量水平;dsoc_i_dt表示为电动车光伏共享电池i电量的变化率;t_i表示为电动车光伏共享电池i的温度;
9、p_charge_i表示为电动车光伏共享电池i的充电功率;
10、采集电动车光伏共享电池状态向量s,包括每个电池的状态:
11、s=[s_1,s_2,...,s_n]。
12、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:还包括:
13、将电动车光伏共享电池状态向量s输入至电动车光伏共享电池能量调控优策略网络q_i(s_i,a_i;θ_i)中;
14、其中,s_i表示电池i的状态,a_i表示电池i的动作,θ_i表示网络参数;
15、使用神经网络q作为电动车光伏共享电池能量调控优策略网络的结构,表示为:
16、q(s,a;θ)=[q_1(s_1,a_1;θ_1),q_2(s_2,a_2;θ_2),...,q_n(s_n,
17、a_n;θ_n)]。
18、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:还包括:
19、输出电动车光伏共享电池调控向量a,包括每个电池的调控动作:
20、a=[a_1,a_2,...,a_n]
21、a_i=[p_charge_i,p_discharge_i]
22、其中,p_charge_i表示电池i的充电功率;p_discharge_i表示电池i的放电功率。
23、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:构建电动车光伏共享电池能量调控优策略网络,包括:
24、输入层,对于每个电池i,输入层的大小为4,对应状态向量s_i=[soc_i,dsoc_i_dt,t_i,p_charge_i]的四个参数;
25、隐藏层1,该隐藏层为全连接,每一个神经元与输入层的每一个神经元相连接;
26、隐藏层2,该隐藏层为全连接,每一个神经元与前一个隐藏层的每一个神经元相连接;
27、输出层,输出层对于每个电池i,输出层的大小为2,对应着调控向量a_i=[p_charge_i,p_discharge_i]的两个参数,整个输出层的大小为2*n;
28、其中,n为电池的数量。
29、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:更新电动车光伏共享电池能量调控优策略网络参数,包括:
30、设置光伏共享电池能量调控优策略网络的奖惩函数,表示为:
31、r(s,a)=w1*(desired_soc-soc)-w2*(p_charge+p_discharge)+w3*(1/(1+e^(t-t_threshold)))-w4*lifetimecost-w5*gridcost
32、其中,desired_soc是所需的电动车光伏共享电池能量;soc为当前电动车光伏共享电池能量;p_charge和p_discharge分别为电动车光伏共享电池光伏充电功率和放电功率;t为电动车光伏共享电池的温度;t_threshold为电动车光伏共享电池温度阈值;lifetimecost为电池寿命成本,通过电池价格比上电池寿命内总容量计算得到;gridcost为电网电价成本。
33、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:还包括:
34、收集电动车光伏共享电池能量调控样本,样本格式表示为:
35、(s,a,r,s',d)
36、其中,r表示光伏共享电池能量调控优策略网络的奖惩函数值;s'表示经过电动车光伏共享电池调控向量调控后的电动车光伏共享电池状态向量;d表示某个时间段的光伏能量消耗变化;
37、将以上样本信息组合成一个完整的电动车光伏共享电池能量调控样本,表示为:
38、(s_i,a_i,r_i,s_i',done_i)
39、其中,公式含义为:电池i在当前状态下选择了电动车光伏共享电池调控向量a_i,获得了光伏共享电池能量调控优策略网络的奖惩函数值r_i,导致了下一个经过电动车光伏共享电池调控向量调控后的电动车光伏共享电池状态向量s_i';
40、将样本中的(s_i,a_i,r_i)代入电动车光伏共享电池能量调控优策略网络,计算电动车光伏共享电池能量调控优策略网络目标差值。
41、作为本发明所述的电动车光伏共享电池能量调控优化方法的一种优选方案,其中:所述计算电动车光伏共享电池能量调控优策略网络目标差值,包括:
42、所述目标差值yi计算公式为:
43、yi=ri+μimaxaq(si,ai;θ)
44、其中,maxaq(si,ai;θ)代表调控样本输入电动车光伏共享电池能量调控优策略网络,得到的输出电动车光伏共享电池调控向量a中最大值;ri表示为目标偏差;μi代表电动车光伏共享电池能量调控策略网络调控缩放因子,其公式为:
45、
46、其中,erfc为互补误差函数。
47、与现有技术相比,发明有益效果为:本发明通过采集电动车光伏共享电池状态,构建电动车光伏共享电池能量调控优策略网络;通过电动车光伏共享电池能量调控优策略网络,更新电动车光伏共享电池能量调控优策略网络参数;本发明在更新电动车光伏共享电池能量调控优策略网络参数中设置了奖惩函数,利用该奖惩参数能够实现最优电动车光伏共享电池调控动作输出;同时,在计算电动车光伏共享电池能量调控优策略网络目标差值时,采用了电动车光伏共享电池能量调控优策略网络调控缩放因子对电动车光伏共享电池能量调控策略网络进行自主调控,以加快本方法的计算收敛,并在互补误差函数的作用下,能稳定其极值提高电动车光伏共享电池调控动作输出的精度。