本发明属于燃料电池混合动力系统能量管理,具体涉及一种融合深度学习模型和td3算法的燃料电池汽车能量管理方法。
背景技术:
1、目前,用于燃料电池混动系统的能量管理技术大多采用车速预测作为功率需求的替代目标,由于这种方式仅能部分反映车辆的实时状态,因而不足以捕捉较为复杂的实际能源需求。此外,车辆的未来功率需求除受到车速、坡度等外部因素影响以外,还与传动系统、电机等内部部件息息相关,而现有能量管理策略对于这些方面也普遍缺乏较为综合全面的考虑。因此,如何针对燃料电池混合动力汽车的能源与结构特点,提供具有更高精度的车辆功率预测功能以及优化车辆能量分配性能的能量管理方法,是本领域中需要重点解决的技术问题。
技术实现思路
1、有鉴于此,针对本领域中所存在的技术问题,本发明提供了一种融合transformer与td3算法的燃料电池汽车能量管理方法,具体包括以下步骤:
2、步骤一、获取燃料电池混动汽车的车辆状态信息、动力电池状态信息以及燃料电池状态信息;其中,所述车辆状态信息包括:车速v、加速度acc、驱动电机转速ωmotor、驱动电机转矩tmotor、驱动电机效率ηmotor、车舱内温度tin、传动系统需求功率pd,t以及空调系统功耗pac;所述动力电池状态信息包括:动力电池电压与电流、内阻及soc;所述燃料电池状态信息包括:燃料电池输出功率pfc、效率ηfc及功率变化率δpfc;
3、步骤二、根据车辆动力学对其建立汽车纵向动力学模型;针对燃料电池混合动力系统拓扑结构依次建立基于电压衰减的燃料电池氢耗模型、动力电池能量消耗模型、动力电池容量衰减模型、驱动电机模型以及空调系统功率模型;
4、步骤三、建立基于transformer网络架构的最终预测模型,用于根据输入的车速、加速度以及道路坡度预测输出未来加速度与坡度信息,并在此基础上结合步骤二所建立的各模型计算得到未来多步功率需求;
5、步骤四、针对td3算法利用未来功率需求、车速vt、加速度acct、坡度θt、动力电池soc、车舱内温度tin,t以及燃料电池功率pfc,t定义状态变量和状态空间;利用燃料电池功率变化率δpfc,t和空调系统容量qcool,t定义动作变量和动作空间;综合考虑整车氢气消耗、动力电池寿命、动力电池soc维持、燃料电池电压的最大衰减阈值以及舱内温度舒适性,建立相应的奖励函数;
6、步骤五、初始化环境参数并利用从历史数据或者标准工况数据中提取的车辆状态信息构建训练集;利用训练集对所建立的最终预测模型和td3算法进行训练;将训练好的最终预测模型在线应用,利用其根据实时的车辆状态信息输出的功率需求预测结果生成相应的最优动作变量。
7、进一步地,步骤二中所建立的汽车纵向动力学模型具体形式如下:
8、
9、其中,ft、vt和acct分别表示车辆行驶驱动力、速度与加速度,m为车辆重量,g为重力加速度,cf和cd分别为道路阻力系数与空气阻力系数,θt为道路坡度,ρair为空气密度,af为车辆迎风面积,δt为车辆旋转质量换算系数;
10、基于电压衰减的燃料电池氢耗模型及其约束条件具体形式如下:
11、
12、ι3=0.2·pfc,max≤pfc≤0.8·pfc,max
13、其中,vd为燃料电池电压,t为时间,κ1、κ2、κ3分别对应不同功率区间的衰减速率,κ4为负载功率变化时的衰减率,pfc为燃料电池功率,pfc,max表示其额定值;
14、动力电池能量消耗模型具体形式如下:
15、
16、其中,soc为电池荷电状态,ibat为电池电流,qbat为电池容量,pbat为电池功率,vocv和rbat分别为开路电压与内阻;
17、动力电池容量衰减模型的具体形式如下:
18、
19、其中,c为动力电池放电倍率,neol(c)和aheol(c)分别为寿命终止时的循环次数与安时吞吐量;
20、驱动电机模型的具体形式如下:
21、ηmotor=f(ωmotor,tmotor)
22、
23、其中,rwh是车轮半径,ig是最终传动比;相应的传动系统所需功率通过以下公式计算:
24、
25、其中,ηdc/ac为dc/ac转换器的效率;
26、空调系统功率模型由空调功耗与制冷量的关系以及热平衡方程组成,其具体形式如下:
27、
28、其中,pac为空调功耗,plr为部分负载率,qg为额定制冷量,tin和tout分别为舱内外温度,cop代表性能系数,vair为舱内空气体积,为空气比热容,qheat为舱体热负荷,qcool为制冷量。
29、进一步地,步骤三中transformer网络架构由多头自注意力机制与全连接网络、层归一化、残差连接共同构成,同时输入嵌入位置编码以便于提取时序特征;最终预测模型由transformer层与全连接层组成,其模型参数通过以下损失函数进行更新:
30、
31、其中,表示数学期望,和分别表示历史状态和预测状态的驾驶状态序列,l和h分别代表历史状态和预测状态的步长,为模型网络参数;
32、得到未来加速度与坡度预测结果后,结合建立的各模型通过以下公式计算未来功率需求
33、
34、其中,是物理模型固定参数。
35、进一步地,步骤四中td3算法具体由一个行为者网络μ和两个独立的评论家网络q构成;算法智能体基于当前状态s生成动作变量a并获得奖励r之后进入下一状态,评论家网络用于针对动作-奖励输出相应的综合评分q(s,a),行为者网络用于通过训练使评论家网络输出的q(s,a)最大化;
36、行为者网络μ具体通过对优化目标所对应的目标函数执行以下形式的梯度下降来实现更新:
37、
38、其中,j(θμ)为目标函数,q1代表评论家网络1,θμ为行为者网络参数,st为t时刻状态变量;
39、评论家网络具体基于以下损失函数实现更新:
40、
41、其中,为评论家网络参数,δ为时间误差,γ为折扣因子;为添加噪声后的t+1时刻目标动作,其具体表示如下:
42、
43、其中,ξ表示高斯噪声,其被添加用于提高目标动作值估计的平滑性;
44、为提高训练稳定性,在行为者网络和评论家网络中均引入目标网络,并采用滞后于相应网络参数的延迟更新方式,具体表示如下:
45、
46、其中,τ为软更新因子。
47、上述本发明所提供的融合transformer与td3算法的燃料电池汽车能量管理方法,其在建模中综合考虑车辆系统内部的能量流动与消耗特点,建立了包含电池老化、燃料电池耐久性约束、氢气消耗以及车舱温度舒适性的多目标优化控制框架,还利用transformer模型与td3算法对未来多步功率需求进行预测,实现了对未来驾驶条件的兼顾,在此基础上根据车辆实时状态生成最优动作,能够有效降低预测误差并提高能量管理策略的适应性,对实车的驾驶性能、系统耐久性和氢气消耗达到最佳平衡具有重要的现实意义。