智能网联电动汽车在不同交通状态下的节能学习控制方法

文档序号：31053957发布日期：2022-08-06 10:17阅读：来源：国知局

技术特征：
1.一种智能网联电动汽车在不同交通状态下的节能学习控制方法，其特征在于，包括以下步骤：步骤一、获取本车速度、加速度以及本车前后方所有车道车辆与本车的相对速度和距离；步骤二、将步骤一获取的本车本车速度和加速度输入到能耗计算模块，并且输出整个过程每一采样时刻的能量消耗；步骤三、建立强化学习模型；步骤四、输入强化学习模型的状态空间和奖励函数；步骤五、将强化学习模型放在不同交通流下进行训练和测试。2.根据权利要求1所述的一种智能网联电动汽车在不同交通状态下的节能学习控制方法，其特征在于，所述步骤一中本车速度、加速度以及本车前后方所有车道车辆与本车的相对速度和距离通过v2v技术获取。3.根据权利要求1所述的一种智能网联电动汽车在不同交通状态下的节能学习控制方法，其特征在于，所述步骤二中能耗计算模块的获得方法如下：21)将目标电动汽车放在测功机上运行不同的驾驶循环进行测试，运行后输出电动汽车的相关参数；所述相关参数包括速度、加速度、电池需求功率；22)通过多元回归分析拟合出速度、加速度和电池需求功率即能量消耗的关系方程。4.根据权利要求1所述的一种智能网联电动汽车在不同交通状态下的节能学习控制方法，其特征在于，所述步骤三的具体方法如下：车辆行驶过程包括加减速和换道；将换道作为一个瞬态过程，即一个离散动作，加速度作为连续动作；因此，采用一种基于混合状态空间的强化学习算法：p-dqn即基于混合状态空间的深度q网络算法来建立强化学习模型。5.根据权利要求1所述的一种智能网联电动汽车在不同交通状态下的节能学习控制方法，其特征在于，所述步骤四的具体方法如下：将步骤一中本车速度、加速度以及本车前后方所有车道车辆与本车的相对速度和距离输入到强化学习的状态空间中，车辆的经济性函数和通行效率函数输入到强化学习的回报函数中,同时为了防止被控车辆短时间内换道，在回报函数中加入换道惩罚；其中，经济性函数由步骤二的能耗计算模块获得，通行效率函数用汽车的速度v表示，换道惩罚由表示，其中，
△
t代表换道时间间隔，总的奖励函数为：r＝w1r1+w2r2+w3p
′ꢀꢀ
(1)其中，r1代表经济性；r2代表通行效率；p
′
代表换道惩罚；w1、w2、w3代表相应的权重系数。6.根据权利要求1所述的一种智能网联电动汽车在不同交通状态下的节能学习控制方法，其特征在于，所述步骤五的具体方法如下：通过多次训练，在强化学习的回报函数收敛时，表明训练过程完成；然后，将强化学习模型放入到测试集中进行测试，当测试集中的被控电动汽车能在不同交通流下比基准模型产生更好的节能效果，且不牺牲通行效率，就表明强化学习模型有良好的目标性能。

技术总结
本发明是一种智能网联电动汽车在不同交通状态下的节能学习控制方法。本发明通过智能网联技术实时获取本车的速度和加速度，前车、后车的相对速度和距离，并确定车辆的最大行驶速度和加减速度范围；同时，将本车的速度和加速度输入到能耗计算模块，求解整个行驶过程中的能耗；将上述车辆信息和能耗代表的经济性以及车辆的通行效率函数入到强化学习控制中；强化学习在不同交通流下进行训练和测试，使被控车辆能在不同交通流下以不牺牲通行效率的基础上实现节能的目标。本发明具有求解速度块，节能效果好的优势，解决了现有的电动汽车能耗模型能耗计算不准、模型复杂的问题，以及基于传统的控制算法求解过程中计算量过大的缺点和无法满足现实中不断变化的城市交通工况的不足。不足。不足。

技术研发人员：丁海涛李玮何科蔡硕
受保护的技术使用者：吉林大学
技术研发日：2022.04.06
技术公布日：2022/8/5

完整全部详细技术资料下载

当前第2页1 2