终止状态受约束的行星式混合动力系统全局优化方法与流程

文档序号：15451630发布日期：2018-09-15 00:06阅读：222来源：国知局

本发明提供一种终止状态受约束的行星式混合动力系统全局优化方法，属于新能源汽车技术领域。

背景技术：

混合动力具有电量平衡的要求，当前基于dp全局优化的能量管理策略优化通常采用罚函数来满足系统的终止状态约束条件。然而，多数研究中的罚函数都需要研究人员凭借经验进行多次调试，这样将带来更为庞大的运算量，增加数倍的运算时间这将不利于全局优化算法的自动化实施。此外，由于用于优化的模型参数将随着时间的推移或车辆状态的变化而变化，而全局优化的目标工况也将随着历史运行数据的变化而变化，这些因素都将导致研究人员出示标定的罚函数不具有良好鲁棒性，进一步降低罚函数方法的应用价值。如2016年6月8日申请公布的发明专利：申请公布号：cn105644548a，混合动力汽车的能量控制方法及装置，该方法基于随机模型预测控制和神经元动态规划算法来实现混合动力汽车的能量管理控制，神经元动态规划算法进行全局优化求解时，通过设置奖惩函数将系统电量保持平衡，需要进行不断调试奖惩函数的因子，存在调试工作量庞大，运算时间长，全局优化求解效率较低等问题。

技术实现要素：

本发明的目的是提供一种能克服上述缺陷，有效实现电量平衡，同时能显著提升dp算法运行效率的终止状态受约束的行星式混合动力系统全局优化方法，其技术内容为：

第一步，确定行星式混合动力系统全局优化目标函数及约束条件：行星式混合动力系统的全局优化问题表述为：

式(1)中，j(u(t))为系统的成本函数，针对混合动力系统可表示为全工况中每一时刻瞬时成本l(x(t),u(t),t)的积分，加上基于终止状态的惩罚函数g(x(tf))，如下：

第二步，采用动态规划算法离散全局优化目标函数：将式(1)、(2)所表示的优化问题转化为多阶段离散问题，如下：

xk+1＝fk(xk,uk),k＝0,1,...,n-1(4)

式(4)中，xk为离散状态变量，xk∈[xmin,xmax]，uk为离散控制变量，uk∈[umin,umax]，k为离散采样时间，将系统的控制率为π＝{μ0,μ1,....μn-1}，那么以π为控制率，初始状态x(0)＝x0时，离散系统的总成本表示为：

式(5)中，lk(xk,uk)是第k时刻采用控制变量uk，状态变量为xk时的系统瞬时成本，gk(xk)为第k时基于状态变量xk的惩罚量，表示为gk(xk)＝α(xf-xk)²，xf为系统终止时刻的目标状态，α为大于零的惩罚函数系数，ln(xn,un)+gn(xn)是系统在终止时刻的瞬时成本，代表0～n–1时刻的总成本；

基于上述离散系统的成本函数，进一步得到离散系统的最优化问题为：

式(6)中，π代表在目标工况下，所有可行控制规则的集合；

第三步，开展系统状态变量边界约束的计算：步骤1，采用等效内阻模型作为电池模型，可以得到电池电流和电池功率之间的关系：

式(7)中，电池开路电压e＝fu(soc)，是关于soc的函数，根据soc与电池容量、电流的关系：

式(8)中，e为电池开路电压，ibat为电流，rint为等效内阻，qbat为电容真实容量，qmax为电池最大容量，soc为电池荷电状态，由式(8)可以得到混合动力系统容量与电流的关系：

qbat(k+1)＝qbat(k)+ibatδt(9)

步骤2，确定系统状态变量与控制变量的关系：根据式(9)可以得到系统状态变量与控制变量的关系，如下：

由式(10)系统状态变量与控制变量之间的关系可以表示为：

xk+1＝fk(xk,uk)+xk(11)

步骤3，系统下边界求解方法：定义k时刻能够允许系统达到终止状态下边界的最小状态变量值为该时刻的下边界约束xk,low，根据混合动力系统的电量平衡要求，系统终止状态的范围为控制目标是已知量，即：xn,low＝xf,min，xf,min为终止状态的下边界值，k＝n-1到k＝0时刻的系统状态下边界可以用后向迭代计算进行求解，如下：

考虑本系统的状态变量为soc，为[0,1]之间的正数，式(12)可以进一步改写为：

在后向迭代计算中，xk+1,low为已知量，初始值为xf,min，仅xk,low和uk为未知变量，可以利用不动点迭代方法进行求解xk,low，k时刻的下边界求解流程如下：

①初始化：其中j为k时刻计算状态量下边界的迭代次数索引；

②开始迭代计算，直到达到特定的容差：如下：

考虑状态变量soc的数量级，取容差ξ＝10^-5，在完成k时刻的下边界求解后，重复上述①②，继续求解得到k-1时刻的下边界，直到k＝0；

步骤4，系统上边界计算方法：用步骤3求解系统下边界的相同方法计算系统上边界；

第四步，动态规划算法向后寻优迭代计算：根据dp算法优化原理，结合式(5)的目标函数表达形式，系统的全局最优解转化为后向的优化序列，如下：

系统最终时刻n的成本为如式(15)，表示在约束范围内，各系统状态对应的瞬时成本及惩罚，

jn(xⁱ)＝ln(xⁱ)+gn(xⁱ)(15)

根据dp算法的后向优化原理，从k＝n-1到0的迭代计算可表示式(16)，

得到初始时刻各状态变量对应的最优控制路径后，从目标初始状态x0出发，根据各时刻状态变量与最优控制变量的对应关系，进行前向计算，即可确定的最优解。

本发明与现有技术相比，有益效果如下：

该方法在dp后向运寻优前，首先开展系统边界计算，获取每一时刻状态变量的边界约束，进而在后向迭代寻优过程中考虑边界约束，实现系统的电量平衡。通过边界约束的求解而不再需要罚函数，避免了为实现电量平衡所进行的大量调试工作，同时算法的鲁棒性不再受到模型参数、运行工况的影响，运算量和时间成本降低，显著提升了优化算法的效率。

附图说明

图1是本发明的优化方法流程图。

图2是本发明实施例的行星式混合动力系统构型图。

图3是本发明系统状态变量边界约束的计算流程图。

具体实施方式

下面结合附图对本发明作进一步说明：

如图1所示，终止状态受约束的行星式混合动力系统全局优化方法，其特征在于：

第一步，确定行星式混合动力系统全局优化目标函数及约束条件：行星式混合动力系统的全局优化问题表述为：

本实施例的行星式混合动力系统的构型如图2所示，由此得到行星式混合动力系统的成本函数和约束条件，如下：

式中，socn为目标soc值；sock(k)为当前时刻soc值，lfuel(k)为行星式混合动力系统的瞬时油耗，β为惩罚系数，ne_min与ne_max分别为发动机最小、最大转速，ng_minng_max分别为电机mg1的最小、最大转速，nm_min与nm_max分别为电机mg的最小、最大转速，te_min与te_max分别为，发动机最小、最大转矩，tg_min与tg_max分别为电机mg1的最小、最大转矩，tm_min与tm_max分别为电机mg2的最小、最大转矩，socmin与socmax分别为soc可行域的下限与上限；

第二步，采用动态规划算法离散全局优化目标函数：将式(1)、(2)所表示的优化问题转化为多阶段离散问题，如下：

xk+1＝fk(xk,uk),k＝0,1,...,n-1(6)

式(6)中，xk为离散状态变量，xk∈[xmin,xmax]，uk为离散控制变量，uk∈[umin,umax]，k为离散采样时间，将系统的控制率为π＝{μ0,μ1,....μn-1}，那么以π为控制率，初始状态x(0)＝x0时，离散系统的总成本表示为：

式(7)中，lk(xk,uk)是第k时刻采用控制变量uk，状态变量为xk时的系统瞬时成本，gk(xk)为第k时基于状态变量xk的惩罚量，表示为gk(xk)＝α(xf-xk)²，xf为系统终止时刻的目标状态，α为大于零的惩罚函数系数，ln(xn,un)+gn(xn)是系统在终止时刻的瞬时成本，代表0～n–1时刻的总成本；

基于上述离散系统的成本函数，进一步得到离散系统的最优化问题为：

式(8)中，π代表在目标工况下，所有可行控制规则的集合；

第三步，开展系统状态变量边界约束的计算：如图2所示，步骤1，采用等效内阻模型作为电池模型，可以得到电池电流和电池功率之间的关系：

式(9)中，电池开路电压e＝fu(soc)，是关于soc的函数，根据soc与电池容量、电流的关系：

式(10)中，e为电池开路电压，ibat为电流，rint为等效内阻，qbat为电容真实容量，qmax为电池最大容量，soc为电池荷电状态，由式(10)可以得到混合动力系统容量与电流的关系：

qbat(k+1)＝qbat(k)+ibatδt(11)

步骤2，确定系统状态变量与控制变量的关系：根据式(11)可以得到系统状态变量与控制变量的关系，如下：

由式(12)系统状态变量与控制变量之间的关系可以表示为：

xk+1＝fk(xk,uk)+xk(13)

考虑本系统的状态变量为soc，为[0,1]之间的正数，式(14)可以进一步改写为：

在后向迭代计算中，xk+1,low为已知量，初始值为xf,min，仅xk,low和uk为未知变量，可以利用不动点迭代方法进行求解xk,low，k时刻的下边界求解流程如下：

①初始化：其中j为k时刻计算状态量下边界的迭代次数索引；

②开始迭代计算，直到达到特定的容差：如下：

考虑状态变量soc的数量级，取容差ξ＝10^-5，在完成k时刻的下边界求解后，重复上述①②，继续求解得到k-1时刻的下边界，直到k＝0；

步骤4，系统上边界计算方法：用步骤3求解系统下边界的相同方法计算系统上边界；

第四步，动态规划算法向后寻优迭代计算：根据dp算法优化原理，结合式(7)的目标函数表达形式，系统的全局最优解转化为后向的优化序列，如下：

系统最终时刻n的成本为如式(17)，表示在约束范围内，各系统状态对应的瞬时成本及惩罚，

jn(xⁱ)＝ln(xⁱ)+gn(xⁱ)(17)

根据dp算法的后向优化原理，从k＝n-1到0的迭代计算可表示式(18)，

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾小华;王越;宋大凤;杨南南;朱丽燕;张学义;黄海瑞
技术所有人：吉林大学
我是此专利的发明人

上一篇：一种开口环形脉冲电容器的制作方法
上一篇：一种电容导电插片结构及生产方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、林老师：1.智能驾驶技术研究 2.智能汽车人机交互研究 3.自动驾驶预期功能安全及可靠性 4.驾驶功能与车辆动力学数据融合 5.驾驶场景大数据分析技术 6.车辆性能研究
2、朱老师：1.新能源汽车电驱动技术 2.轮毂电机驱动与控制 3.开关磁阻电机驱动系统控制 4.智能电动汽车
3、徐老师：1.内燃机节能及排放控制技术 2.汽车节能与新能源汽车技术 3. 车辆现代设计理论与方法
4、王老师：1.机械设计原理与方法 2.生理系统耦合及生物力学 3.康复工程学
5、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
如您是高校老师，可以点此联系我们加入专家库。