本发明属于pemfc喷射式供气系统运行控制领域,尤其涉及基于学习的pemfc喷射式供气系统控制策略生成方法及系统。
背景技术:
1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
2、质子交换膜燃料电池(proton exchange membrane fuel cell,pemfc)具有能量利用率高、低温启动、无污染的优点,已广泛应用于航空航天、汽车等领域。pemfc喷射式供气系统使氢气、空气过量供应从而避免氢、氧饥饿导致的电池寿命衰减现象,同时利用喷射器代替氢循环泵循环未反应的氢气,依靠氢气循环排出反应生成的水,避免了水淹现象,同时提高了氢气利用率。然而,pemfc喷射式供气系统是一个具有强非线性、多变量、强耦合的高度复杂系统,难以对其进行精确建模,传统的基于模型的控制策略将导致系统运行时面临效率低下、违反安全约束等诸多严重问题。
技术实现思路
1、为了解决上述背景技术中存在的至少一项技术问题,本发明提供基于学习的pemfc喷射式供气系统控制策略生成方法及系统,其通过将pemfc喷射式供气系统模型描述为标称线性系统模型与高斯过程回归在线学习模型相结合的混合模型,其次利用在线学习字典数据点管理技术实现高斯过程回归在线学习模型的快速在线更新,从而实现对pemfc喷射式供气系统的精确建模,然后提出基于学习的随机模型预测控制器实现喷射式pemfc供气系统的安全持久高效运行。
2、为了实现上述目的,本发明采用如下技术方案:
3、本发明的第一个方面提供基于学习的pemfc喷射式供气系统控制策略生成方法,包括如下步骤:
4、获取pemfc喷射式供气系统的控制输入和状态变量数据点;
5、基于pemfc喷射式供气系统的控制输入和状态变量数据点,将pemfc喷射式供气系统模型描述为标称线性系统模型与高斯过程回归在线学习模型相结合的混合模型;
6、建立喷射式pemfc系统运行过程中给定容量的字典数据集,对字典数据集在线管理更新高斯过程回归在线学习模型;
7、基于混合模型,在每次采样时刻,高斯过程近似根据残差模型的不确定性和过程噪声得到随机模型,通过不确定性传播近似求解pemfc喷射式供气系统随机最优控制问题,得到最优控制策略,根据最优控制策略控制pemfc喷射式供气系统运行。
8、本发明的第二个方面提供基于学习的pemfc喷射式供气系统控制策略生成系统,包括:
9、数据获取模块,其被配置为获取pemfc喷射式供气系统的控制输入和状态变量数据点;
10、混合模型构建过程,其被配置为基于pemfc喷射式供气系统的控制输入和状态变量数据点,将pemfc喷射式供气系统模型描述为标称线性系统模型与高斯过程回归在线学习模型相结合的混合模型;
11、在线更新模块,其被配置为建立喷射式pemfc系统运行过程中给定容量的字典数据集,对字典数据集在线管理更新高斯过程回归在线学习模型;
12、控制策略生成模块,其被配置为基于混合模型,在每次采样时刻,高斯过程近似根据残差模型的不确定性和过程噪声得到随机模型,通过不确定性传播近似求解pemfc喷射式供气系统随机最优控制问题,得到最优控制策略,根据最优控制策略控制pemfc喷射式供气系统运行。
13、本发明的第三个方面提供一种计算机可读存储介质。
14、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于学习的pemfc喷射式供气系统控制策略生成方法中的步骤。
15、本发明的第四个方面提供一种计算机设备。
16、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于学习的pemfc喷射式供气系统控制策略生成方法中的步骤。
17、与现有技术相比,本发明的有益效果是:
18、1、针对pemfc喷射式供气系统具有多变量、非线性、强耦合的复杂模型特性,难以建立精确模型的问题,本发明提出将pemfc喷射式供气系统模型描述为标称线性系统模型与高斯过程回归在线学习模型相结合的混合模型,解决了模型建模中的未建模动态与扰动问题;首先利用收集到的数据集建立标称线性系统模型,然后利用高斯过程回归技术建立在线学习模型,从而得到精确的pemfc喷射式供气系统动力学模型。
19、2、针对高斯过程回归技术随数据点增多而带来的计算困难的问题,本发明提出在线学习字典数据点管理技术,首先根据给出的数据点距离度量实现字典数据点的添加与删除,然后提出数据点滤波器过滤异常数据点,从而实现高斯过程回归在线学习模型的快速更新。
20、3.针对pemfc喷射式供气系统难以进行安全的高性能控制的问题,本发明提出pemfc喷射式供气系统基于学习的随机模型预测控制方案,该方案使用pemfc喷射式供气系统混合在线学习模型,利用实验或运行过程中收集的数据,通过随机模型预测控制器与不确定性传播近似技术实现在不违反安全约束的情形下增强系统的性能。
21、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
1.基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,所述基于pemfc喷射式供气系统测试数据,将pemfc喷射式供气系统模型描述为标称线性系统模型与高斯过程回归在线学习模型相结合的混合模型,包括:
3.如权利要求1所述的基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,所述对字典数据集在线管理,包括:
4.如权利要求3所述的基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,所述基于每个字典数据点的距离度量进行字典数据点的添加与删除,包括:
5.如权利要求1所述的基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,所述通过不确定性传播近似求解pemfc喷射式供气系统随机最优控制问题,得到最优控制策略,包括:
6.如权利要求1所述的基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,所述不确定性传播的近似包括:在每次采样时刻将pemfc喷射式供气系统的状态、输入和非线性扰动近似为联合高斯分布,从而给出高斯过程回归的均值、方差的预测更新公式。
7.如权利要求1所述的基于学习的pemfc喷射式供气系统控制策略生成方法,其特征在于,所述pemfc喷射式供气系统测试数据包括pemfc喷射式供气系统的控制输入和pemfc喷射式供气系统的状态变量,所述pemfc喷射式供气系统的控制输入包括空压机电压,氢压力调节阀设定值和回氢调节阀设定值;
8.基于学习的pemfc喷射式供气系统控制策略生成系统,其特征在于,包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于学习的pemfc喷射式供气系统控制策略生成方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于学习的pemfc喷射式供气系统控制策略生成方法中的步骤。