本申请涉及温度控制,尤其涉及一种学习模型的训练方法、温度控制方法、装置和电子设备。
背景技术:
1、在混和动力车辆中,车辆中的发动机、空调组件和动力电池间存在热量融合管理的过程,以在实现节能的情况下,进行精准的温度控制,而现有技术中的温度融合管理策略是基于规则的方法标定热管理控制的策略,工作量较大,而人工标定的方式准确性也较低,使得温度控制的效率和准确度较低。
技术实现思路
1、本申请提出一种学习模型的训练方法、温度控制方法、装置和电子设备,通过训练学习模型,使得模型学习到车辆状态和热管理控制指令间的对应关系,提高了温度控制的效率和准确性。
2、本申请一方面实施例提出了一种学习模型的训练方法,包括:
3、获取多个训练样本,各个所述训练样本包含车辆的第一状态;所述第一状态包含所述车辆上的热管理部件控制的被控对象的温度,以及车辆工况信息;
4、将所述第一状态,输入学习模型,预测得到热管理控制指令;
5、根据所述热管理控制指令,控制车辆中相应热管理部件,以确定所述车辆的第二状态;
6、根据所述第二状态、所述第一状态和所述热管理控制指令,确定所述学习模型的损失函数;
7、根据所述损失函数,对所述学习模型进行训练。
8、本申请一方面实施例提出了一种温度控制方法,包括:
9、获取车辆的第一状态,其中,所述第一状态包含所述车辆的热管理部件控制的被控对象的温度,以及车辆工况信息;
10、根据所述状态,采用经过训练的学习模型,预测得到热管理控制指令;其中,所述学习模型是采用前述一方面所述的方法训练得到的;
11、根据所述热管理控制指令,控制车辆中相应热管理部件,以确定所述车辆的第二状态。
12、本申请另一方面方面实施例提出了一种学习模型的训练装置,包括:
13、获取模块,用于获取多个训练样本,各个所述训练样本包含车辆的第一状态;所述第一状态包含所述车辆上的热管理部件控制的被控对象的温度,以及车辆工况信息;
14、预测模块,用于将所述第一状态,输入学习模型,预测得到热管理控制指令;
15、调整模块,用于根据所述热管理控制指令,控制车辆中相应热管理部件,以确定所述车辆的第二状态;
16、确定模块,用于根据所述第二状态、所述第一状态和所述热管理控制指令,确定所述学习模型的损失函数;
17、训练模型,用于根据所述损失函数,对所述学习模型进行训练。
18、本申请另一方面方面实施例提出了一种温度控制装置,包括:
19、获取模块,用于获取车辆的第一状态,其中,所述第一状态包含所述车辆的热管理部件控制的被控对象的温度,以及车辆工况信息;
20、预测模块,用于根据所述状态,采用经过训练的学习模型,预测得到热管理控制指令;其中,所述学习模型是采用前述另一方面所述的学习模型的训练装置训练得到的;
21、确定模块,用于根据所述热管理控制指令,控制车辆中相应热管理部件,以确定所述车辆的第二状态。
22、本申请另一方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述一方面所述的方法或前述另一方面所述的方法。
23、本申请另一方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述一方面所述的方法或前述另一方面所述的方法。
24、本申请另一方面实施例提出了一种计算机程序产品,其上存储有计算机程序,所述程序被处理器执行时实现如前述一方面所述的方法或前述另一方面所述的方法。
25、本申请提出的学习模型的训练方法、温度控制方法、装置和电子设备,获取多个训练样本,各个训练样本包含车辆的第一状态,将第一状态,输入学习模型,预测得到热管理控制指令,根据热管理控制指令,控制车辆中相应热管理部件,以确定车辆的第二状态,根据第二状态、第一状态和热管理控制指令,确定学习模型的损失函数,根据损失函数,对学习模型进行训练,通过对学习模型进行训练,使得训练得到的学习模型可以基于车辆的状态准确预测得到该状态下对应的热管理控制指令,以实现对车辆上的热管理部件控制的被控对象的温度进行准确控制,提高了温度控制的准确性和效率。
26、本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
1.一种学习模型的训练方法,其特征在于,所述方法,包括:
2.如权利要求1所述的方法,其特征在于,所述学习模型包含评价网络和预测网络,所述根据所述第二状态、所述第一状态和所述热管理控制指令,确定所述学习模型的损失函数,包括:
3.如权利要求1所述的方法,其特征在于,所述根据所述第一状态、所述热管理控制指令和所述第二状态,确定所述评价网络的损失函数和所述预测网络的损失函数,包括:
4.如权利要求3所述的方法,其特征在于,所述根据所述第二状态、所述热管理控制指令和所述目标状态,确定实际收益值,包括:
5.如权利要求4所述的方法,其特征在于,所述第一状态中被控对象,包含所述车辆的发动机和电机中的至少一个,以及车辆的乘员舱和电池。
6.如权利要求5所述的方法,其特征在于,所述车辆工况信息包含所述电池剩余电量,在所述电池剩余电量指示电池不处于低电的情况下,所述第二状态中所述被控对象的温度,包含所述发动机、所述电机和所述乘员舱对应的温度,所述根据所述第二状态和所述目标状态之间的差异,与对应的收益值间的映射关系,确定实际第一局部收益值,包括:
7.如权利要求5所述的方法,其特征在于,所述车辆工况信息包含所述电池剩余电量,在所述电池剩余电量指示电池处于低电的情况下,第二状态中被控对象的温度,包含所述发动机、电机、所述乘员舱和所述电池对应的温度,所述根据所述第二状态和所述目标状态之间的差异,与对应的收益值间的映射关系,确定实际第一局部收益值,包括:
8.一种温度控制方法,其特征在于,所述方法包括:
9.一种学习模型的训练装置,其特征在于,包括:
10.一种温度控制装置,其特征在于,包括:
11.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-7中任一所述的方法,或实现如权利要求8中任一所述的方法。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法,或实现如权利要求8中任一所述的方法。