本发明涉及空调,特别是涉及一种空调节能策略的控制方法、装置、电子设备和存储介质。
背景技术:
1、节能空调控制策略确实是一个复杂的复合决策问题,它不仅需要权衡超调量和舒适度等性能指标,还必须将能耗纳入考量。传统的pid控制方法虽然在超调量和舒适度之间提供了一定的平衡,但在追求舒适度的同时,往往仍会出现较为显著的超调现象,导致控制策略的实施不够精准。
技术实现思路
1、鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种空调节能策略的控制方法、装置、电子设备和存储介质。
2、为了解决上述问题,本发明实施例公开了一种空调节能策略的控制方法,所述方法包括:
3、获取第一空调控制参数,所述第一空调控制参数包括目标温度、当前室内温度、上一时刻室内温度、所述空调设定为所述设定目标温度之后的运行时长和所述空调所在房间的房间负载;
4、将所述第一空调控制参数输入预设空调节能策略预测模型,得到空调节能策略,所述空调节能策略包括:预设空调动作和执行所述预设空调动作的概率;所述预设空调动作包括:提高压缩机频率至第一压缩机频率,降低压缩机频率至第二压缩机频率,或保持压缩机频率中的至少一种;
5、控制所述空调执行概率最大的目标预设空调动作;
6、获取第二空调控制参数,将所述第二空调控制参数输入预设制冷能力预测模型,得到所述空调的制冷能力;所述第二空调控制参数包括:目标预设空调动作对应的压缩机频率、当前室内温度、当前室外温度、当前湿度和所述目标温度;
7、获取第三空调控制参数,将所述第三空调控制参数输入预设房间负载预测模型,得到预测的房间负载;所述第三空调控制参数包括:所述空调的制冷能力、所述当前室内温度、所述当前室外温度、所述当前湿度和所述目标温度;
8、在下一时刻返回所述获取第一空调控制参数的步骤。
9、可选地,所述预设空调节能策略预测模型通过如下方式训练得到:
10、获取多个第一空调控制参数样本,所述第一空调控制参数样本包括目标温度样本、当前室内温度样本、上一时刻室内温度样本、所述空调设定为所述设定目标温度之后的运行时长样本和所述空调所在房间的房间负载样本;
11、分别将多个所述第一空调控制参数样本输入初始空调节能策略预测模型,得到空调节能策略,所述空调节能策略包括:预设空调动作和执行所述预设空调动作的概率;所述预设空调动作包括:提高压缩机频率至第一压缩机频率,降低压缩机频率至第二压缩机频率,或保持压缩机频率中的至少一种;确定所述空调执行概率最大的目标预设空调动作对应的执行概率和压缩机频率;
12、根据多个第一空调控制参数样本和所述多个第一空调控制参数样本对应的空调节能策略,训练所述初始空调节能策略预测模型。
13、可选地,所述多个第一空调控制参数样本包括第一时刻的第一空调控制参数样本和第二时刻的第一空调控制参数样本,所述根据多个第一空调控制参数样本和所述多个第一空调控制参数样本对应的空调节能策略,训练所述初始空调节能策略预测模型,包括:
14、将所述第二时刻的第一空调控制参数样本中的目标温度、当前室内温度、上一时刻室内温度和运行时长,输入预设价值网络,得到下一状态价值函数和当前状态价值函数;
15、根据所述下一状态价值函数、所述当前状态价值函数和预设奖励函数,构造优势函数;
16、根据所述优势函数、所述第一时刻的第一空调控制参数样本、所述第一时刻的目标预设空调动作对应的执行概率和压缩机频率、所述第二时刻的第一空调控制参数样本和所述第二时刻的目标预设空调动作对应的执行概率和压缩机频率,训练所述初始空调节能策略预测模型,得到所述预设空调节能策略预测模型。
17、可选地,所述根据所述下一状态价值函数、所述当前状态价值函数和预设奖励函数,构造优势函数,包括:
18、所述优势函数如下:
19、adv=r+γ*v-v′
20、其中,adv为优势函数,r为预设奖励函数,γ为折扣因子,v为下一状态价值函数,v′为当前状态价值函数。
21、可选地,所述预设奖励函数如下:
22、
23、其中,t为设定目标温度之后的运行时长,q为当前室内温度,q′为上一时刻室内温度,a为设定目标温度时的室内温度,b为目标温度。
24、可选地,所述根据所述优势函数、所述第一时刻的第一空调控制参数样本、所述第一时刻的目标预设空调动作对应的执行概率和压缩机频率、所述第二时刻的第一空调控制参数样本和所述第二时刻的目标预设空调动作对应的执行概率和压缩机频率,训练所述初始空调节能策略预测模型,训练所述初始空调节能策略预测模型,包括:
25、使用梯度法更新所述初始空调节能策略预测模型,以使所述优势函数收敛于如下式子:
26、min(rat(t)adv,clip(rat(t),(1-ε,1+∈))adv)
27、其中,rat(t)为比例因子,adv为优势函数。
28、可选地,所述比例因子通过如下式子得到:
29、
30、其中,πt为目标预设空调动作对应的执行概率,πt′为上一时刻的目标预设空调动作对应的执行概率,at为目标预设空调动作对应的压缩机频率,at′为上一时刻的目标预设空调动作对应的压缩机频率,st为目标预设空调动作对应的第一空调控制参数样本,st′为上一时刻的目标预设空调动作对应的第一空调控制参数样本。
31、可选地,所述预设制冷能力预测模型,根据如下方式训练得到:
32、获取制冷能力预测模型的样本数据,所述制冷能力预测模型的样本数据包括室内温度样本、室外温度样本、湿度样本、目标温度样本、内外风机转速样本和压缩机转速样本;
33、根据所述制冷能力预测模型的样本数据,对初始制冷能力预测模型进行训练,得到所述预设制冷能力预测模型。
34、可选地,所述预设房间负载预测模型,根据如下方式训练得到:
35、获取房间负载预测模型的样本数据,所述房间负载预测模型的样本数据包括室内温度样本、室外温度样本、湿度样本、目标温度样本和所述空调的制冷能力样本;
36、根据所述房间负载预测模型的样本数据,对初始房间负载预测模型进行训练,得到所述预设房间负载预测模型。
37、相应的,本发明实施例公开了一种空调节能策略的控制装置,所述装置包括:
38、第一空调控制参数获取模块,用于获取第一空调控制参数,所述第一空调控制参数包括目标温度、当前室内温度、上一时刻室内温度、所述空调设定为所述设定目标温度之后的运行时长和所述空调所在房间的房间负载;
39、空调节能策略确定模块,用于将所述第一空调控制参数输入预设空调节能策略预测模型,得到空调节能策略,所述空调节能策略包括:预设空调动作和执行所述预设空调动作的概率;所述预设空调动作包括:提高压缩机频率至第一压缩机频率,降低压缩机频率至第二压缩机频率,或保持压缩机频率中的至少一种;
40、控制执行模块,用于控制所述空调执行概率最大的目标预设空调动作;
41、制冷能力确定模块,用于获取第二空调控制参数,将所述第二空调控制参数输入预设制冷能力预测模型,得到所述空调的制冷能力;所述第二空调控制参数包括:目标预设空调动作对应的压缩机频率、当前室内温度、当前室外温度、当前湿度和所述目标温度;
42、房间负载预测模块,用于获取第三空调控制参数,将所述第三空调控制参数输入预设房间负载预测模型,得到下一时刻的室内温度和房间负载;所述第三空调控制参数包括:所述空调的制冷能力、所述当前室内温度、所述当前室外温度、所述当前湿度和所述目标温度;
43、循环模块,用于在下一时刻返回所述获取第一空调控制参数的步骤。
44、可选地,所述装置还包括:通过如下方式训练得到所述预设空调节能策略预测模型:
45、多个样本获取模块,用于获取多个第一空调控制参数样本,所述第一空调控制参数样本包括目标温度样本、当前室内温度样本、上一时刻室内温度样本、所述空调设定为所述设定目标温度之后的运行时长样本和所述空调所在房间的房间负载样本;
46、多个样本输入模块,用于分别将多个所述第一空调控制参数样本输入初始空调节能策略预测模型,得到空调节能策略,所述空调节能策略包括:预设空调动作和执行所述预设空调动作的概率;所述预设空调动作包括:提高压缩机频率至第一压缩机频率,降低压缩机频率至第二压缩机频率,或保持压缩机频率中的至少一种;确定所述空调执行概率最大的目标预设空调动作对应的执行概率和压缩机频率;
47、训练模块,用于根据多个第一空调控制参数样本和所述多个第一空调控制参数样本对应的空调节能策略,训练所述初始空调节能策略预测模型。
48、可选地,所述多个第一空调控制参数样本包括第一时刻的第一空调控制参数样本和第二时刻的第一空调控制参数样本,所述训练模块,包括:
49、状态价值函数确定子模块,用于将所述第二时刻的第一空调控制参数样本中的目标温度、当前室内温度、上一时刻室内温度和运行时长,输入预设价值网络,得到下一状态价值函数和当前状态价值函数;
50、优势函数构造子模块,用于根据所述下一状态价值函数、所述当前状态价值函数和预设奖励函数,构造优势函数;
51、训练子模块,用于根据所述优势函数、所述第一时刻的第一空调控制参数样本、所述第一时刻的目标预设空调动作对应的执行概率和压缩机频率、所述第二时刻的第一空调控制参数样本和所述第二时刻的目标预设空调动作对应的执行概率和压缩机频率,训练所述初始空调节能策略预测模型,得到所述预设空调节能策略预测模型。
52、可选地,所述优势函数构造子模块,包括:
53、优势函数构造单元,用于所述优势函数如下:
54、adv=r+γ*v-v′
55、其中,adv为优势函数,r为预设奖励函数,γ为折扣因子,v为下一状态价值函数,v′为当前状态价值函数。
56、可选地,所述优势函数构造子模块中的预设奖励函数如下:
57、
58、其中,t为设定目标温度之后的运行时长,q为当前室内温度,q′为上一时刻室内温度,a为设定目标温度时的室内温度,b为目标温度。
59、可选地,所述训练子模块,包括:
60、训练单元,用于使用梯度法更新所述初始空调节能策略预测模型,以使所述优势函数收敛于如下式子:
61、min(rat(t)adv,clip(rat(t),(1-ε,1+∈))adv)
62、其中,rat(t)为比例因子,adv为优势函数。
63、可选地,所述训练单元,包括:
64、训练子单元,用于通过如下式子得到比例因子:
65、
66、其中,πt为目标预设空调动作对应的执行概率,πt,为上一时刻的目标预设空调动作对应的执行概率,at为目标预设空调动作对应的压缩机频率,at′为上一时刻的目标预设空调动作对应的压缩机频率,st为目标预设空调动作对应的第一空调控制参数样本,st′为上一时刻的目标预设空调动作对应的第一空调控制参数样本。
67、可选地,所述制冷能力确定模块,包括:根据如下方式训练得到预设制冷能力预测模型:
68、第一样本数据获取子模块,用于获取制冷能力预测模型的样本数据,所述制冷能力预测模型的样本数据包括室内温度样本、室外温度样本、湿度样本、目标温度样本、内外风机转速样本和压缩机转速样本;
69、第一训练子模块,用于根据所述制冷能力预测模型的样本数据,对初始制冷能力预测模型进行训练,得到所述预设制冷能力预测模型。
70、可选地,所述房间负载预测模块,包括:根据如下方式训练得到所述预设房间负载预测模型:
71、第二样本数据获取子模块,用于获取房间负载预测模型的样本数据,所述房间负载预测模型的样本数据包括室内温度样本、室外温度样本、湿度样本、目标温度样本和所述空调的制冷能力样本;
72、第二训练子模块,用于根据所述房间负载预测模型的样本数据,对初始房间负载预测模型进行训练,得到所述预设房间负载预测模型。
73、相应的,本发明实施例公开了一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述空调节能策略的控制方法实施例的各个步骤。
74、相应的,本发明实施例公开了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述空调节能策略的控制方法实施例的各个步骤。
75、本发明实施例包括以下优点:
76、本发明实施例通过将所述第一空调控制参数输入预设空调节能策略预测模型,得到空调节能策略,然后将所述第二空调控制参数输入预设制冷能力预测模型,得到所述空调的制冷能力,将所述第三空调控制参数输入预设房间负载预测模型,得到预测的房间负载,最后在下一时刻返回所述获取第一空调控制参数的步骤。本发明实施例通过预设制冷能力预测模型,得到所述空调的制冷能力,以及预设房间负载预测模型,得到预测的房间负载,通过结合不同的空调的制冷能力以及对于负载的精准估计,使用预设空调节能策略预测模型输出控制策略,可以使控制策略的精度进一步提升,从而实现超调、舒适度、经济性等参数的最佳平衡。