基于seq2seq的数据中心能效优化连续决策方法与流程

文档序号:21364717发布日期:2020-07-04 04:39阅读:246来源:国知局
基于seq2seq的数据中心能效优化连续决策方法与流程

本发明涉及数据挖掘和机器学习领域,具体涉及一种基于seq2seq的数据中心能效优化连续决策方法。



背景技术:

近些年,随着云服务、大数据、ai计算等技术的发展,企业和政府投建了大量的数据中心,然而这些数据中心能耗普遍较高,平均pue值(评价数据中心能源效率的指标)在2.2~3.0之间。据有关部门统计,我国数据中心的用电量约占全社会用电总量的3%,而且这个比例正在逐年升高。

目前,对于数据中心节能减排方面的研究有许多,通常采用现有的或新开发能耗模拟软件模拟数据中心的能耗状况,以辅助数据中心的设计决策与能效优化。但这些研究大多偏向于研究数据中心在设计阶段的节能潜力,并未考虑数据中心投入使用后的能效优化问题。比如,2016年谷歌工程师提出了一种深度学习的模型预测控制方法,该方法通过寻找数据中心暖通系统控制点与pue的关系,从而帮助暖通工程师更好地对暖通系统进行控制优化。然而现有的这些能效优化方法存在以下两个缺陷:

1、没有考虑暖通系统水循环的时序关系,只能够根据暖通系统的当前运行环境预测暖通系统的当前能耗情况,而无法对暖通系统未来的能耗情况进行预测及决策优化;

2、仅能够在单个时间步内对暖通系统做局部的决策优化,而无法在连续时间步内对暖通系统整体作出最优决策,对于数据中心的节能减排效果很有限。



技术实现要素:

本发明的目的在于提供一种seq2seq的数据中心能效优化连续决策方法,以解决上述技术问题。

为达此目的,本发明采用以下技术方案:

提供一种基于seq2seq的数据中心能效优化连续决策方法,包括如下步骤:

步骤s1,基于循环神经网络的seq2seq结构建立暖通系统水循环的时序模型;

步骤s2,对所述时序模型进行性能评估;

步骤s3,利用性能符合预期的所述时序模型对所述暖通系统全局进行有约束的连续运行策略优化。

作为本发明的一种优选方案,所述步骤s1中,构建所述时序模型具体包括如下步骤:

步骤s11,使用oh-lstmcell神经网络结构搭建多层的encoder模型;

步骤s12,设置所述encoder模型的输入序列为(x+oh,m),设置所述encoder模型的输出序列为(y1+oh,m);

x用于表示所述暖通系统在一指定时间段内的历史时序信息;

oh用于表示所述暖通系统在所述指定时间段内的可观测隐变量;

x+oh为在所述指定时间段内输入所述encoder模型的所述历史时序信息和特征信息组合的组合特征;

y1用于表示所述encoder模型的预测目标;

y1+oh表示所述encoder模型的输出包含所述预测目标y1和所述可观测隐变量oh;

m用于表示所述encoder模型的输入序列或输出序列的时间步的步数;

步骤s13,设置所述encoder模型的loss函数;

步骤s14,根据所述步骤s12设置的序列结构,构建所述encoder模型的训练数据,然后以所述训练数据为模型训练样本,训练形成所述encoder模型;

步骤s15,裁剪所述encoder模型的输入序列为(x+oh,m),裁剪所述encoder模型的输出序列为(y1+oh,1);

“1”表示所述encoder模型最后输出的单个所述时间步;

步骤s16,使用所述oh-lstmcell神经网络结构构建多层的decoder模型;

步骤s17,设置所述decoder模型的输入序列为(x+oh,m),设置所述decoder模型的输出序列为(y2+oh,n);

n用于表示所述decoder模型输出的所述时间步的步数;

y2用于表示所述decoder模型的的预测目标;

y2+oh表示所述decoder模型的输出包含所述预测目标y2和所述可观测隐变量oh;

步骤s18,设置所述decoder模型的loss函数;

步骤s19,根据所述步骤s12和所述步骤s17设置的序列结构,构建encoder-decoder模型的训练数据;

步骤s20,将所述encoder模型的模型参数迁移到所述decoder模型,并以所述步骤s19构建的所述训练数据为训练样本,训练形成所述encoder-decoder模型作为所述时序模型;

步骤s21,裁剪所述encoder-decoder模型的输入序列为(x+oh,m+n),裁剪所述encoder-decoder模型的输出序列为(y2,n),

m+n用于表示所述encoder-decoder模型的输入序列包含m+n个所述时间步。

作为本发明的一种优选方案,所述特征信息至少包括所述可观测隐变量。

作为本发明的一种优选方案,所述步骤s13中,将所述encoder模型的loss函数设置为对所述encoder模型的输出序列loss作加权平均运算。

作为本发明的一种优选方案,所述步骤s18中,将所述decoder模型的loss函数设置为对所述decoder模型的输出序列loss作平均运算。

作为本发明的一种优选方案,所述步骤s2中,对所述时序模型进行性能评估的方法包括连续敏感度曲线分析评估方法,所述连续敏感度曲线分析评估方法具体包括如下步骤:

步骤l1,随机抽取指定连续步长的样本列表作为所述encoder模型的输入;

步骤l2,选择需要分析评估的n个敏感度参数;

步骤l3,构造敏感度参数的参数整数列表;

步骤l4,将所述参数整数列表与所述步骤l1指定的所述连续步长内的第t个时间步输入到所述encoder模型的输入序列进行笛卡尔积组合,以构造n组所述decoder模型的输入序列;

步骤l5,将所述encoder模型的输入序列与n组所述decoder模型的输入序列进行笛卡尔积组合,构造n组所述encoder-decoder模型的输入序列;

步骤l6,将所述步骤l5构造的n组所述encoder-decoder模型的输入序列作为所述encoder-decoder模型的输入,获取所述encoder-decoder模型的输出;

步骤l7,根据所述encoder-decoder模型的输出画出可表征所述暖通系统在指定的所述连续步长的时间段内能耗情况的时序分布曲线。

作为本发明的一种优选方案,所述步骤s2中,对所述时序模型进行性能评估的方法包括时延敏感度曲线分析评估方法,所述时延敏感度曲线分析评估方法具体包括如下步骤:

步骤m1,随机抽取m段指定连续步长的样本列表组作为所述encoder模型的输入;

步骤m2,选择需要分析评估的n个敏感度参数;

步骤m3,构造敏感度参数的参数整数列表;

步骤m4,将所述参数整数列表与所述encoder模型的m组输入序列进行笛卡尔积组合,构造n*m组所述decoder模型的输入序列;

步骤m5,将n*m组中每组的所述敏感度参数与指定的所述连续步长内的第t个时间步输入到所述encoder模型的输入序列进行笛卡尔积组合,以构造n*m组所述encoder-decoder模型的输入序列;

步骤m6,将所述步骤m5构造的n*m组所述encoder-decoder模型的输入序列作为所述encoder-decoder模型的输入,获取所述encoder-decoder模型的输出;

步骤m7,根据所述encoder-decoder模型的输出画出可表征所述暖通系统在不同时间段下能耗情况的时序分布曲线。

作为本发明的一种优选方案,随机抽取的所述连续步长的步数为30个所述时间步。

作为本发明的一种优选方案,t=30。

作为本发明的一种优选方案,所述步骤s3中,根据所述时序模型对所述暖通系统的运行策略进行有约束的全局连续优化的过程包括如下步骤:

步骤n1,在当前时刻提取所述暖通系统的历史样本数据,以构造所述decoder模型在连续的j个历史时间步中的控制参数组合候选集,j为≥1的自然数;

步骤n2,构造k组所述控制参数组合候选集;

步骤n3,将k组所述控制参数组合候选集与环境参数相结合,以构造出m组所述decoder模型的输入序列;

步骤n4,将所构造的k组所述decoder模型的输入序列和同样为k组的所述encoder模型的输入序列相结合,构造k组所述encoder-decoder模型的输入序列;

步骤n5,将所述步骤n4构造的k组所述encoder-decoder模型的输入序列输入到所述encoder-decoder模型中,输出对所述暖通系统输出功率的预测结果;

步骤n6,根据所述预测结果,剔除不符合约束条件的所述控制参数组合候选集;

步骤n7,在剩余符合所述约束条件的至少一组所述控制参数组合候选集中选择所述暖通系统预测输出功率最低的所述控制参数组合候选集作为所述暖通系统在所述当前时刻的下一个所述时间步的控制参数集并下发给所述暖通系统中的对应设备,所述暖通系统中的各所述设备根据下发的控制参数运行;

步骤n8,在所述当前时刻的下一个所述时间步内重复所述步骤n1~n7,以对所述暖通系统全局的运行状态进行连续优化决策。

本发明针对暖通系统特性,将暖通系统的自相关时序特征作为可观测隐变量加入到lstm-cell模型训练网络,训练形成的时序模型能够对暖通系统整体进行有约束的连续运行策略优化,解决了目前各种能效优化方法无法预测暖通系统未来能耗情况以及无法在连续时间步内对暖通系统整体作出最优决策的技术问题,大幅提高了数据中心的节能减排效果。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例所述的基于seq2seq的数据中心能效优化连续决策方法的方法步骤图;

图2是构建所述时序模型的方法步骤图;

图3是应用所述连续敏感度曲线分析评估方法评估所述时序模型的方法步骤图;

图4是应用所述时延敏感度曲线分析评估方法评估所述时序模型的方法步骤图;

图5是根据所述时序模型对所述暖通系统的运行策略进行有约束的全局连续优化的方法步骤图;

图6是本发明改进的oh-lstmcell神经网络结构的示意图;

图7是所述encoder-decoder模型的结构示意图;

图8是通过所述连续敏感度曲线分析评估方法作出的时序分布曲线示意图一;

图9是通过所述连续敏感度曲线分析评估方法作出的时序分布曲线示意图二;

图10是通过所述时延敏感度曲线分析评估方法作出的时序分布曲线示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。

在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

本发明针对暖通系统特性,将暖通系统的自相关时序特征作为可观测隐变量加入到lstm-cell模型训练网络,训练形成的时序模型能够对暖通系统整体进行有约束的连续运行策略优化,解决了目前各种能效优化方法无法预测暖通系统未来能耗情况以及无法在连续时间步内对暖通系统整体作出最优决策的技术问题,大幅提高了数据中心的节能减排效果。

本发明实施例提供的一种基于seq2seq的数据中心能效优化连续决策方法,请参照图1,该方法包括如下步骤:

步骤s1,基于循环神经网络的seq2seq结构建立暖通系统水循环的时序模型;

步骤s2,对时序模型进行性能评估;

步骤s3,利用性能符合预期的时序模型对暖通系统全局进行有约束的连续运行策略优化。

请参照图2,步骤s1中,构建时序模型具体包括如下步骤:

步骤s11,使用oh-lstmcell神经网络结构搭建多层的encoder模型,具体地,通过oh-lstmcell神经网络的keras框架搭建encoder模型;oh-lstmcell神经网络结构是本发明基于现有的lstm(长短期记忆网络)神经网络改进的一种时间循环神经网络结构。本发明的改进点在于:在lstm中加入oh(observedhiddenvariable)的peephole,使得时序模型的输出y可以通过peephole窥探闭环信息并反馈给隐藏层状态(hiddenstates)。oh是暖通系统水循环的可观测隐变量(如进出水温度、压力等与暖通系统输出功率有间接影响的相关变量)。peephole是指为自回归变量建立计算通道,即先预测和暖通系统输出功率相关的变量(如进出水温度、压力等),然后根据这些自回归变量的变量值最终得到所要预测的功率值。oh即为自回归变量。

oh-lstmcell神经网络结构示意图请参照图6。图6中,xt表示当前时间点暖通系统的参数向量(暖通系统控制参数形成的向量);

oht表示当前时间点暖通系统的可观测隐变量;

ht表示当前时间的隐藏变量;

ohht为oht与ht融合后(拼接)的隐藏层输出;

c为lstm神经网络的记忆神经元。

图7示出了本发明所述的encoder-decoder模型的结构示意图。请继续参照图2,并请参照图7,完成步骤s11的encoder模型搭建后进入步骤s12,

步骤s12,设置encoder模型的输入序列为(x+oh,m),设置encoder模型的输出序列为(y1+oh,m);

x用于表示暖通系统在某段时间内的历史时序信息;

oh用于表示暖通系统在该指定时间段内的可观测隐变量;

x+oh为在所述指定时间段内输入encoder模型的历史时序信息和特征信息组合的组合特征;其中特征信息至少包括了可观测隐变量oh,另外特征信息一般还包括暖通系统冷却塔、冷却泵、冷机等设备的工作频率、外界温湿度等特征;

y1用于表示encoder模型的预测目标;

y1+oh表示encoder模型的输出包含预测目标y1和可观测隐变量oh;

m用于表示encoder模型的输入序列或输出序列的序列长度,本实施例中输入或输出序列的长度为encoder模型输入或输出的时间步的步数。

步骤s13,设置encoder模型的loss函数。优选地,将encoder模型的loss函数设置为对encoder模型的输出序列loss(损失)作加权平均运算。

步骤s14,根据步骤s12设置的序列结构,构建encoder模型的训练数据,然后以构建的训练数据为模型训练样本,训练形成encoder模型;这里的训练数据包括暖通系统的历史时序信息以及暖通系统的特征信息,其中特征信息至少包括可观测隐变量oh。

步骤s15,裁剪encoder模型的输入序列为(x+oh,m),裁剪encoder模型的输出序列为(y1+oh,1);裁剪encoder模型的输入和输出序列目的是为decoder模型预测做数据准备。由于decoder模型预测所需的隐变量是随时间步一步一步分步输出的,所以decoder模型的输入只需要encoder模型最后一步的输出,所以encoder模型的输出序列(y1+oh,1)中的数字“1”表示encoder模型在某一段时间内最后输出的单个时间步。

步骤s16,使用oh-lstmcell神经网络结构构建多层的decoder模型,构建过程与encoder模型构建过程一致,在此不再赘述;

步骤s17,设置decoder模型的输入序列为(x+oh,m),设置decoder模型的输出序列为(y2+oh,n);

n用于表示decoder模型输出的时间步的步数;

y2用于表示decoder模型的预测目标;

y2+oh表示decoder模型的输出包含预测目标y2和可观测隐变量oh;

步骤s18,设置decoder模型的loss函数;优选地,将decoder模型的loss函数设置为对decoder模型的输出序列loss作平均运算。

步骤s19,根据步骤s12和步骤s17设置的序列结构,构建encoder-decoder模型的训练数据;训练数据包括暖通系统的历史时序信息以及暖通系统的特征信息,其中特征信息至少包括可观测隐变量oh。

步骤s20,将encoder模型的模型参数迁移到decoder模型,并以步骤s19构建的训练数据为训练样本,训练形成encoder-decoder模型作为时序模型;

步骤s21,裁剪encoder-decoder模型的输入序列为(x+oh,m+n),裁剪encoder-decoder模型的输出序列为(y2,n),

m+n用于表示encoder-decoder模型的输入序列包含m+n个时间步。

为了测试时序模型的性能,本发明提供了一种连续敏感度曲线分析评估方法,请参照图3,该连续敏感度曲线分析评估方法具体包括如下步骤:

步骤l1,随机抽取指定连续步长的样本列表作为encoder模型的输入,样本列表中的数据为用于构建时序模型的训练数据;另外优选地,连续步长的步数为30,也就是随机抽取暖通系统在连续30个时间步的样本数据。

步骤l2,选择需要分析评估的n个敏感度参数,敏感度参数指工业场景中可调的控制参数,比如暖通系统中各种泵的频率、风机频率等。

步骤l3,构造敏感度参数的参数整数列表;敏感度参数整数列表是根据敏感度参数的实际控制范围作出的,比如风机的可控频率为[30,50]。

步骤l4,将参数整数列表与步骤l1指定的连续步长内的第t个时间步输入到encoder模型的输入序列进行笛卡尔积组合,以构造n组decoder模型的输入序列;若指定的连续时间步的步长为30,t的取值优选为30,也就是参数整数列表与指定连续步长的最后一个时间步输入到encoder模型的输入序列进行笛卡尔积组合。

步骤l5,将encoder模型的输入序列与n组decoder模型的输入序列进行笛卡尔积组合后,以构造n组encoder-decoder模型的输入序列;这里需要说明的是,并非对encoder模型的输入序列与n组decoder模型的输入序列直接进行组合,而是通过将encoder模型在指定的连续步长内的最后一个时间步输出的输出序列与n组decoder模型的输入序列进行笛卡尔积组合,得到n组encoder-decoder模型的输入序列。由于encoder模型的输出序列通过输入序列预测而得,所以步骤l5中为了表述更加清楚,将构造encoder-decoder模型的输入序列的过程概括为将encoder模型的输入序列与n组decoder模型的输入序列进行笛卡尔积组合。另外,构造n组encoder-decoder模型的输入而非构造一组输入,是为了增加模型性能评估结果的置信度。

步骤l6,将步骤l5构造的n组encoder-decoder模型的输入序列作为encoder-decoder模型的输入,获取encoder-decoder模型的输出。

步骤l7,根据encoder-decoder模型的输出画出可表征暖通系统在指定的连续步长的时间段内能耗情况的时序分布曲线。

通过连续敏感度曲线分析评估方法得到的时序分布曲线示意图请参照图8和图9。

本发明还另外提供了一种模型性能评估方法,该方法为时延敏感度曲线分析评估方法,请参照图4,时延敏感度曲线分析评估方法对时序模型进行性能评估的具体过程包括如下步骤:

步骤m1,随机抽取m段指定连续步长的样本列表组作为encoder模型的输入;样本列表组中包括m组样本列表,样本列表中的数据为用于构建时序模型的训练数据;优选地,指定的连续步长的时间步(步长)为30,这样可确保数据的充分性。

步骤m2,选择需要分析评估的n个敏感度参数。

步骤m3,构造敏感度参数的参数整数列表。

步骤m4,将参数整数列表与encoder模型的m组输入序列进行笛卡尔积组合,构造n*m组decoder模型的输入序列;decoder模型的输入序列的构造过程同连续敏感度曲线分析评估方法中的步骤l4,在此不再赘述。

步骤m5,将n*m组中每组的敏感度参数与指定的连续步长内的第t个时间步输入到encoder模型的输入序列进行笛卡尔积组合,以构造n*m组encoder-decoder模型的输入序列;t同样优选为30,也就是n*m组中每组的敏感度参数与当前时间段的连续步长的最后一个时间步输入到encoder模型的输入序列进行笛卡尔积组合。

步骤m6,将步骤m5构造的n*m组输入序列作为encoder-decoder模型的输入,获取encoder-decoder模型的输出。

步骤m7,根据encoder-decoder模型的输出画出可表征暖通系统在不同时间段下能耗情况的时序分布曲线。

通过时延敏感度曲线分析评估方法得到的时序分布曲线示意图请参照图10。

请继续图5,步骤s3中,根据所训练的时序模型对暖通系统的运行策略进行有约束的全局连续优化的过程具体包括如下步骤:

步骤n1,在当前时刻提取暖通系统的历史样本数据,以构造decoder模型在连续的j个历史时间步中的控制参数组合候选集,j为≥1的自然数;历史样本数据包括暖通系统在历史时间步的各种控制参数;当前时刻指需要对暖通系统进行全局连续优化的时刻;

步骤n2,构造k组控制参数组合候选集;一组控制参数组合候选集中包括指定时间步的控制参数,比如包括j个时间步的控制参数,每一个时间步的控制参数可能不不一致;

步骤n3,将k组控制参数组合候选集与环境参数相结合,以构造出m组decoder模型的输入序列;环境参数为暖通系统运行的温湿度信息等;控制参数组合候选集与环境参数的结合方法是两者进行数学上的拼接,现有的数据拼接方式有许多,所以具体拼接过程在此不作阐述;

步骤n4,将构造的k组decoder模型的输入序列和同样为k组的encoder模型的输入序列相结合,构造k组encoder-decoder模型的输入序列;关于encoder-decoder模型的输入序列的构造方法如在连续敏感度曲线分析评估方法或时延敏感度曲线分析评估方法中所述的encoder-decoder模型的输入序列的构造方法,在此不再赘述;

步骤n5,将所构造的k组encoder-decoder模型的输入序列输入到encoder-decoder模型中,输出对暖通系统输出功率的预测结果;

步骤n6,根据预测结果,剔除不符合约束条件的控制参数组合候选集;剔除规则具体为,每个控制参数都具有合理的控制范围,当预测结果显示该控制参数对应的参数值超过其合理的控制范围,即将该控制参数所在的控制参数组合候选集剔除;

步骤n7,在剩余符合约束条件的至少一组控制参数组合候选集中选择暖通系统预测输出功率最低的控制参数组合候选集作为暖通系统在当前时刻的下一个时间步的控制参数集并下发给暖通系统中的对应设备,暖通系统中的各设备根据下发的控制参数运行;

步骤n8,在当前时刻的下一个时间步内重复执行n1~n7,以对暖通系统全局的运行状态进行连续优化决策。

需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1