一种基于历史数据的公共建筑用电模式识别模型建立方法与流程

文档序号:16135606发布日期:2018-12-01 00:55阅读:406来源:国知局

本发明涉及一种基于历史数据的公共建筑用电模式识别模型建立方法。

背景技术

在经济全球化、全球变暖的大背景下,日益严重的能源形势得到了世界各地的高度重视。中国是世界上最大的发展中国家,近年来急剧增长的用电与资源相对短缺之间的矛盾严重制约了国家的发展。能源是经济社会发展的原动力,为了推动节能技术的进步,提高能源的利用效率,促进能源节约和优化用能结构,建设“资源节约型、环境友好型”两型社会,国家和各级省市政府相继出台了多项节能政策、法规,逐步形成具有中国特色的节能长效机制和管理体制。

在线监测企业的水、电、油、气、热等能源的生产和使用情况,准确把握同一行业单位产品的平均用电水平,是政府科学地制定行业节能减排目标的重要依据。通过对企业及公用建筑等用能单位进行用电监测和能效评估,既可以帮助用能单位查找出自身耗能方面的缺口,让其在节能减排中有的放矢,不为了达到国家的节能目标而地拉闸限电,又为政府管理部门核定节能效益提供科学依据。

工业用户及公共建筑的节能评估是一项复杂的系统工程,涉及国家节能相关法律、法规,行业节能设计标准,用能工艺、产品、设备选用,节能技术的适宜性等各个方面。除了一系列工程问题、技术问题之外,还包含管理决策等问题。在各个系统的节能评估和审查过程中,需要采用科学的评估方法进行分析。现行的主要评估方法包括标准对照法,类比工程分析法,专家经验判断法和单位面积指标法等。上述方法大都主观性较强,同时更侧重于从用能系统规划建设的角度进行分析,与其实际运行情况关联不大。目前应用的节能评估平台大都处于数据采集和统计展示的初级阶段,针对实时用能信息进行挖掘算法的研究工作开展不多。

随着我国节能评估平台的建设推广,将会收集大量的用电数据,如何快速有效地从中分析挖掘出有价值的信息,建立用电模式识别的模型,进而发现用能单位的节能潜力,提出有效节能建议,对于提高能源资源利用效率,保障社会的可持续发展具有重要意义。

随着大数据时代的到来和我国节能评估平台的建设推广,将会有海量的用电数据,方便利用数据挖掘技术,建立用电模式识别的模型,其针对性地提出节能方案。深入开展高耗能企业电力能效监测和评估工作,一方面管理部门可以完善电能管理体系,充分挖掘节能潜力,采取有针对性的节能对策和措施,推动企业的节能减排工作。另一方面企业也可以深入了解自身存在的用电问题,针对这些问题实施具体节能措施,进一步根据成本效益分析,做出未来的用能行为规划,以达到企业和社会双赢目标。



技术实现要素:

本发明的目的是为了克服现有技术的不足,提供一种基于历史数据的公共建筑用电模式识别模型建立方法,其对用户的用电模式进行聚类分析,对用户的用电模式进行分类,确定不同用电模式与其他用电模式进行区分的属性以及属性值,建立用电模式的识别模型,为后续对用户的用电异常进监测提供方便。

实现上述目的的一种技术方案是:一种基于历史数据的公共建筑用电模式识别模型建立方法,包括下列步骤:

s1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];

s2,对所有特征向量[x,y]进行k-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;

s3,根据基于cart算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型。

进一步的,s2步骤中,先对所有特征向量[x,y]进行规范化,得到规范化特征向量z=[zx,zy],再对规范化特征向量z=[zx,zy]进行k-means聚类分析,规范化的公式为:

μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差。

再进一步的,s2步骤中对规范化特征向量z=[zx,zy]进行k-means聚类分析的具体步骤为:

s21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;

s22,选取n个规范化特征向量,记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;

s23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应簇,并将每个簇的几何中心记为新聚类中心ui(j+1);

s24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差ej,判定平方误差ej是否在设定值范围内;

s25,若平方误差ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;

s26,若平方误差ej不在设定值范围内,则令j=j+1,并返回步骤s23。

更进一步的,s3步骤中对由规范化特征向量zt,其中t=1,2,……,n,所构成的样本集s,以gain_gini的值最小的属性与属性值作为最优分裂属性以及最优分裂属性值。

还要进一步的,对于样本集s,

其中oi表示分类结果中第i个用电模式出现的概率;

根据用户历史小时最高用电负荷将样本集s划分成两部分,gain_gini计算如下:

最优二分方案为

还要进一步的,对于样本集s,

其中oi表示分类结果中第i个用电模式出现的概率;

根据用户历史小时平均用电负荷将样本集s划分成两部分,gain_gini计算如下:

最优二分方案为

采用了本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法,包括下列步骤:s1,对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代,并根据用户历史小时最高用电负荷x和用户历史小时平均用电负荷y建立特征向量[x,y],每个用户每个小时对应一个特征向量[x,y];s2,对所有特征向量[x,y]进行k-means聚类分析,找到每个特征向量对应的聚类中心,每个聚类中心对应一个用电模式;s3,根据基于cart算法的决策树,找到每个用电模式与其它用电模式的最优分裂属性以及最优分裂属性值,建立用电模式识别模型。其技术效果是:建立了建筑用电模式识别的模型,方便对建筑用电进行实时监控,使用方式较为简便,在工程实际中,具有广泛的适用性。

附图说明

图1为本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法的流程图。

具体实施方式

请参阅图1,本发明的发明人为了能更好地对本发明的技术方案进行理解,下面通过具体地实施例,并结合附图进行详细地说明:

本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法包括下列步骤:

s1,数据预处理步骤,包括:

错误数据处理步骤:

对历史用电数据库中的缺失数据和超出阈值范围的数据用对应字段平均值进行替代。

数据规范化步骤:

从历史用电数据库中提取特征向量[x,y],其中,x代表用户历史小时最高用电负荷,y代表用户历史小时平均用电负荷。每个用户每个小时都生成一个对应的特征向量[x,y]。

对每个特征向量进行规范化,得到规范化特征向量z=[zx,zy],规范化的公式为:

其中z=[zx,zy]代表规范化特征向量,μ(x)和μ(y)分别代表任一历史采集时间点,所有用户的用户历史小时最高用电负荷的平均值和所有用户的用户历史小时平均用电负荷的平均值,σ(x)和σ(y)分别代表该历史采集时间点,所有用户的用户历史小时最高用电负荷的标准差和所有用户的用户历史小时平均用电负荷的标准差。

s2,用电数据聚类分析步骤:

s21,在以用户小时最高用电负荷为横坐标,用户小时平均用电负荷为纵坐标的直角坐标系中,拾取k个聚类中心ui(j),其中j=0,i=1,2,……,k;

s22,选取n个规范化特征向量z=[zx,zy],记为zt,其中t=1,2,……,n,计算每个zt到每个聚类中心ui(j)的欧式距离;

s23,找出关于每个zt最小欧式距离的聚类中心ui(j),zt进入该聚类中心所对应的簇,并将每个簇的几何中心记为新聚类中心ui(j+1);

s24,计算所有zt关于与其所在簇对应的新聚类中心ui(j+1)的欧式距离的平方误差ej,判定平方误差ej是否在设定值范围内;

s25,若平方误差ej在设定值范围内,则输出当前所有的聚类中心ui(j+1),以及对应簇内的所有规范化特征向量zt,每个聚类中心作为一个用电模式;

s26,若平方误差ej不在设定值范围内,则令j=j+1,并返回步骤s23。

s3,建立用电模式识别模型:

根据每个规范化特征向量zt以及每个规范化特征向量zt所对应的时间,基于cart算法的决策树进行分类。cart分类树选择gain_gini的值最小的属性与属性值作为每个用电模式与其它用电模式进行最优分裂属性以及最优分裂属性值。gain_gini的值越小,说明二分后子样本的“纯净度”越高,即说明选择该属性值作为分裂属性值的效果越好。

对于由规范化特征向量zt所构成的样本集s,gini计算式如下:

oi表示分类结果中第i个用电模式出现的概率。

对于含有n个样本的样本集s,根据用户历史小时最高用电负荷将样本集s划分成两部分,则划分成两部分之后,gain_gini计算如下:

或对于含有n个样本的样本集s,根据用户历史小时平均用电负荷将样本集s划分成两部分,则划分成两部分之后,gain_gini计算如下:

对于样本集s,计算所有属性的最优二分方案并选取其中最小值,作为样本集s的最优二分方案:

即:或者

即为样本集s的最优分裂属性以及最优分裂属性值。

本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法基于历史用电数据,对用户的用电模式进行聚类分析,对用户的用电模式进行分类,确定不同用电模式与其他用电模式进行区分的属性以及属性值,为后续对用户的用电异常进监测提供方便。

本发明的一种基于历史数据的公共建筑用电模式识别模型建立方法具有如下有益效果:

建立了建筑用电模式识别的基础,方便对建筑用电进行实时监控,使用方式较为简便,在工程实际中,具有广泛的适用性。

本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1