一种基于数据挖掘的照明插座能耗隐性异常数据的识别方法与流程

文档序号:16918834发布日期:2019-02-19 19:11阅读:285来源:国知局
一种基于数据挖掘的照明插座能耗隐性异常数据的识别方法与流程

本发明涉及一种数据处理方法,具体涉及一种基于数据挖掘的照明和插座能耗隐性异常数据的识别方法,属于建筑能耗监测平台数据处理技术领域。



背景技术:

近年来,建立公共建筑能耗监测平台,实现建筑能耗分项计量是公共建筑能源监管体系建设的一项重要内容。目前,我国许多省市都建立了不同规模的建筑能耗监测平台,并且积累了丰富的数据。然而由于一些技术方面的障碍,导致建筑监测数据整体质量不高,出现数据缺失、数据突变等数据异常问题,通过调研分析,既有建筑能耗监测平台的异常数据比例普遍高达20%,因此能耗监测数据与建筑真实能耗相差甚远,导致这些大量的能耗数据无法得到充分利用。随着我国绿色建筑的不断发展,人们对建筑能耗数据采集不仅种类越来越多、数据量越来越大,而且对数据质量要求越来越高。为了提高建筑能耗监测平台的数据质量,近年来,国内外许多科研人员聚焦于能耗监测平台数据存在的问题,采用数据挖掘技术、聚类分析等方法,解决和修正平台缺失或异常数据。发明专利公开了一种基于数据挖掘的公共建筑能耗监管平台数据处理方法(专利申请号为201410482593.x),其技术特征包括问题数据初步识别、根据历史数据建立用能模式特征参数集、问题数据精细识别和问题数据智能补充四个方面,通过对历史能耗数据按照不同用能模式分类,建立建筑用能耗模式特征参数集,实现对能耗监管平台问题数据的分类识别、清洗、智能补充的一体化处理。该方法可以实现对缺失数据和突变数据的识别,但对于一些用能异常,且能耗数据满足阈值选取要求的监测数据无法识别。建筑用电能耗一般分为照明插座能耗、暖通空调能耗、动力设备能耗和特殊用电能耗四项。本专利针对照明插座能耗的用电特征,采用大数据的分析方法,提出了一种基于数据挖掘的照明插座能耗隐性异常数据的识别方法,以提高建筑能耗监测平台的数据质量。



技术实现要素:

本发明要解决的技术问题是提供一种能够有效提高公共建筑能耗监管平台数据质量的基于数据挖掘的照明插座能耗隐性异常数据的识别方法。

本发明的技术方案如下:

一种基于数据挖掘的照明插座能耗隐性异常数据的识别方法,步骤如下:

s1、根据历史数据建立用能模式:按照能耗数据发生时刻所在天是否是节假日将照明和插座能耗数据精细分为工作日、节假日等用能模式;

s2、建立用电特征数据库:针对任意一种用能模式,将累计能耗转换为单位时间能耗,并按天为单位,将单位时间能耗按单位时间步长依次存储,每一天的能耗数据为一条用电特征线;

单位时间能耗计算公式为:

ej=sj-sj-1式(1)

其中,ej为单位时间能耗,sj为第j时刻计量表累计示数,sj-1为第j-1时刻计量表累计示数;

s3、显性异常数据识别:基于聚类大数据分析方法识别出任意用能模式的能耗数据中由于计量或传输过程产生的数据缺失、数据突变等显性异常数据;

s4、隐性异常数据识别:基于历史用电特征线,判断新用电特征线与相近工况历史数据用电特征线是否一致,若一致,则能耗数据正常,若不一致,则能耗数据隐性异常;

具体识别步骤如下:

s41、历史数据用电特征线斜率计算

假设一共有m条历史数据用电特征线,对于任一条历史数据用电特征线i,第j与第j+1时刻的用电量分别为ei,j和ei,j+1,则第j至第j+1时刻内用电特征线的斜率为ki,j的计算公式为:

其中δti为单位时间长度;

s42、历史数据用电特征线的总体变化趋势

假设第j至第j+1时刻内共n(0<n<m)条历史数据用电特征线斜率ki,j(0≤i≤n)大于0,则该时刻内用电量增加的用电特征线占比为p=n/m(%),相应的用电量减少的用电特征线占比为q=1-p,若p>q则说明第j至第j+1时刻内用电量总体呈增长趋势,反之为电量总体呈减少趋势;

s43、采用步骤s41的方法计算该时刻新数据用电特征线斜率kj

s44、利用新数据用电特征线是否与历史数据用电特征线一致识别隐性异常错误数据

如果kj>0且该时间段内p>q或kj<0且该时间段内p<q,则该时间段内新的用电特征线与历史数据趋势一致;在24小时内,统计曲线变化趋势一致的时间段的个数a,若a/24>90%,则新的用电特征正常,否则存在隐性异常错误数据。

与现有技术相比,本发明的有益效果是提供了一种基于数据挖掘的照明插座能耗隐性异常数据的识别方法,极大地提升建筑能耗数据质量。

附图说明

图1为本发明显性异常数据识别流程图。

图2为累计能耗转化为单位时间能耗示意图。

图3为隐性异常数据识别工作流程图。

图4为用电特征线斜率计算示意图。

具体实施方式

以下结合发明内容和说明书附图详细说明本发明的具体实施方式。

参照附图1,本发明的一种基于数据挖掘的照明插座能耗隐性异常数据的识别方法,其包括以下步骤:

s1、根据历史数据建立用能模式,按照能耗数据发生时刻所在天是否是节假日将照明和插座能耗数据精细分为工作日、节假日等用能模式;

s2、参照附图2,建立用电特征数据库,针对任意一种用能模式将累计能耗数据转换为单位时间能耗,并按天为单位,将单位时间能耗按单位时间步长依次存储,每一天的能耗数据为一条用电特征线;

单位时间能耗计算公式为:

ej=sj-sj-1式(1)

其中,ej为单位时间能耗,sj为第j时刻计量表累计示数,sj-1为第j-1时刻计量表累计示数。

s3、显性异常数据识别,基于k-keans、密度聚类等大数据分析方法识别出能耗数据中由于计量或传输过程中产生的数据缺失、数据突变等显性异常数据;

s4、隐性异常数据识别,基于历史用电特征线,判断新用电特征线与相近工况历史数据用电特征线是否一致,若一致,则能耗数据正常,若不一致,则能耗数据隐性异常。

参照附图3,隐性异常数据识别具体包括以下步骤:

s41、历史数据用电特征线斜率计算;

参照附图4,假设一共有m条历史数据用电特征线,对于任一条历史数据用电特征线i,第j与第j+1时刻的用电量分别为ei,j、ei,j+1,则第j至第j+1时刻内用电折线的斜率为ki,j的计算公式为:

其中δti为单位时间长度。

s42、历史数据用电特征线的总体变化趋势描述;

假设第j至第j+1时刻内共n(0<n<m)条历史数据用电特征线斜率ki,j(0≤i≤n)大于0,则该时刻内用电量增加的用电特征线占比为p=n/m(%),相应的用电量减少的用电特征线占比为q=1-p,若p>q则说明第j至第j+1时刻内用电量总体呈增长趋势,反之为电量总体呈减少趋势。

s43、采用s41的方法计算该时刻新数据用电特征线斜率kj;

s44、利用新数据用电特征线是否与历史数据用电特征线一致识别隐性异常错误数据。

如果kj>0,且该时间段内p>q,或者,kj<0,且该时间段内p<q,则该时间段内新的用电特征线与历史数据趋势一致。在24小时内,统计曲线变化趋势一致的时间段的个数a,若a/24>90%,则新的用电特征正常,否则存在隐性异常错误数据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1