一种基于大数据的建筑能耗主要影响因素分析方法

文档序号:10471609阅读:427来源:国知局
一种基于大数据的建筑能耗主要影响因素分析方法
【专利摘要】本发明公开了一种基于大数据的建筑能耗主要影响因素分析方法,首先,对建筑大数据进行搜集与抽取,构建能耗数据表;然后,对所获得的建筑大数据进行数据预处理,解决所获得的建筑大数据中存在的数据缺失、异常、空值等问题;进一步,在建筑大数据基础上,采用主成分分析方法对收集到的建筑大数据进行降维,减少影响因素数量且保留原始数据的主要信息,通过获取更加优越的新的综合因素来构造影响建筑能耗的核心因素,为降低建筑运行能耗、实现建筑节能管控提供依据。
【专利说明】
-种基于大数据的建筑能耗主要影响因素分析方法
技术领域
[0001] 本发明设及一种基于大数据的建筑能耗主要影响因素分析方法。
【背景技术】
[0002] 中国的能源主要消费于工业生产、交通运输W及建筑行业。我国建筑能耗的总量 逐年上升,在能源总消费量中所占的比例已从上世纪屯十年代末的10%,上升到27.45%, 逐渐接近Ξ成,到2014年为止,我国建筑能耗约占社会总能耗的33%。随着城市化进程的加 快和人民生活质量的改善,我国建筑耗能比例最终还将上升至35%左右。建筑能耗所占社 会总能耗的比重已非常大,成为制约我国经济发展的一大问题。
[0003] 影响建筑能耗的可能因素有很多,比如建筑类型、建筑用途、建筑面积、建筑长宽 比、建筑层高、墙体厚度、墙窗比、室内溫度、室内湿度、人员密度、照明时间、室外环境、上班 周期、建筑电能消耗或/和建筑用热量等等。如何从大量因素中确定影响建筑能耗的主要因 素一直W来是研究人员与技术人员关屯、的问题。但由于因素众多、条件各异,该问题一直W 来也未能得到完美解决。

【发明内容】

[0004] 本发明为了解决上述问题,提出了一种基于大数据的建筑能耗主要影响因素分析 方法,本方法对建筑大数据进行捜集与抽取,基于大数据分析,对建筑能耗的主要影响因素 进行挖掘,获取更加优越的新的综合因素来构造影响建筑能耗的核屯、因素,为降低建筑运 行能耗、实现建筑节能管控提供依据。
[0005] 为了实现上述目的,本发明采用如下技术方案:
[0006] -种基于大数据的建筑能耗主要影响因素分析方法,包括W下步骤:
[0007] (1)对建筑大数据进行捜集与抽取,采集建筑用基本信息,确定所有影响因素,构 建建筑能耗数据表;
[000引(2)对建筑大数据进行预处理,填充缺失信息值、消除噪声值,将建筑大数据进行 规范化,确定建筑能耗影响因素集合;
[0009] (3)对建筑大数据进行零均值化处理、方差归一化,形成标准化矩阵,求取建筑能 耗影响因素的特征协方差矩阵;
[0010] (4)求取建筑能耗影响因素特征协方差矩阵的特征值,根据其计算各个影响因素 的贡献率和累计贡献率;
[0011] (5)根据累计贡献率确定主要影响因素,构建主要影响因素决策阵,W贡献率确认 各个主要影响因素的权重系数,线性加权求和确定核屯、因素。
[0012] 所述步骤(1)中,建筑用基本信息包括设计数据、能耗数据、环境数据、人员数据、 设备数据或/和监控数据。
[0013] 所述步骤(1)中,建筑能耗数据表的影响因素包括抽取建筑类型、建筑用途、建筑 面积、建筑长宽比、建筑层高、墙体厚度、墙窗比、室内溫度、室内湿度、人员密度、照明时间、 室外环境、上班周期、建筑电能消耗或/和建筑用热量,每一类影响因素包括多个样本。
[0014] 所述步骤(2)中,对建筑大数据的缺失值进行填充,若存在数据为零,那么判定该 数据为缺失值,使用均值填充法对该位置的数据进行缺失值的填充操作。
[0015] 所述步骤(2)中,采用分箱方法对含噪声的建筑大数据进行光滑处理,对任意的数 据d,取其前k个相邻数据W及其后的k个相邻数据,取运些数据的均值,利用均值替代该数 据d。
[0016] 所述步骤(2)中,采用最小-最大规范化方法实现对建筑数据的规范化,使建筑大 数据落入设定的区间中,使建筑能耗影响因素映射到该区间内。
[0017] 所述步骤(4)中,求取建筑能耗影响因素特征协方差矩阵的特征值,将其按大小顺 序排列,并求出每个特征值对应的特征向量,形成归一化后的单位向量。
[0018] 所述步骤(4)中,各个建筑能耗印象因素的贡献率为每个建筑耗能影响因素的特 征值与所有特征值之和的比值,累计贡献率定义为前k个建筑耗能影响因素的特征值之和 在全部特征值总和中所占的比重。
[0019] 进一步的,所述步骤(4)中,设定累计贡献率阔值,若计算的前k个建筑耗能影响因 素的累计贡献率大于阔值,则前k个建筑耗能影响因素为主要影响因素。
[0020] 所述步骤(5)中,具体方法为:求取建筑数据样本在单位特征向量上的投影,得到 主要影响因素决策矩阵,用各个建筑能耗主要影响因素的贡献率作为权重系数,线性加权 求和得到建筑能耗主要影响因素的表达式。
[0021] 本发明的有益效果为:
[0022] (1)本发明对所获得的建筑大数据进行数据预处理,解决所获得的建筑大数据中 存在的数据缺失、异常、空值等问题;
[0023] (2)采用主成分分析方法对收集到的建筑大数据进行降维,减少影响因素数量且 保留原始数据的主要信息,通过获取更加优越的新的综合因素来构造影响建筑能耗的核屯、 因素,为降低建筑运行能耗、实现建筑节能管控提供依据。
【附图说明】
[0024] 图1是本发明基于大数据的建筑能耗主要影响因素挖掘流程图。
【具体实施方式】:
[0025] 下面结合附图与实施例对本发明作进一步说明。
[0026] 随着物联网的发展,我们获得了海量的关于建筑的各类设计数据、传感数据、操作 数据、环境数据、能耗数据,且数据量飞速增长,结构化、半结构化和非结构化数据共存,使 得建筑领域也进入了 "大数据时代"。通过对建筑大数据进行分析挖掘,可W获得有价值的 知识,为获得影响建筑能耗的主要因素提供有效途径。针对上述问题,本发明提出了一种基 于大数据的建筑能耗主要影响因素的挖掘方法,能够为理清影响建筑能耗的主要因素提供 支持,为降低建筑运行能耗、提升建筑节能及管理水平提供有价值的工具。
[0027] 如图1所示,本发明提出了一种基于大数据的建筑能耗主要影响因素挖掘方法。首 先,对建筑大数据进行捜集与抽取,构建能耗数据表;然后,对所获得的建筑大数据进行数 据预处理,解决所获得的建筑大数据中存在的数据缺失、异常、空值等问题;进一步,在建筑 大数据基础上,采用主成分分析方法对收集到的建筑大数据进行降维,减少影响因素数量 且保留原始数据的主要信息,通过获取更加优越的新的综合因素来构造影响建筑能耗的核 屯、因素,为降低建筑运行能耗、实现建筑节能管控提供依据。
[002引具体包括:
[0029] 步骤一:对建筑大数据进行捜集与抽取,构建建筑能耗数据表
[0030] 目前,我们获得了关于建筑运行的各类数据,包括设计数据、能耗数据、环境数据、 人员数据、设备数据、监控数据等等。运些数据里面既包括结构化数据,也包括半结构化数 据及非结构化数据。有些数据,比如安全监控视频数据,在能耗影响因素分析方面没有价 值。因此,首先进行建筑大数据的捜集与抽取工作,主要抽取建筑类型、建筑用途、建筑面 积、建筑长宽比、建筑层高、墙体厚度、墙窗比、室内溫度、室内湿度、人员密度、照明时间、室 外环境、上班周期、建筑电能消耗、建筑用热量等数据,构建表1所示的数据表。为方便起见, 假定数据表有η个列,每个列对应一种可能影响能耗的因素,数据表中有N个行,每行对应相 应的记录数据。
[0031] 表1建筑大数据表
[0032]
[0033] 步骤二:建筑大数据的预处理
[0034] 对收集到的建筑大数据进行数据预处理,解决所获得的建筑大数据中存在的数据 缺失、异常、空值等问题。具体步骤如下:
[0035] I、建筑大数据中缺失值的填充:若存在数据为零,那么判定该数据为缺失值,应该 对该位置的数据进行缺失值的填充操作。建筑大数据缺失值填充选择的方法为均值填充 法:如果数据dij = 0(l y含N,1 y如),那么令
然后用μ代替数据dij。
[0036] II、建筑大数据中噪声的光滑:为克服噪声数据对建筑能耗影响因素分析的影响, 采用分箱方法对含噪声的建筑大数据进行光滑,具体步骤如下:
[0037] 对任意的数据du,取其前k个"邻居"数据d(i-k川…,d(i-i)j,W及其后k个"邻居"数 据d(i + l)j,…,d(i+k)j。令
然后用化代替建筑数据cUj的值。
[0038] III、建筑大数据的规范化:将建筑大数据进行规范化,使之落入一个小的特定区 间防中。采用最小-最大规范化方法实现对建筑数据的规范化,具体步骤如 下:
[0039] 假定Wj,和Afj,为建筑能耗影响因素 dj的最小值与最大值,最小-最大规范化通过 计算
[0040] i
[0041] 将建筑能耗影响因素 d冲的数据dij映射到区间["η"",,' -"w'W,, 1中的数据dij'中 去。
[0042] 步骤建筑大数据的主要影响因素挖掘
[0043] 对预处理后的建筑大数据采用主成分分析法进行挖掘来获得影响建筑能耗的核 屯、因素。具体步骤如下:
[0044] I、对建筑大数据进行零均值化处理并对数据作方差归一化。具体步骤如下:
[0045] 4
然后我们把建筑耗能影响因素 d冲的所有建筑数据dij(l y <N) 都用di广μ.冰代替。令然后把每一个数据dij(l y如)用dij/o.j代 替。
[0046] 原始的建筑大数据经过处理后,得到关于建筑大数据的标准化矩阵Z:
[0047]
[0048] 根据经过处理后得到的建筑大数据标准化矩阵Z求取建筑能耗影响因素的特征协 方差矩阵,求得协方差矩阵为:
[0049]
[0050] 其中 cov(z.s,z.t)=E(z.sZ.t)-E(z.s化(z.t)
[0051] 求取建筑能耗影响因素特征协方差矩阵的特征值λι,···,λη,并使其按从大到小顺 序排列,即λι > λ2 >…> λη > 0,并求出每个特征值对应的特征向量ζ?,…,ζη,其中ζ?,…,ζη 为归一化后的单位向量。
[0052] 根据建筑能耗影响因素特征协方差矩阵的特征值计算各影响因素的贡献率与累 计贡献率。其中,第j个建筑耗能影响因素贡献率为
。建筑能耗影响因素累计 贡献率定义为前k个主要建筑耗能影响因素的特征值之和在全部特征值总和中所占的比 重,即
。该比值越大,说明前k个建筑耗能影响因素越能作为综合代表。
[0053] 根据建筑能耗主要影响因素累计贡献率确定前k个主要影响因素。取累计贡献率
的k值所对应的第1、第2···第k化含η)个主要影响因素。
[0054] 求出Zi= (Zii,Zi2,…,Zin)T, i = l,2,…,Ν的k个建筑大数据主要影响因素分量Uij = ZiTCjJ = l,2,-,,k,得到关于建筑大数据的主要影响因素决策阵U:
[ο化5]
[0056] 其中m(i = l,2,…,N)为第i个建筑大数据样本的量,它的第j(j = l,2,…,k)个分 量UU是建筑数据样本Zi在单位特征向量上的投影。
[0057] 用各个建筑能耗主要影响因素的贡献率作为权重系数,线性加权求和得到建筑能 耗主要影响因素的表达式:
[0化引
[0059]上述虽然结合附图对本发明的【具体实施方式】进行了描述,但并非对本发明保护范 围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不 需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围W内。
【主权项】
1. 一种基于大数据的建筑能耗主要影响因素分析方法,其特征是:包括以下步骤: (1) 对建筑大数据进行搜集与抽取,采集建筑用基本信息,确定所有影响因素,构建建 筑能耗数据表; (2) 对建筑大数据进行预处理,填充缺失信息值、消除噪声值,将建筑大数据进行规范 化,确定建筑能耗影响因素集合; (3) 对建筑大数据进行零均值化处理、方差归一化,形成标准化矩阵,求取建筑能耗影 响因素的特征协方差矩阵; (4) 求取建筑能耗影响因素特征协方差矩阵的特征值,根据其计算各个影响因素的贡 献率和累计贡献率; (5) 根据累计贡献率确定主要影响因素,构建主要影响因素决策阵,以贡献率确认各个 主要影响因素的权重系数,线性加权求和确定核心因素。2. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(1)中,建筑用基本信息包括设计数据、能耗数据、环境数据、人员数据、设备数据 或/和监控数据。3. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(1)中,建筑能耗数据表的影响因素包括抽取建筑类型、建筑用途、建筑面积、建筑 长宽比、建筑层高、墙体厚度、墙窗比、室内温度、室内湿度、人员密度、照明时间、室外环境、 上班周期、建筑电能消耗或/和建筑用热量,每一类影响因素包括多个样本。4. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(2)中,对建筑大数据的缺失值进行填充,若存在数据为零,那么判定该数据为缺 失值,使用均值填充法对该位置的数据进行缺失值的填充操作。5. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(2)中,采用分箱方法对含噪声的建筑大数据进行光滑处理,对任意的数据d,取其 前k个相邻数据以及其后的k个相邻数据,取这些数据的均值,利用均值替代该数据d。6. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(2)中,采用最小-最大规范化方法实现对建筑数据的规范化,使建筑大数据落入 设定的区间中,使建筑能耗影响因素映射到该区间内。7. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(4)中,求取建筑能耗影响因素特征协方差矩阵的特征值,将其按从大到小顺序排 列,并求出每个特征值对应的特征向量,形成归一化后的单位向量。8. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(4)中,各个建筑能耗印象因素的贡献率为每个建筑耗能影响因素的特征值与所 有特征值之和的比值,累计贡献率定义为前k个建筑耗能影响因素的特征值之和在全部特 征值总和中所占的比重。9. 如权利要求8所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征是: 所述步骤(4)中,设定累计贡献率阈值,若计算的前k个建筑耗能影响因素的累计贡献率大 于阈值,则前k个建筑耗能影响因素为主要影响因素。10. 如权利要求1所述的一种基于大数据的建筑能耗主要影响因素分析方法,其特征 是:所述步骤(5)中,具体方法为:求取建筑数据样本在单位特征向量上的投影,得到主要影 响因素决策矩阵,用各个建筑能耗主要影响因素的贡献率作为权重系数,线性加权求和得 到建筑能耗主要影响因素的表达式。
【文档编号】G06Q10/06GK105825323SQ201610136375
【公开日】2016年8月3日
【申请日】2016年3月10日
【发明人】李成栋, 丁子祥, 王丽, 尚芳, 张桂青
【申请人】山东建筑大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1