本发明涉及用电量预测,尤其涉及一种基于随机森林算法预测用户用电量方法及系统。
背景技术:
1、城市居民生活用电水平是衡量城市现代化程度的重要指标之一,居民生活用电量水平的高低主要受城市的地理位置、人口规模、经济发展水平、居民收入、居民家庭生活消费结构及家用电器的拥有量、气候条件、生活习惯等诸多因素的制约。针对积累的大量用户用电数据,目前尚未对用户展开应用分析,而开展家庭用电能耗分析的反馈对于引导用户节能工作有非常积极的意义,通过分析用户多维用电情况,结合多项用电指标,以及相关影响因素,可向社会居民发送有效的用电建议,包括用电构成、用电走势等。通过完善家庭用电能耗分析反馈系统可以促进用户节能意识的提高,帮助用户更好地理解自己的用电情况,认识到能源资源的珍贵性,激励其采取节约用电的措施,引导其改变不良的用电习惯,减少不必要的能源消耗,从而实现节能减排的目标。
技术实现思路
1、为了克服现有技术的不足,本发明提供了一种基于随机森林算法预测用户用电量方法,实现了通过基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测。
2、为了实现上述发明目的,本本技术第一方面提供了一种基于随机森林算法预测用户用电量方法,包括以下步骤:
3、s101、基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值;
4、s102、基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布;
5、s103、基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性;
6、s104、基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类;
7、s105、基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测;
8、进一步的,用户用电量数据信息包括用户类型、用户地理区域、用户用电量、用户气温变化,用户用电量包括工作日日用电量、节假日用电量、月用电量、季度用电量、年用电量。
9、进一步的,基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值包括以下步骤:
10、基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段;
11、基于用电峰值时段和用电谷值时段确定用电峰谷比,用电峰谷比=用电峰值时段/用电谷值时段;
12、基于用电峰谷比划分工作日日用电量用电峰谷比和季度用电量用电峰谷比;
13、采用标准差离群点检测算法对工作日日用电量用电峰谷比和季度用电量用电峰谷比进行寻找用电峰谷比异常值,标准差离群点检测算法的表达式如下所示:
14、
15、其中,zi为第i日的标准差分数,xi为i日的峰谷比,为峰谷比序列的平均值,σ为峰谷比序列的标准差,通过设置一个阈值来判断数据点是否为离群点。
16、进一步的,基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布包括以下步骤:
17、基于用户用电量数据信息,确定用户用电量阶梯;
18、基于用户用电量阶梯,确定用户数量最多的用电量阶梯、用户数量最少的用电量阶梯、不同的用户用电量阶梯所属地理区域及年度变化情况;
19、基于用户用电量阶梯确定用户用电量分布,并标记用电量高等级的用户用电量阶梯;
20、基于用户用电量分布确定用电量高等级的用户用电量阶梯所在的时间段,并确定不同用电量等级的用户用电量阶梯的月度用电量差异。
21、进一步的,基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性包括以下步骤:
22、基于皮尔逊相关系数构建用户用电量与夏季之间的关联性;皮尔逊相关系数的表达式如下所示:
23、
24、其中,x为气温,y为用电量,为气温序列均值,为用电量序列均值。
25、基于皮尔逊相关系数构建用户用电量与冬季之间的关联性;
26、基于皮尔逊相关系数构建用户用电量与春秋季之间的关联性;例如,春秋季用电与气温的相关分析:
27、基于用户用电量分别与夏季、冬季、春秋季之间的关联性,进行关联性等级判定。
28、进一步的,基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类包括以下步骤:
29、基于用户用电量数据信息随机选取k个初始聚类中心ci(1≤i≤k);
30、计算其余未选取的数据对象与聚类中心ci的欧式距离,确定离目标数据对象最近的聚类中心ci,并将数据对象分配到聚类中心ci所对应的簇中;
31、计算每个簇中数据对象的空间中数据对象与聚类中心间的欧式聚类,欧式聚类计算公式如下所示:
32、
33、其中,x为数据对象,ci为第i个聚类中心,m为数据对象的维度,xj,cij为x和ci的第j个属性值。
34、计算整个数据集的误差平方和,误差平方和计算公式如下所示:
35、
36、其中,sse的大小表示聚类结果的好坏,k为簇的个数。
37、进一步的,基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测包括以下步骤:
38、从用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性样本集中抽取训练集,抽取训练集的方式为每轮使用bootstraping方法抽取n个训练样集,进行k轮抽取,得到k个训练集;
39、每次使用一个训练集得到一个模型,k个训练集共得到k个模型;
40、将得到的k个模型采用投票的方式得到分类结果,并计算k个模型的均值作为最后的结果,以确定用户的未来预测用电量。
41、本技术第二方面提供了一种基于随机森林算法预测用户用电量系统,包括:
42、数据获取单元,用于获取用户用电量数据信息;
43、第一处理单元,用于基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值;
44、第二处理单元,用于基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布;
45、第三处理单元,用于基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性;
46、第四处理单元,用于基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类;
47、第五处理单元,用于基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测。
48、本发明的有益效果:实现了基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测。
49、通过基于用户用电量数据信息,确定用电峰值时段、用电谷值时段、用电平值时段,并寻找用电峰谷比异常值;基于用户用电量数据信息,确定用户用电量阶梯及用户用电量分布;基于皮尔逊相关系数对用户用电量数据信息,进行构建用户用电量与季节之间的关联性;基于k-均值聚类算法对用户用电量数据信息进行用电用户类型分类;基于用电峰值时段、用电谷值时段、用电平值时段、用户用电量阶梯及用户用电量分布、用户用电量与季节之间的关联性,通过随机森林算法进行用户用电量预测。
50、实现了通过在线监测和分析用户的用电数据,能够及时获取最新的用电信息,并根据每个用户的实际情况,进行深入挖掘和精细化分析,以揭示潜在的用电模式、习惯和需求。通过统计分析与机器学习算法的应用,可以对大量的用电数据进行智能化处理,捕捉到用电量与天气、日类型因素之间复杂关系进行用电量预测。在此基础上,针对每个用户的独特需求和偏好,提供个性化的用电建议和优化方案,以帮助用户合理安排用电,降低能源消耗,提高用电效率。实现对用户用电行为的实时监测,及时发现异常情况并进行预警,保障用电的安全和可靠性。
51、通过用户用电数据的分析,可以准确预测用户的用电需求和电能消耗变化趋势,从而提供更精准的用电预测和优化方案,降低能源消耗、节约用电成本。通过预测用户用电量,可以根据用电特征很好的将各类用户区别开来,以便优化电网管理和能源分配,提高电力供应的效率和可靠性。